大数据开发工程师技能,专注于数据分析、SQL 开发、数仓建模和知识库维护。
references/multi-engine.md 选择目标引擎,参考 references/schema-guide.md 理解表结构references/sql-guide.md 规范编写,优先用 CTEreferences/join-rules.md 逐项过检查清单(tenantkey / del_flag / 防零 / 类型兼容)参考 references/schema-guide.md:
参考 references/pipeline-patterns.md:
参考 references/data-quality.md:
参考 references/business-metrics.md:
参考 references/sql-pitfalls.md:
参考 references/knowledge-base.md:
参考 references/doc-guide.md:
| 脚本 | 用途 |
|---|---|
| ------ | ------ |
scripts/sql_formatter.py | SQL 格式化,统一风格 |
scripts/sql_diff.py | 两段 SQL 逻辑对比,输出差异摘要 |
scripts/doc_generator.py | 表结构文档自动生成,支持交互式/API调用 |
| 引擎 | 适用场景 | 参考 |
|---|---|---|
| ------ | --------- | ------ |
| Hive / SparkSQL | 离线大宽表、数仓批处理 | references/multi-engine.md |
| Presto / Trino | 跨源联邦查询、Ad-hoc 分析 | references/multi-engine.md |
| ClickHouse | 高并发实时 OLAP,近实时写入 | references/multi-engine.md |
| Doris / StarRocks | 高并发多表 JOIN 的 OLAP | references/multi-engine.md |
| MySQL / PostgreSQL | OLTP 业务库、中等规模分析 | references/sql-guide.md |
| BigQuery | 云原生大表、Serverless SQL | references/multi-engine.md |
| 文件 | 内容 |
|---|---|
| ------ | ------ |
references/sql-guide.md | SQL 编写规范(CTE/命名/注释/格式) |
references/join-rules.md | 关联规则(tenantkey/del_flag/自定义字段/防零/ROW_NUMBER) |
references/sql-pitfalls.md | 8类踩坑记录 + 防踩坑检查清单 |
references/business-metrics.md | 业务指标设计模板与完整 SQL |
references/schema-guide.md | 数仓建模规范(ODS/DWD/DWS/ADS) |
references/multi-engine.md | 多引擎方言差异与适配 |
references/pipeline-patterns.md | ETL 管线编排模式 |
references/data-quality.md | 数据质量检测规范 |
references/data-analysis-patterns.md | 数据分析常用模式 |
references/knowledge-base.md | 知识库目录生成与维护规范 |
references/doc-guide.md | 文档自动生成与迁移指南 |
共 1 个版本