按下面顺序执行。默认全中文输出,除非用户明确要求英文。
扫描、排序、候选筛选类任务,先运行:
py -3 scripts/build_stock_dataset.py --input data/candidates.csv
优先读取:
data/output/stock_dataset.csvdata/output/manual_review_queue.csvdata/output/stock_dataset_preview.md详细规则读 references/data-pipeline.md。
脚本会先自动补:
只有在以下情况才手动浏览网页:
manual_review_queue.csv 提示有关键字段缺失不要把“自动抓取缺一个字段”升级成“整只票全量手查”。
先判断任务属于哪一类:
低估值高增长筛选候选排序单股分析政策映射风险排雷用户没说清时,默认用 低估值高增长筛选。
候选范围按这个优先级:
data/candidates.csv如果用户只给主题,你可以先改 data/candidates.csv 再跑脚本。
不要把种子池当硬边界。用户说“全市场里找机会”“除了池子里还有谁”,就扩展候选,再重跑数据层。
stock_dataset.csv综合分 排序5-10 只的 估值标签 / 成长标签 / 数据完整度 / 结论置信度如果 manual_review_queue.csv 非空:
data/manual_overrides.csv如果催化/风险字段不为空,但内容明显过泛,也允许直接手工覆盖这两个字段再重跑。
默认只对前 3-5 只展开额外说明,不要给每只股票写小作文。
默认用这五个维度:
估值便宜度长期增长兑现质量催化剂风险调整脚本已经把它们落成:
估值分增长分兑现质量分催化分风险分综合分详细解释读 references/analysis-framework.md。
默认先给表,再给结论。
## 筛选假设
- 范围:
- 周期:
- 数据日期:
- 低估值定义:
## 候选排序
| 排名 | 股票 | 细分方向 | 当前估值 | 估值判断 | 长期增长引擎 | 核心催化 | 核心矛盾 | 主要风险 | 结论 |
|---|---|---|---|---|---|---|---|---|---|
## 重点结论
- 谁最符合“低估值 + 高成长”
- 谁成长很好但估值不便宜
- 谁估值不高但成长证据不足
- 谁当前应回避
写表时优先使用 stock_dataset.csv 里的字段,不要重复抄原始数字。把数字压缩成判断:
当前估值:写 PE / PB / PS + 日期估值判断:一句话判断相对贵/便宜长期增长引擎:只写最强 1-2 条核心催化:优先最近 6-18 个月内的明确事件核心矛盾:解释为什么市场还没给更高估值结论:只用 优先 / 跟踪 / 观察 / 回避## 一句话结论
## 事实快照
| 项目 | 关键信息 |
|---|---|
| 当前估值 | |
| 近年增长 | |
| 最近催化 | |
| 主要风险 | |
## 核心逻辑
## 估值与成长是否匹配
## 未来 1-3 年重估路径
## 失效条件
始终遵守:
3-5 只数据完整度 低或 结论置信度 低,必须明确降级结论事实 和 推断每个候选至少给出这些标签中的大部分:
估值标签:低估 / 合理 / 偏贵成长标签:高成长 / 稳增长 / 弱增长催化标签:强 / 中 / 弱风险标签:低 / 中 / 高研究优先级:优先 / 跟踪 / 观察 / 回避数据完整度:高 / 中 / 低结论置信度:高 / 中 / 低如果需要手工查:
manual_review_queue.csvdata/manual_overrides.csv不要直接绕开数据层。
按需读取:
始终追加:
仅供研究参考,不构成个性化投资建议。
共 3 个版本