跳转至

Project Closeout Checklist (daily-report)

1) “运行链路”一眼可懂

  • 入口脚本:scripts/run-pipeline.sh
  • ingest:只采集入库(已改为 ingest-only,不发布)
  • report:生成 data/dailyReport/industry_radar_YYYY-MM-DD.md 并调用 scripts/add-report.js 发布到网页端
  • 发布链路:scripts/add-report.js
  • 生成 web(web/generate.js
  • 执行 hooks/post_gen.sh
  • git add/commit/push

2) 调度口径(必须与需求一致)

  • 每小时整点 ingest:见 crontab.txt
  • 每天 23:15 生成并发布“当天”日报:见 crontab.txt + pipeline 默认日期逻辑(today)

3) 配置入口

  • RSS 列表:configs/rss_feeds.yml
  • Watchlist/关键词:configs/watchlist.yml
  • LLM prompts:configs/prompts.yml
  • Python 依赖:requirements.txt(建议固定在 .venv 里安装)

4) 文档归档位置

  • 过程/说明文档:docs/process/
  • 测试/验收文档:docs/tests/
  • 本地运行日志(默认不入库):docs/logs/(已在 .gitignore 忽略 *.log

5) 清理策略(建议)

  • 不提交:.venv/logs/docs/logs/*.log、以及本地实验脚本/临时输出(除非你要保留)
  • 保留提交:pipeline/configs/scripts/hooks/web/crontab.txt、核心说明文档

6) 收尾确认(你确认后我可以执行)

  • 确认是否需要把 docs/logs/ 目录保留在仓库(目录空也可不管)
  • 决定是否要把 PROJECT.md / INDEX.md 再精简一次(可选)
  • 最终:git status 应该干净(除忽略文件)