0) 安装依赖(首次必做):
bash {baseDir}/scripts/ensure_env.sh1) 抓取弹幕:
python3 {baseDir}/scripts/fetch_danmaku.py --url "" --outdir "{baseDir}/output" 2) 运行分析(jieba + 清洗 + SnowNLP + 高密度词云PNG):
bash {baseDir}/scripts/analyze.sh "" "" "{baseDir}/output" "" 3) 可选:增加自定义清洗词
--stopwords-file:传入自定义停用词文件(可重复)--extra-stopwords:临时追加停用词(逗号分隔)"{baseDir}/.venv/bin/python" {baseDir}/scripts/analyze_danmaku.py --csv "" --meta "" --outdir "{baseDir}/output" --name task_clean --extra-stopwords "妈妈,亲戚,这边" --bvid + --page(分P视频)--cid(高级模式,直接指定分P)fetch_danmaku.py 自动完成:bvid -> cid 解析comment.bilibili.com/{cid}.xml_danmaku.csv / _danmaku.json / _corpus.txt / _meta.jsonanalyze_danmaku.py 对 CSV 弹幕文本执行:jieba 分词关键词统计(JSON)SnowNLP 情感分布统计(JSON)默认输出目录:{baseDir}/output
主要产物:
*_top_words.json*_sentiment.json*_wordcloud.png*_report.mdscripts/ensure_env.sh:安装依赖(jieba/snownlp/wordcloud)requirements.txt:Python依赖清单scripts/fetch_danmaku.py:抓取与导出弹幕scripts/analyze_danmaku.py:jieba词频、清洗、SnowNLP情感、舆情报告scripts/fetch.sh / scripts/analyze.sh:便捷命令封装references/stopwords.default.txt:默认干扰词词表references/methodology.md:方法与局限说明共 1 个版本