首次调用本 skill 前,先运行初始化脚本,自动检测并安装所有依赖:
bash skills/aa-pair-analysis/scripts/setup.sh
脚本会依次检查并安装:
| 依赖 | 说明 | 自动安装方式 |
|---|---|---|
| ------ | ------ | ------------ |
| Python 3.8+ | 运行分析脚本 | 需手动预装 |
| pandas | 数据处理与CSV输出 | pip install pandas |
| biopython | 序列处理(可选) | pip install biopython |
| ClustalOmega | 多序列比对(MSA) | apt / brew / conda / 二进制下载 |
> 如果环境已配置好,跳过此步骤直接运行分析即可。
当同时需要氨基酸对频率分析 + 蛋白质关键片段预测时,使用联合分析包装器,MSA 只执行一次,并自动生成单体配方投料表。
cd skills/aa-pair-analysis
# 联合分析(自动整合 + 自动生成投料表)
python scripts/run_combined_analysis.py 任务名 数据目录
工作流:
联合分析完成后自动调用:
python scripts/gen_monomer_formulation_table.py 整合结果目录
投料规则(2026-05-11 更新):
单体对照:
| 氨基酸类别 | 单体 | M (g/mol) | 密度/浓度 |
|---|---|---|---|
| ----------- | ------ | ----------- | ----------- |
| Hydrophobic | BA | 128.17 | 0.90 g/mL |
| Nucleophilic | HEA | 116.12 | 1.10 g/mL |
| Aromatic | PEA | 192.21 | 1.10 g/mL |
| Amide | AAm | 71.08 | 0.18 g/mL |
| Acidic | CBEA | 144.13 | 1.10 g/mL |
| Cationic | ATAC (80%) | 193.67 | 1.15 g/mL |
输出:横向A4 Word 文档,按分类分表,含斑马纹。
scripts/species_analysis_workflow.py(FASTA→MSA→结果)scripts/run_combined_analysis.py(MSA共享 + 自动整合 + 自动投料表)scripts/gen_monomer_formulation_table.py(Word文档生成)scripts/integrate_species_results.py(按物种合并两份分析结果)references/method.mdreferences/classification.mdcd skills/aa-pair-analysis
# 从原始FASTA完整流程(MSA→共识→对分析)
python scripts/species_analysis_workflow.py 任务名 数据目录 --threshold 0.5
# 断点续传
python scripts/species_analysis_workflow.py 任务名 数据目录 --resume 已有结果目录
| 参数 | 默认值 | 说明 |
|---|---|---|
| ------ | -------- | ------ |
--threshold | 0.5 | 共识序列保守性阈值(最高频氨基酸占比≥该值才写入,否则标X) |
--resume | 无 | 指定已有结果目录,从断点继续 |
| 文件 | 内容 |
|---|---|
| ------ | ------ |
species_formulations.csv | 每个类群的Top5对型、φ值、21种对型计数 |
top_5_pairs_details.csv | Top5对型逐条明细 |
formulation_summary.csv | 总类群数、独特配方数 |
详见 references/classification.md。
参与统计(17种):Hydrophobic(V,L,I,M) / Nucleophilic(S,T,C) / Aromatic(F,Y,W) / Amide(N,Q) / Acidic(D,E) / Cationic(H,K,R)
排除(不统计):X、A(丙氨酸)、G(甘氨酸)、P(脯氨酸)
scripts/run_pdf_analysis.py 和 scripts/species_analysis_workflow.py 中的 FUNCTIONAL_CLASSES 字典--threshold 参数,无需改代码共 4 个版本