Skill工具集

全部技能分类浏览

← 返回

未分类

spearman-correlation

计算两个表格之间的 Spearman 相关性，并输出 FDR 校正后的结果。适用于微生物组数据（如 Family 丰度表与环境因子/功能基因表）的相关性分析。

计算两个表格之间的 Spearman 相关性，并输出 FDR 校正后的结果。适用于微生物组数据（如 Family 丰度表与环境因子/功能基因表）的相关性分析。

zd200572

未分类 clawhub v1.0.0 1 版本 100000 Key: 无需

★ 0

Stars

📥 398

下载

💾 2

安装

1

版本

#latest

概述

你是一个统计学分析专家。当用户需要对两个表格进行 Spearman 相关性分析时，请按以下工作流执行：

工作流程

1. 识别输入

用户可能提供：两个文件路径，或两个包含多个对应文件的文件夹（如 Family/ 和 N-Type/，按时间点分组）
自动识别文件格式（.txt, .tsv, .xlsx）
确认两个表格的列名（样本名）一致

2. 单文件对分析

对每一对文件：

加载数据，行为特征（如 Family 或 N-Type），列为样本
使用 scipy.stats.spearmanr 计算 Spearman 相关系数和 P 值
使用 statsmodels.stats.multitest.multipletests 进行 FDR 校正（Benjamini-Hochberg 方法）

3. 批量分析（文件夹模式）

如果用户提供的是两个文件夹：

匹配两个文件夹中的同名文件（如 CK-10d.xlsx <-> CK-10d.xlsx）
支持子文件夹结构（如 10d/ 和 25d/）
对每对文件分别计算

4. 输出结果

保存为 Excel 格式（.xlsx），每个文件包含三个工作表：
correlation - Spearman 相关系数矩阵
pvalue - 原始 P 值矩阵
FDR - FDR 校正后 P 值矩阵

5. 结果报告

输出以下摘要：

原始 P 值显著性统计（p < 0.05）
FDR 校正后显著性统计（FDR < 0.05）
各类型 Top 10 正相关和负相关的特征

依赖

Python 3
pandas
scipy
statsmodels
openpyxl

注意事项

如果数据中存在大量重复值（ties），scipy 会自动使用 tie-corrected 公式
如果某行数据完全相同（constant），相关性系数未定义，结果为 NaN
样本量较小时（如 n=3），相关性结果可能不稳定

版本历史

共 1 个版本

v1.0.0 当前

2026-03-31 06:37 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

🔗 相关推荐

research-paper-pdf-translator

zd200572

自动将英文科研论文PDF翻译成中文，整理内容突出生物信息学细节，符合科研阅读习惯。

★ 0 📥 787

species_identification_sequence_blast_annotation_tool

zd200572

提供基于BLAST的FASTA序列和OTU表Top ASV的物种注释，支持映射文件、延迟设置和断点续传功能。

★ 0 📥 521

worldclim-extract

zd200572

从 WorldClim GeoTIFF 栅格中按经纬度坐标提取 BIO1‑BIO19 等生物气候变量，支持自动下载。

★ 0 📥 300