实验信息
本次分析的实验设计和样品信息。
实验基本信息
| 项目 | 内容 |
|---|---|
| 项目名称 | PXD046288 |
| 样品类型 | 蛋白质样品 |
| 物种 | Homo sapiens (Human) |
| 实验类型 | DDA (Data-Dependent Acquisition) |
| 分析日期 | 2026-03-16 |
| 分析目录 | C:\code\protein-pipeline\batch_test_output\PXD046288\analysis |
软件与参数设置
数据处理和分析所使用的软件及参数配置。
📖 方法说明
- 原始数据使用 MaxQuant 进行数据库搜索和蛋白鉴定
- 使用 LFQ 算法进行无标记定量
- 下游统计分析使用 Python 自动化流程
数据库搜索参数
| 参数 | 设置 |
|---|---|
| 搜索引擎 | MaxQuant |
| 软件版本 | 2.7.5.0 |
| 蛋白数据库 | UniProt Human Reviewed |
| 酶切方式 | Trypsin/P |
| 最大漏切位点 | 2 |
| 固定修饰 | Carbamidomethyl (C) |
| 可变修饰 | Oxidation (M), Acetyl (Protein N-term) |
| 肽段长度 | 7-25 氨基酸 |
| 前体离子容差 | 20 ppm (first search), 4.5 ppm (main search) |
| 碎片离子容差 | 20 ppm |
| FDR 阈值 | 1% (Protein & Peptide) |
| 定量方法 | LFQ (Label-Free Quantification) |
| Match Between Runs | 启用 |
分析概述
本报告对 2 个样品进行了全面的蛋白质组学分析。
全局质控 - 样品分布
样品表达量分布和数据质量评估。
📖 方法说明
- 数据经过 log2 转换和中位数归一化
- 箱型图展示各样品的表达量分布
- 缺失值分析评估数据完整性
样品强度分布箱型图
缺失值分析
全局质控 - PCA 主成分分析
使用主成分分析评估样品间整体差异和分组效果。
📖 方法说明
- PCA 用于降维和可视化样品间关系
- PC1/PC2 解释了主要的变异来源
- 不同颜色代表不同实验分组
PCA 2D 图 (PC1 vs PC2)
全局质控 - 样品相关性与聚类
使用 Pearson 相关系数评估样品间的定量一致性,层次聚类分析样品分组效果。
📖 方法说明
- 计算样品间 Pearson 相关系数
- 热图颜色表示相关性强度
- 层次聚类验证样品分组效果
- 组内样品应具有较高相关性
样品相关性热图
层次聚类热图
差异表达分析
共鉴定到 288 个蛋白,其中 24 个差异表达蛋白(5 个上调,19 个下调)。
📖 方法说明
- 使用独立样本 t 检验进行差异分析
- Fold Change 阈值: |Log2FC| ≥ 1.0
- 显著性阈值: p-value < 0.05
火山图 (Volcano Plot)
差异蛋白热图 (Heatmap)
差异蛋白列表
显示 24 行,共 288 行 | 显著差异: 24个 (↑5 ↓19)
数据文件: Sample_differential.xlsx
| Regulation | Log2FC_G_vs_DCM | Pvalue_G_vs_DCM |
|---|---|---|
| ↓ 下调 | -5.1991 | 0.0000 |
| ↓ 下调 | -3.7605 | 0.0000 |
| ↓ 下调 | -3.3892 | 0.0000 |
| ↓ 下调 | -3.1520 | 0.0000 |
| ↓ 下调 | -2.8846 | 0.0000 |
| ↓ 下调 | -2.6717 | 0.0000 |
| ↓ 下调 | -2.3451 | 0.0000 |
| ↓ 下调 | -1.8177 | 0.0003 |
| ↓ 下调 | -1.7847 | 0.0484 |
| ↓ 下调 | -1.5899 | 0.0122 |
| ↓ 下调 | -1.5451 | 0.0000 |
| ↓ 下调 | -1.5224 | 0.0002 |
| ↑ 上调 | 1.3634 | 0.0000 |
| ↓ 下调 | -1.3514 | 0.0000 |
| ↑ 上调 | 1.2396 | 0.0000 |
| ↑ 上调 | 1.1639 | 0.0000 |
| ↓ 下调 | -1.1507 | 0.0000 |
| ↓ 下调 | -1.1408 | 0.0471 |
| ↓ 下调 | -1.1220 | 0.0000 |
| ↓ 下调 | -1.1166 | 0.0000 |
| ↑ 上调 | 1.0973 | 0.0000 |
| ↓ 下调 | -1.0887 | 0.0134 |
| ↓ 下调 | -1.0303 | 0.0244 |
| ↑ 上调 | 1.0096 | 0.0000 |
检测蛋白交集分析
展示不同实验组之间**检测到的所有蛋白**的交集情况。此图反映各组样品的蛋白组覆盖度。
📖 方法说明
- 统计各组检测到的蛋白数量(定量值>0)
- Venn 图/UpSet 图展示组间蛋白交集
- 识别各组特有检测蛋白
两组检测蛋白交集 Venn 图
GO 富集分析
对差异表达蛋白进行 Gene Ontology 富集分析,共富集到 404 个显著 GO 条目。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- 多重检验校正: Benjamini-Hochberg (FDR)
- 显著性阈值: adjusted p-value < 0.05
GO 气泡图
GO 柱状图
多库富集分析概览
使用 8 个富集库对差异蛋白进行功能注释分析,共富集到 396 个显著条目。
📖 方法说明
- 使用 13 种功能注释数据库进行富集分析
- 包含: GO, KEGG, Reactome, WikiPathways, BioCarta, InterPro, TF, Immune 等
- Fisher 精确检验 + BH 多重检验校正
- 显著性阈值: FDR < 0.25
多库富集分析汇总
KEGG 通路富集分析
使用 KEGG 通路 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
- KEGG 通路链接已生成,可在结果文件中查看
- 链接文件: kegg_enrichment_with_links.tsv
G_vs_DCM (全部差异)
G_vs_DCM (下调)
Reactome 通路富集分析
使用 Reactome 通路 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
G_vs_DCM (上调)
WikiPathways富集分析
使用 WikiPathways 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
BioCarta 通路富集分析
使用 BioCarta 通路 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
InterPro 结构域富集分析
使用 InterPro 结构域 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
转录因子靶基因富集分析
使用 转录因子靶基因 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
免疫基因集富集分析
使用 免疫基因集 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
G_vs_DCM (上调)
染色体位置富集分析
使用 染色体位置 数据库对差异蛋白进行功能富集分析。
📖 方法说明
- 使用 Fisher 精确检验进行富集分析
- FDR 校正 (Benjamini-Hochberg)
G_vs_DCM (全部差异)
G_vs_DCM (下调)
蛋白质互作网络分析
基于差异蛋白构建蛋白质-蛋白质相互作用 (PPI) 网络。
📖 方法说明
- 使用 STRING 数据库构建 PPI 网络
- 使用 MCL 算法进行网络聚类
- 基于度中心性识别 Hub 蛋白
蛋白质相互作用网络
蛋白质相互作用网络
Hub 蛋白(关键节点)
网络中连接度最高的蛋白,通常在生物学功能中扮演核心角色。
📖 方法说明
- Hub 蛋白是网络中连接度最高的节点
- 高连接度蛋白通常是关键功能调控因子
- 可作为后续验证实验的优先靶点
Top 10 Hub 蛋白
| 蛋白 ID | 连接度 | 中心性 |
|---|---|---|
| P11226 | 5 | 0.0649 |
| Q03591 | 5 | 0.0649 |
| P02741 | 5 | 0.0649 |
| P02749 | 4 | 0.0519 |
| P02751 | 4 | 0.0519 |
| O00187 | 4 | 0.0519 |
| P02649 | 3 | 0.0390 |
| P10599 | 3 | 0.0390 |
| P08603 | 3 | 0.0390 |
| Q9BXR6 | 3 | 0.0390 |
结论与展望
本次分析共鉴定到 288 个蛋白质,其中 24 个差异表达蛋白 (5 个上调,19 个下调)。 **主要发现:** 1. 差异蛋白中上调比例为 20.8%,下调比例为 79.2% 2. GO 富集分析揭示了差异蛋白参与的主要生物学过程 3. 网络分析识别出关键的 Hub 蛋白 **后续建议:** - 对关键差异蛋白进行实验验证(Western Blot、qPCR 等) - 结合生物学背景深入分析富集通路 - 关注 Hub 蛋白的功能和调控网络