Day 6 PPI与Cox
1.PPI
PPI 全称是蛋白质 - 蛋白质相互作用,简单说就是细胞里的蛋白质之间 “交朋友、一起干活” 的关系。
作用:
- 蛋白质功能注释与未知功能预测
- 细胞信号通路与调控网络解析
- 疾病相关分子机制研究
- 药物靶点筛选与验证
查找PPI我们使用String来进行
https://cn.string-db.org/cgi/input?sessionId=bXmYsv7CnUrH&input_page_active_form=multiple_identifiers

这里我们查看前面我筛选过后的基因(存储在DEG_final)中
后续一直点击continue即可
1.1 获取数据
由于基因较多,我们所得到的网很杂乱


进行筛选后,网状图明显疏松,但是图片不够直观,我们就需要通过Cytoscape软件来进行绘制,那首先需要得到数据

TSV文件就给出我们蛋白之间的关系,根据这个我们就可以在Cytoscape中进行绘制
1.2 Cytoscape使用


Fill Color我们选择degree,这样可以直观的看出哪些蛋白所联系的蛋白数量多
最终成品:

2.Cox
Cox 比例风险回归模型(Cox Proportional Hazards Regression Model),它是生存分析领域最常用的统计模型之一,核心用途是分析 “影响因素” 与 “事件发生时间” 之间的关联,尤其适用于临床生信中患者预后相关的研究。
安装包
R |
2.1 数据处理
我们使用Cox比例风险回归模型来分析生存时间和我们筛选出差异较大的基因的关系,就用到了我们之前的文件exp_surv_01A.txt
R |
2.2 Cox分析
R |
处理结果,这里重点关注HR与pvalue,HR>1 是对患者危险因素,<1是保护因素,P值小于0.05才有统计学意义

2.3 绘图
Python |
3.查找PPI与Cox重合基因
对于PPI,我们按照degree的大小降序排列,筛选前top33的基因,保存

对于Cox我们筛选出P值<0.005的基因,将这两个筛选后的基因进行取交集,就可以的到我们后续需单个研究的基因
