【科研绘图系列】R语言绘制多组条形图图(barplot)
禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

文章目录
-
- 介绍
-
- 数据读取与处理
- 图形绘制
- 图形组合与输出
- 加载R包
- 数据下载
- 导入数据
- 数据预处理
- 画图
- 总结
- 系统信息
介绍
这段代码是一个用于生成基因表达数据可视化图形的R脚本,主要利用了ggplot2和ggpubr等R包,以及一些基础的R函数。其目的是基于特定的数据文件,生成四个基因(ATM、TP53、MYC和DVL3)的表达数据可视化图形,并将这些图形组合成一个PDF文件。
数据读取与处理
代码首先读取了名为loss_median_centered_wes.csv的数据文件,这个文件可能包含了基因表达数据和相应的状态信息(如ATM和TP53的突变状态)。数据文件经过na.omit()函数处理,移除了包含缺失值的行,确保后续分析的完整性。
对于ATM和TP53基因,代码将它们的状态(ATM.status和TP53.status)转换为因子类型,并定义了状态的顺序。状态的顺序可能是基于某种生物学意义或分析需求,例如“Mut_CN”、“WT”、“CN”和“Mut”。这种排序有助于在图形中清晰地展示不同状态的分布。
接着,代码读取了另一个数据文件Gain_median_centered_cn_values.csv,这个文件可能包含了MYC和DVL3基因的拷贝数(CN)状态和表达数据。同样地,MYC和DVL3的状态(MYC.cn和DVL3.cn)被转换为因子类型,并定义了状态的顺序(0和1)。
图形绘制
对于每个基因,代码使
