05 GWAS表型数据处理原理
表型数据处理
• 质量性状
– 二分类:可用0 / 1, 1 / 2 数值表示
– 多分类:哑变量赋值,0/1
• 数量性状
– 尽量符合正太分布
– 剔除异常表型值样本
– 多年多点重复观测
– 对于阈值性状,分级数量化或哑变量赋值
R中 shapiro.test检测正态性
正态性转换
• Box-cox变换
• Rank-base inverse-normal
transformation( INV) C=0.5
是否需要INV转换
多年多点
• 分别分析
• 均值
• BLUP: Best Linear Unbiased Predictor
• BLUE: Best Linear Unbiased Estimator
重测序-Resequencing
定义
对基因组序列已知物种的个体进行基因组测序,并在此基础上对个体或群体进行差异性分析。