南方医科大学学报 ›› 2020, Vol. 40 ›› Issue (10): 1493-1499.doi: 10.12122/j.issn.1673-4254.2020.10.16
耿 彧,杨蓉蓉,张 静
摘要: 目的 遗传变异中的单体型扩增因具有潜在的选择优势和克隆演变敏感性,成为寻找易感癌基因的一个重要标志。本文充分考虑单体型扩增状态的影响因素,有效实现稀有变异关联分析。方法 通过等位基因变异频率估计单体型扩增状态。首先采用置换检验,基于等位基因变异频率实现候选变异位点的聚类。再应用似然聚类方法,确定隐马尔科夫随机场模型中的邻域系统。此外,引入一个威尔逊区间和错误识别率的组合过滤机制,进一步提高变异位点识别精度。最后将候选集与单体型扩增状态合并到加权虚拟位点中用于关联分析。结果 通过仿真实验,分别对不同次等位基因变异频率的Ⅰ型错误率比较分析,发现Ⅰ型错误率基本稳定在2%以内。与其他5种关联分析方法分别进行Ⅰ型和Ⅱ错误率比较分析,Ⅰ型与Ⅱ型错误率均控制在2%以内,显示出其显著优势及较好的统计能力。结论 本研究提出的针对单体型扩增区域的肿瘤易感变异关联分析方法能够较为精确的识别单体型扩增区域的肿瘤易感变异,具有良好的健壮性与稳定性,可为临床诊断提供决策支持。