基因组所设计开发检测基因CUB的新算法——CDC(Codon Deviation Coefficient)
近日,pg电子官网基因组科学与信息重点实验室章张研究员,领导其团队乐成开发检测密码子使用偏好(Codon Usage Bias,CUB)的新算法:密码子偏差系数模型(Codon Deviation Coefficient,CDC),该研究结果宣布在《BMC Bioinformatics》杂志。
此项事情原创性地将概率论中的交、并、补操作应用到组分剖析,用GC含量(S)和嘌呤含量(R)来体现四个核苷酸组分,并在此基础上推导出密码子和氨基酸的组分,从而设计出基于S和R的组分模型,应用该模型考察基因的CUB(Codon Usage Bias;密码子使用偏好),进而提出了检测基因CUB的新算法CDC(Codon Deviation Coefficient,密码子偏差系数)。差别于现有的相关算法(例如:CAI、ENC等),CDC通过GC含量和嘌呤含量考虑了差别序列的配景组分特异性,独创性的运用自展重抽样法(Bootstrap Resampling)检测CUB的显著性,且不需要高表达基因作为先验信息。经验证,CDC在模拟数据中优于现有的多个相关算法,在真实数据中CDC与基因表达含量的关联系数(Correlation Coefficient)高于其它算法,并且在大肠杆菌中发明CUB的显著性与基因功效有着紧密联系。
该项结果的宣布,使科研事情者能更准确快速的剖析研究CUB,进而更深入的学习在自然选择压力下的基因突变、基因表达,卵白质功效等的进化。
文章链接:http://www.biomedcentral.com/1471-2105/13/43/abstract
附件下载: