从基因组大数据到精准医学(开卷知新)_科技频道_东方

发布日期:2020-07-22 03:26   来源:未知   

制图:蔡华伟

若论近30年人类生物医学基础研究,遗传密码的测量必定是最耀眼的成果之一。人类代代繁衍,靠什么实现遗传?遗传信息储存在哪里?它们是什么样子?

我们知道,遗传信息储存在DNA(脱氧核糖核酸)里,长长的DNA序列由四种碱基A、G、C、T排列组成,不同的序列段记载不同的信息。有些段落含有制造蛋白质的信息,这些段落就是我们常说的基因。一整套人类DNA序列被称作“人类基因组”,它不仅包含所有人类基因,还包含大量不用来编码蛋白质的其他有用信息。DNA在每个细胞的细胞核里组成染色体,DNA要释放的信息先转录产生mRNA(信使核糖核酸),mRNA再翻译制造蛋白质进而完成各种生物学功能,这就是著名的“中心法则”。

一个人的遗传密码到底有多长?约30亿个字符。如果一页打上3000个遗传密码,用A4纸打印出来装订成书,厚度能达到约100米,有30多层楼那么高。20世纪90年代初,“人类基因组计划”正式启动,开启人类在分子水平上认识自身遗传密码的新航程。2001年,人类基因组精细图谱及其初步分析结果发布,使我们看到由四种符号组成的一维人类遗传密码的真实面貌。人类基因组研究促成基因检测等一系列新技术出现,还带来基因诊断、基因治疗、靶向药物等医学新手段,生物医学进入建立在基因组大数据基础上的精准医学时代。

在分子水平上认识人类生命活动

“人类基因组计划”不仅找到了各种人类基因,积累了大量基因组数据,还积累了由基因组转录出来的各种RNA(核糖核酸)数据,以及由mRNA翻译产生的各种蛋白质数据。RNA的集合称为转录组,蛋白质的集合称为蛋白质组,机体所有代谢产物组成代谢组,此外还有表观遗传组等。通过大数据研究这些“组”及其相互关系的工作即称“组学大数据”研究,组学大数据的介入成为当代生物医学发展的典型特征。