人类基因组图谱大修正--人类基因数大幅缩水!?
本文转载自:SciScape
編輯 Gene 報導
人类基因组图谱总算大功告成了,可是所统计出的基因数居然只有约2万至2万5千多个,甚至比之前估计的3万多还少!
实验室常用的大、小鼠的基因体据估有3万个基因。另一实验室常用生物的线虫(C. elegans),其基因总数约有1万9千个,而果蝇则有约1万3千个。小型开花植物阿拉伯芥(Arabidopsis)的2万7千个基因搞不好就比人类的还多。
美国国家人类基因组研究所主任Francis Collins指出,这个新统计显示过去科学家不仅高估了人类有十万个基因,在三年前基因组图谱草图出炉时,还错估了基因数有3万多,那是因为人类基因组中序列重复的区域太多了。西雅图华盛顿大学的Bob Waterston指出,就算有了基因组图谱的成品,还寻找基因也还是不简单的。不过有了修正版的基因组图谱,科学家还是能较准确地估计基因数。现在他们已确认出19,599个蛋白质编码基因,还有2,188个预测的蛋白质编码基因。
Waterson和国际人类基因组定序联盟的科学家发现了1,183个近期由即存的基因复制且演化出来的新基因。Waterson指出,这些新复制出来的区域快速地演化,而且在灵长类和大猿基因组中就可找到。
这项研究还发现Celera Genomics的创办人Craig Venter所提倡的霰弹枪定序法有一个重大缺失。和传统上利用细菌增殖人类DNA,然后定位定序的方法不同的是,霰弹枪定序法把整个基因组的DNA切成小片段就直接定序,然后利用计算机把各片段接起来。可是这项分析发现,Venter的方法无法把复制倍增出来的区域正确地组合到基因组图谱中。可是这些区域对人类的遗传疾病却是非常重要的。
伴随Venter开创霰弹枪定序法的Aaron Halpern表示,他们早知有3%至5%的基因编码区会是他们的罩门。西雅图华盛顿大学医学院的Evan Eichler及Halpern和J. Craig Venter Institute的Granger Sutton就曾发表报造指出,霰弹枪定序法并非一无是处,只是无法搞定特定区域,所以要定序那些区域,还是得要用传统的选殖法。
他们接下来的任务,乃是替异染色质做好定序。该区域的基因不多,还充斥许多未知功能的「垃圾DNA」。异染色质占人类基因组约两成,要加以定序及修整,可能还要耗时六年。
原学术论文:
- X. She et al., “Shotgun sequence assembly and recent segmental duplications within the human genome,” Nature, 431:927-30, October 21, 2004.
- International Human Genome Sequencing Consortium, “Finishing the euchromatic sequence of the human genome,” Nature, 431:931-45, October 21, 2004.
- S. Istrail et al., “Whole-genome shotgun assembly and comparison of human genome assemblies” PNAS, 101:1916-21, February 17, 2004.