人类基因组计划后17年,X染色体被解码了

人类基因组计划后17年,X染色体被解码了

2003年,人类基因组计划结束了13年长跑,成功测序人体90%以上的基因,但其余部分仍难以解码。

近年来,DNA读取技术不断改善,这些空缺被逐步填满,研究人员得以进一步绘制完整的人类基因组图谱。但还是有百余个区域未得完成,其中就包括X染色体上的几个部分。

而近期发表于Nature的一项研究显示,科学家首次确定从端粒到端粒的X染色体的完整序列,此成就能帮助科学家进一步了解多种遗传条件。

测序X染色体及其它染色体的区域难倒了科学家,因为这些部位包含大量重复的DNA片段,令测序变得棘手,片段上有着重复了成千上万次的DNA字母(即碱基)。

加利福尼亚大学加州圣克鲁斯分校的DNA生物学家、该论文作者卡伦·米加表示:“直到最近,组装或拼凑这些片段才成为可能。”

研究人员采用高级测序技术,专注于解码X染色体,因为绝大多数人至少有一条X染色体。通常,从生理上的女性有一对X染色体,生理上是男性的人有一条X染色体和一条Y染色体。

米加说:“基因遗传学及基因组学领域研究X染色体,因其与许多遗传特性及疾病相关联。”比如,X染色体与色盲、杜氏肌营养不良及血友病有关。

 u=2817354291,4113399337&fm=26&gp=0.jpg

米加与来自美国国家人类基因组研究所的研究员亚当·菲利皮合作,采用长读长测序,即能一次读取长链DNA碱基的技术进行研究。人类基因密码长到难以想象——约60亿个碱基——且DNA测序仪无法同时读取所有碱基。

因此,研究人员不得不将基因组切割为含有上百个碱基的小片段,这样便可以一次分析一个小片段。任务完成后,研究人员还须重新拼接这些片段。

在人类基因组项目初期,科学家一次仅能读取500个碱基。20世纪中期,测序技术愈加精准,但其速度降至每次读取100至200个碱基。到2010年,新技术问世,可一次读取约10000个碱基。使用旧测序技术时,这些重复DNA片段切割出的短片段十分相似,几乎没有能将它们拼接的线索。

现在,测序技术的改进意味着一些仪器可以同时读取约100000甚至更多的碱基。米加与菲利皮团队采取两种工具分析X染色体,染色体来自内含两个相同X染色体的特殊细胞。之后,菲利皮及其团队使用新创建的电脑程序拼接这些片段。

在X染色体上,他们能够填补染色体中央及许多基因上的空白部分。这样一来,尽管研究人员没发现什么大惊喜——比如没有新的、尚待发现的基因,但他们发现了许多在基因组重复片段中的变化。变化包括DNA碱基替换、缺失或插入,也包括较长DNA片段的复制、易位或倒置,这些问题会导致基因疾病。