非编码序列在基因组中所占的比例之高,完全可以用令人震惊来形容。科学家早就知道有的DNA序列是不编码蛋白质的,并对此抱有预期。可在人类全基因组序列公布的那一刻,他们不得不面对一个令人迷惑又为难的问题:如果蛋白质对细胞来说真的这么重要,为什么编码蛋白质的DNA序列只占2%。
曾经科学家们无法解释为什么我们的基因组中有那么多不编码DNA序列,所以他们提出了“无用”DNA这个概念。但这样的处置方式显然越来越站不住脚。
科学家曾想在DNA的层面上寻找并解释人类与其他生物的区别,但随着研究变得深入,他们逐渐意识到基因本身并不足以诠释那些差异。事实上,唯一与生物进化程度明显正相关的遗传因素是“无用”DNA的数量:越是复杂的生物体,“无用”DNA在其基因组中占的比例越大。
因此,现在的问题是,如果“无用”DNA非常重要,那么它的功能到底是什么?如果它的功能不是编码蛋白质,那么它究竟在细胞里扮演了什么样的角色?
有的“无用”DNA能在染色体内形成特殊的结构,防止染色体因结构变得松散而受损。也有一些“无用”DNA会参与细胞分裂的过程,它们的功能是作为锚定点,保证每个子细胞获得的染色体完全相同。还有一些“无用”DNA充当染色体内的隔离带,它们的功能是让转录活动局限在特定的区域内。
有些“无用”DNA的另一项重要功能是调节基因的表达,在某些情况下,这项功能对生物个体产生巨大且显著的影响。
DNA元件百科全书(ENCODE)计划是一个旨在鉴定人类基因组功能元件的倡议,该计划的先导项目仅仔细研究了1%的基因组,使人们对DNA序列的本质和进化有了初步了解。大约半数的功能元件看起来比预期能够更自由地改变序列,这对生物学相关的DNA抵抗改变的观点提出了挑战。大多数的DNA被转录成RNA,这个发现颠覆了我们把基因组看作是相当少量且分散的基因位于大量不活跃的“无用”DNA之间的通俗认识。
ENCODE计划旨在利用高通量方法对人类基因组所编码的功能元件进行鉴定和分类,进而提供人类基因组更加具有生物学信息的表征。在该计划的先导阶段,35个课题组贡献了超过200个实验和计算数据集,以前所未有的详细度研究了人类基因组特定的29,998千碱基(kb)区域。
ENCODE中使用的实验技术类型总结
2012年9月5日,总计30篇论文同步发表于《自然》(Nature)、《科学》(Science)、《基因研究》(GenomeResearch)等杂志上。这是ENCODE第一次公布研发成果,并且是全球同步公告。
ENCODE的科学家分析了将近150中不同类型的细胞,探查到了人类基因组的多种特征。
在对那些通常情况下与调控序列有关的物理特征进行分析后,研究人员总结认为,这些调控序列的激活与关闭情况同样因细胞而异,而且它们反过来决定了细胞的类型。这也说明了,每种细胞能根据各自的需要,对基因组的调控序列潜力善加利用。
最令人吃惊的一组数据显示,超过75%的基因序列都能被细胞转录成RNA,如果没有,那只是时间或细胞类型问题。这个比例相当惊人。在对编码蛋白质的信使RNA和长链非编码RNA进行比较后,研究人员发现了二者在表达上的一个主要差别。就研究的15种人类细胞系而言,在所有细胞系中都表达的信使RNA的比例远高于所有细胞中都表达的长链非编码RNA的比例。
整体而言,ECCODE联盟发表的论文和公布的数据将人类的基因组描绘成非常活跃的模样——“无用”DNA就像一座信息和指令的巨大宝库。
但实际上针对这些结论也有一些质疑,质疑者提出,这些数据最多只表明相关的序列有作为功能性区段的潜力,同时有批评者担心,过于灵敏的检测技术放大了基因组的“背景噪音”。但实际上这也可能是因为我们的检测技术还不够敏感,我们的技术水平还没有高到能单独对一个细胞内的RNA进行分析,所以只能圈定复数个细胞,检测所有细胞的RNA,然后再用平均数估算每个细胞里的RNA分子的数量。
随着对“无用”DNA研究的深入,我们越来越能够认识到,我们不能用简单的线性思维来看待细胞,任何发生在细胞内的现象都是多条通路环环相扣的结果。争论“哪种因素对基因组来说最重要”注定是白费力气。
一段DNA序列可以同时包含一个编码蛋白质的基因、若干长链非编码RNA、小RNA、反义RNA、剪接信号、非翻译区、启动子和增强子;在这些基本的结构之上,还有DNA序列的个体差异、固定或随即的表观遗传修饰、可变的三维构象,以及RNA和蛋白质分子与基因组结合产生的效应;最后我们还要考虑瞬息万变的环境因素。
只需要认真想一想基因组有多复杂,就不会奇怪我们为什么还没有对它知根知底。在人迹未至的黑暗中,总有新的事物等待我们去学习。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价