分子进化
分子系统学的基因
获取的方法核苷酸序列DNA极大地提高了自1980年代以来,已成为主要的自动化。许多基因在众多生物测序,并在各种完整的基因组被测序物种从人类的病毒。DNA序列的使用尤为值得研究的基因的复制。的基因代码血红蛋白在人类和其他哺乳动物提供一个很好的例子。
的知识氨基酸的血红蛋白链和序列肌红蛋白密切相关的蛋白质,使人们有可能重建进化历史的重复,催生了相应的基因。但是直接检查编码这些蛋白的基因的核苷酸序列表明,情况更复杂,也更有趣,比看起来的蛋白质序列。
DNA序列的研究人类血红蛋白基因已经表明,他们的数量比之前认为的更大。血红蛋白分子四聚体(分子由四个亚基)组成的两个多肽(蛋白质链相对较短)的一种,另一种。在胚胎血红蛋白E,两种多肽指定的ε;在胎儿hemoglogin F,γ;在成人血红蛋白,β;和成人血红蛋白2,这是δ。(血红蛋白占约98%的成人血红蛋白,血红蛋白2大约2%)。另一种多肽在胚胎血红蛋白ζ;在胎儿和成人血红蛋白、α。第一组的基因编码多肽(ε,γ、β,δ)是位于染色体11;第二组的基因编码多肽(ζ和α)位于16号染色体上。
还有额外的复杂性。两个γ(称为G基因存在γ和一个γ(α),两个α基因1和α2)。此外,有两个β假基因(ψβ1和ψβ2)和两个α假基因(ψα1和ψα2),以及一个ζ假基因。这些假基因非常相似的核苷酸序列对应的功能基因,但他们包括终止密码子和其他突变,使它无法产生功能性血红蛋白。
多肽基因的核苷酸序列的相似性,和假基因,α和β基因家族表明他们都homologous-that,他们通过各种重复出现,随后从基因进化祖先。此外,同源性之间也存在另一个基因的核苷酸序列。血红蛋白和肌红蛋白基因的进化历史中总结 。
多样性和异质性
细胞色素c只由104个氨基酸,由312个核苷酸编码。然而,这个短蛋白存储巨大的进化信息,使可能的较好的近似,所示多样化的物种在一段时间内超过十亿年。但是细胞色素c是一个缓慢发展的蛋白质。广泛的不同种类的共同点的一大部分氨基酸的细胞色素c,这使得生物体之间可能的遗传差异的研究只有远程相关。然而,出于同样的原因,比较细胞色素c分子不能确定进化密切相关的物种之间的关系。例如,细胞色素c的氨基酸序列在人类和黑猩猩是相同的,虽然它们分化大约600万年前,人类和恒河猴,这从他们的共同祖先分化3500万到4000万年前,它只通过不同一个氨基酸替换。
20的进化历史蛋白质进化速度高于细胞色素c可以为了建立系统发育研究密切相关的物种之间的关系。一些蛋白质进化非常快;的血纤维蛋白肽-蛋白质参与凝血过程适用于重建发展史最近进化的物种,如哺乳动物密切相关。其他蛋白质进化以中间的利率;血红蛋白,例如,可以用来重建进化历史在一个相当广泛的时间(看到 )。
分子进化的一个重要优点是它多重性,如上所述的部分作为信息大分子DNA和蛋白质。在每一个生物都是成千上万的基因和蛋白质;这些进化速度不同,但每个人都反映了同样的进化事件。科学家可以获得更大的和更大的准确性重建任何群生物的进化发展史通过增加基因的数量调查。进化的利率差异的范围基因打开调查不同的基因的机会实现不同程度的解析树中,依靠缓慢进化的远程进化事件。甚至基因编码缓慢进化的蛋白质可以被用于重建密切相关的物种之间的进化关系,通过考试的冗余密码子替换(核苷酸替换不改变编码的氨基酸),内含子的(非编码DNA片段穿插其中的片段代码氨基酸),或其他非编码片段的基因(如之前的序列和遵循基因的编码部分);这些通常的发展速度远远超过指定的氨基酸的核苷酸。