线粒体脱氧核糖核酸(英文名:mitochondrial DNA,缩写:mtDNA)即存在于真核生物细胞细胞器——线粒体中的基因组,线粒体DNA的结构形式多样,按结构(即环状与线性)、大小、内含子或质粒样结构的存在以及遗传物质是否是单个分子还是同质或异质分子的集合主要分为6种。按物种来源分为人类线粒体DNA、动物线粒体DNA、植物线粒体DNA、真菌线粒体DNA和原生生物线粒体DNA。
线粒体DNA可发挥复制和转录功能。线粒体脱氧核糖核酸有D环复制、O复制、滚环复制等复制方式,复制的活跃程度与线粒体DNA同细胞核的距离有关,距离细胞核较近时更活跃,通常认为线粒体DNA具有母系遗传、遗传瓶颈、阈值效应、高突变率等遗传特征。线粒体DNA突变类型主要有点突变、缺失插入和线粒体DNA拷贝数目突变。线粒体DNA突变可引发皮尔逊综合征、利氏综合征、糖尿病、阿尔兹海默症和帕金森病等多种疾病。
线粒体DNA可用于临床疾病诊断、法医学母系追踪、生物学和系统生物学及物种鉴定等多个领域。有一些线粒体数据库已建立并用于收集特定的线粒体脱氧核糖核酸,人类线粒体DNA数据库如MITOMAP等;其他一些动物的线粒体数据库,如鱼类线粒体DNA数据库MitoFish等。
起源发现
起源
关于线粒体DNA的起源业内普遍认可的是美国生物学家马古利斯(Lynn Margulis)于1985年提出的内共生学说(symbiosis hypothesis)。该学说认为,线粒体的祖先是一种可进行三羧酸循环和电子传递的革兰氏阴性菌,被原始真核细胞吞噬后与宿主间形成互利的共生关系。宿主细胞利用寄生菌的呼吸作用获得能量,寄生菌可从宿主处获得更多的营养,寄生菌的遗传信息大部分转移到细胞核上,留在原线粒体内的遗传信息大大减少,寄生菌逐渐演变为线粒体。
随后也有相关研究进一步证实了这一假说:线粒体脱氧核糖核酸源自被现代真核细胞祖先吞噬的细菌的环状基因组。数十亿年前,一种类似于α-变形菌的古细菌被另一种自由生活的真核生物吞噬并保留,二者发生次级内共生,并且在长期的共生过程中逐渐演化,形成了线粒体。从此自该事件发生以来,线粒体编码的基因要么转移到宿主细胞核,要么完全丢失。这种内共生和线粒体基因组随后的进化是生物史上最重要的过程之一,产生了真核生命。据推测,线粒体进化促进了复杂性和多细胞性进化所需的更高能量输出。
某些物种中存在缺乏基因组的线粒体,这表明线粒体脱氧核糖核酸可能完全转移到细胞核,但仍有一些线粒体基因被保留,保留的原因存在争议:一个假设原因是一些线粒体基因能够将疏水蛋白产物靶向输送给线粒体,因此,这些基因无法转移到细胞核;另一个假设原因是线粒体氧化还原调节的共定位控制使一些线粒体基因保留,没有转移到细胞核。
发现
20世纪60年代由斯德哥尔摩大学的一对夫妇玛吉特·麦克·纳斯(Margit M. K. Nass)和西尔万·纳斯(Sylvan Nass)通过电子显微镜发现线粒体内线状内含物,经证实内含脱氧核糖核酸,大约同一时间,维也纳大学生物化学研究所艾伦·赫斯布伦纳(Ellen Haslbrunner)、汉斯·塔皮(Hans Tuppy)和哥特弗里德·沙茨(Gottfried Schatz)三位科学家试图探索染色体外基因突变的生化基础,通过对高度纯化的线粒体组分进行生化分析发现其DNA含量,证实mtDNA的存在。
结构特点
线粒体是一种除哺乳动物成熟红细胞以外的真核生物中均存在的细胞器,位于细胞质中,线粒体的基因组称为线粒体脱氧核糖核酸。一个细胞可含数百甚至数千个线粒体,而一个线粒体又可含数个线粒体DNA分子。因此,一个细胞有多达数千个线粒体DNA分子。
线粒体DNA为双环状结构,每个线粒体DNA含16569个核苷酸碱基对。其碱基对编码13个与线粒体能量产生通路相关的氧化磷酸化(OXPHOS)相关的蛋白质,包括细胞色素c氧化酶的3个亚单位、细胞色素b、ATP合成酶的亚单位6和亚单位8以及NADH脱氨酶的7种亚单位。人类线粒体DNA还编码线粒体蛋白合成系统的22S转运RNA(22S tRNA)、12S核糖体核糖核酸(12S rRNA)和16S核糖体核糖核酸(16S rRNA)。
分类
按基因组类型分类
线粒体DNA结构形式多样,按结构(即环状与线性)、大小、内含子或质粒样结构的存在以及遗传物质是否是单个分子还是同质或异质分子的集合主要分为6种:
①圆形分子,大小从11~28kbp,如大多数动物的线粒体脱氧核糖核酸属于此类;
②圆形分子,大小从22~1000kbp,常见于维管植物,如尖针杆藻(Synedra acus)、绿藻门(Chlorophyceae)和红藻(Rhodophyta)等。
③大于22kbp的圆形分子,同时存在质粒样分子,常见于真菌和许多高等植物;
④圆形非均质分子团,通常一个线粒体里有几个不同的圆形DNA分子,如寄生生物菱形动物门(Rhombozoa)的线粒体DNA是圆形,分子大小为1~2kbp,每个线粒体DNA分子包含一个开放的阅读框(简称ORF,DNA分子中可以编码多肽或蛋白的核苷酸序列),每个细胞有100~1000个线粒体DNA分子;
⑤线性均质分子团:线性均质分子是线状,且分子大小相同,常见于一些纤毛门(纤毛虫)、疟原虫(Plasmodium)及其近缘种、真菌、衣藻属(Chlamydomonas)及其近缘种等,如伪尖毛虫(Oxytricha trifallax)的线粒体脱氧核糖核酸包括一条约70kbp的线性染色体和一个约5kbp的线性质粒;
⑥线性非均质分子团,见于阿米巴原虫(Amoebidium parasiticum)、纤细裸藻(Euglena gracilis)等裸藻、长毛虫(Alatina moseri)等,如长毛虫的线粒体DNA有8个线性DNA分子组成,大小从2.9~4.6kbp不等,共18个基因。
按物种来源分类
动物线粒体DNA
动物线粒体DNA多为环状DNA分子,双链,分子大小约为14000~20000bp。但已发现的生物中如领鞭毛虫(Monosiga brevicollis),其线粒体脱氧核糖核酸长至76568bp,而孑遗疟虫(Plasmodium reichenowi)的线粒体DNA仅5966bp。
除少数例外,动物的线粒体DNA中有2个非编码区,且有37个基因:13个基因编码NADH脱氢酶亚基、细胞色素c氧化酶亚基、ATP合成酶亚基、细胞色素b脱氢辅酶等与氧化磷酸化相关的蛋白质,22个基因编码转运RNA,2个基因编码rRNA。
2020年2月,研究发现鲑生粘孢虫(Henneguya salminicola)缺乏线粒体脱氧核糖核酸,其参与有氧呼吸或线粒体DNA复制的基因缺失,但保留了被认为与线粒体相关的细胞器的结构,这是已知的第一个不存在有氧呼吸并且完全不依赖氧气生活的多细胞生物。
植物线粒体DNA
植物体中的线粒体DNA比动物体的线粒体DNA大得多,而且各植物之间线粒体DNA分子大小差异变动很大,植物线粒体DNA分子最小的超过200kbp,较大的如香瓜线粒体DNA分子可达2600kbp,超过大肠杆菌整个基因组的一半;亲缘关系较远的植物间线粒体脱氧核糖核酸分子大小可相差很大;同一科不同植物种间线粒体DNA分子大小也可能差异较大,如在葫芦科(Cucurbitales)中,西瓜线粒体DNA分子大小仅有330kbp,而黄瓜线粒体DNA分子大小为1500kbp,甜瓜可达2600kbp。
真菌线粒体DNA
真菌的线粒体DNA为闭合环形双链,基因组大小通常为18~78kbp,酿酒酵母(Saccharomyces cerevisiae)的线粒体DNA较长,为84kbp。真菌的线粒体脱氧核糖核酸基因含量和大小也存在很大差异,如线虫草属(Ophiocordyceps)中的拟黑虫草(Ophiocordyceps nigrella)、高原线虫草(Ophiocordyceps highlandensis FSXU0155)、Ophiocordycep ssp. FSXU0164,3种虫草的线粒体DNA大小从163kb到348kb不等,AT(腺嘌呤和胸腺)含量高达60%以上;傻松茸(Tricholoma bakamatsutake)的线粒体脱氧核糖核酸全长122565bp,AT含量高达78.5%。
真菌线粒体DNA通常包括多个基因,可编码呼吸链亚基、ATP合成酶复合物亚基、rRNA和转运RNA。真菌线粒体DNA具有丰富的多态性。
原生生物线粒体DNA
原生动物界线粒体DNA更接近植物,基因组长度为15~47kbp,含编码细胞色素氧化酶等蛋白质的基因及编码tRNA和2个rRNA的基因。原生动物线粒体DNA的tRNA仅能识别mRNA链上一部分密码子,不能满足线粒体蛋白质合成需要,如卡氏棘变形虫( Acanthamoeba castellanii)、盘基网柄菌(Dictyostelium discoideum)以及双小核草履虫(草覆虫 aurelia)和梨形四膜虫(Tetrahymena pyriformis),它们的线粒体脱氧核糖核酸编码转运RNA数量远少于翻译过程中所需tRNA。
原生动物界线粒体DNA的rRNA基因可能会出现异常,如利什曼原虫(Leishmania),其线粒体DNA的9s rRNA和12s rRNA基因的二级结构仅包含一部分已知的保守序列,均出现高度变异;梨形四膜虫(Tetrahymena pyrifomis Ehrenberg)的两个rRNA基因均为断裂重排基因。
人类线粒体DNA
人的线粒体DNA呈环状,分子大小相对较小,由16569个核苷酸碱基对组成。人线粒体DNA分为重链和轻链共两条链,重链富含鸟嘌呤,编码氧化磷酸化系统的12个亚基、两种rRNA(12S 和 16S)和14个转运RNA。轻链编码1个亚基和8个tRNA。因此,人线粒体脱氧核糖核酸总共编码2个rRNA、22个tRNA和13个蛋白质,都参与氧化磷酸化过程,利用氧气和单糖生成三磷酸腺苷(ATP),为细胞的提供能量。这37个基因是线粒体保证其正常功能所必需的。其中rRNA和tRNA是DNA的化学表亲,有助于将氨基酸组装成功能蛋白质。
人线粒体DNA相较细胞核DNA有如下特点:
主要功能
线粒体DNA可发挥复制和转录功能。
复制
线粒体DNA的复制与细胞核DNA复制方式相同,按D环方式复制,由DNA 聚合酶γ(DNA polymeraseγ)催化合成。复制时先合成引物。复制起点位于线粒体DNA环状双链上,距离很近。这两条链的复制不是同步进行的,外环链先复制,内环链晚些再开始复制。复制开始时,先在一个复制起始点打开双链,合成第一个引物后,以内环为模板,脱氧核糖核苷三磷酸(dNTP)为底物,指导合成外环,到第二个复制起始点时,第二个反向引物方合成,并以外环为模板进行反向延伸复制内环,从而完成环状双链脱氧核糖核酸的复制。从第一个起始点开始的新链合成进行到一定阶段,亲代外环模板不断被膨出形如字母“D”的结构,因此称为D环复制(D-loop DNA复制)。
除D环复制外,线粒体DNA还有O复制、滚环复制等复制方式,不同环境下,相同的细胞可以以任何一种或几种方式共同复制,其调节机制不明。在一个细胞周期内,有的线粒体DNA分子并不发生复制,有的却可复制多次;线粒体DNA复制的活跃程度与距离细胞核的距离有关,在线粒体距离细胞核较近时更活跃,当线粒体距离细胞核较远,位于细胞外围区域时,线粒体DNAA几乎不能发生复制。
转录
线粒体脱氧核糖核酸的转录类似于原核生物的转录,在线粒体核糖核酸聚合酶的作用下进行。转录分别从重链启动子和轻链启动子处开始,重链的转录起始点有两个,重链转录生成初级转录物线粒体DNA I和Ⅱ,均为多顺反子(poly-cistron)。经剪力加工后,初级转录物I、Ⅱ和轻链转录物形成2个rRNA、22个转运RNA和13个mRNA,其余不含有用信息的部分被很快降解。加工后的mRNA5’端无帽,但3’端有约55个腺苷酸构成的尾部。核基因编码的NRF-1、NRF-2、SP-1、YY1、CREB等转录活化因子和PGC-1、PRC等协同活化因子等蛋白质及相关的激素可调节线粒体脱氧核糖核酸转录。
线粒体DNA的遗传特征
线粒体DNA具有半自主性、遗传密码和通用密码不同、母系遗传、遗传瓶颈、阈值效应、高突变率等遗传特征。各自特征的具体内容如下:
半自主性
线粒体DNA能够自主复制、转录和翻译,但因为其维持结构和功能的大分子配位化合物和大多数氧化磷酸化酶的蛋白质亚单位均由细胞核DNA编码,所以,线粒体DNA 的功能受细胞核DNA影响。
遗传密码和通用密码不同
线粒体DNA的遗传密码和通用密码不同,如UGA编码色氨酸,而终止信号,转运RNA兼用性较强,仅用22个tRNA识别多达48个密码子。
母系遗传
线粒体脱氧核糖核酸通常是母系遗传,完全遗传白卵母细胞的胞质。卵细胞中线粒体DNA数量巨多,而精子中线粒体DNA数量极少,受精卵时,精子中线粒体DNA几乎不能进入受精卵,因此,受精卵中绝大多数甚至全部线粒体DNA都来自卵子,双亲遗传物质的传递是不等量的,因此,线粒体遗传病的传递方式与格雷戈尔·孟德尔遗传不符,而是表现为母系遗传,即母亲将线粒体DNA传递给她的子女,但子代中只有女儿能将其线粒体DNA传递给孙代。
根据现代分子遗传学研究,有观点认为现代人类起源于一个大约生活在20万年前的非洲女性,已知所有人类的线粒体DNA都起源于非洲的单一人群。相关论文发出后引发舆论热议,媒体借用圣经故事,将此共同的母系祖先称为“线粒体夏娃”(mt-Eve),这一假说则称为“夏娃假说”。
遗传瓶颈
随着卵母细胞的成熟,人类卵母细胞中线粒体数呈急剧下降,从约10万个降至不超过100个,这称为“遗传瓶颈”,这种现象极大降低了母系线粒体中突变基因遗传给子代的可能。若仍有含有突变基因的线粒体遗传给子代,则该线粒体在子代发育过程中不断扩增,最终成为个别组织细胞中线粒体的主要类型。
阈值效应
线粒体脱氧核糖核酸遗传具有阈值效应,即机体只有在突变线粒体DNA达到一定比例时才会出现受损的表型。这与线粒体在细胞分裂过程中是随机分配至子代细胞有关。
若突变型和野生型线粒体共存于一种细胞或组织,组织细胞对能量的需求及突变型线粒体所占的比例共同决定疾病表型是否出现及其严重程度,突变线粒体所占比例越高,所在组织细胞对能量需求越大,疾病表型就越明显。
若一种组织或细胞中的线粒体全部是带有相同突变基因的线粒体,组织器官对能量代谢的需求大小与疾病表型是否出现及其严重程度有关,能量需求越高的组织发病的概率更大也更严重。
高突变率
线粒体电子传递链中进行的OXPHOS是细胞内产生活性氧自南基(ROS)的主要场所。线粒体DNA很接近ROS产生的部位,因此长期暴露于ROS。同时,线粒体DNA的结构为裸露的环状双链,没有组蛋白保护,没有内含子或非编码序列,以及有限的DNA损伤修复能力,因此,相对于nDNA,线粒体DNA具有高的突变率。线粒体DNA的氧化损伤率比nDNA高10倍以上,突变率比n脱氧核糖核酸高10~100倍。鼠的肝细胞中,2'-脱氧鸟苷(dG)的自由基加成物8-氧-脱氧鸟苷(8-oxo-dG)在线粒体DNA中的水平比在nDNA中高16倍。
特殊遗传
随着学术界对于线粒体DNA研究的不断深入,有研究在人类中已发现个别父系遗传的例子。如1983年有研究报告称发现30余个家族中有3例病例显示父系遗传的证据,2002年丹麦学者发表的研究结果则直接称发现了一例父系遗传的线粒体突变病,而导致该病的线粒体DNA基因ND2片段缺失并通过父系遗传。
2018年,美国辛辛那提儿童医院医疗中心的黄涛生研究团队,发现了三个不相关的多代家系的线粒体DNA双亲本遗传的多个实例,这一发现颠覆了人们对母系遗传的传统认知,证明线粒体DNA父系遗传确实在人类中存在。黄涛生团队根据研究样本数据提出,线粒体脱氧核糖核酸的父系遗传发生概率约为0.02%。
自然界中,除人类外已发现确定存在线粒体DNA出现父系遗传的仅有个别物种,如裸子植物中的南洋杉科(Araucariaceae)、杉科(Taxodiaceae)、柏科(Cupressaceae)和三尖杉科(Cephalotaxaceae)植物。
另外,蚌目(Unionoida)、贻贝目(Mytilida)和帘蛤目(Veneroida)等瓣鳃纲软体动物门中存在线粒体DNA的双重单亲遗传,雌性体细胞和配子中均为F型的线粒体DNA,而雄性的体细胞中具有F型线粒体DNA,但生殖细胞中具有M型线粒体脱氧核糖核酸,所有子代都会遗传雌性线粒体,而雄性后代可稳定遗传来自雄性父代精子的线粒体。
线粒体DNA突变
线粒体DNA突变是指线粒体DNA分子的碱基顺序和数目发生变化。线粒体DNA突变类型主要有点突变、缺失插入和线粒体DNA拷贝数目突变。
点突变
点突变发生的位置不同,所产生的表型效应也不同。因点突变引起的疾病有很多,如线粒体脑肌病DL-乳酸中毒、母系遗传的肌病及心肌病、肌阵挛性癫痫伴破碎红纤维病(MERRF综合征)等。
线粒体DNA缺失突变
线粒体DNA突变中较常见的是缺失突变。涉及多个基因的大片段的缺失可导致线粒体氧化磷酸化功能下降,ATP产生明显减少,组织器官的功能进而受到影响。引起线粒体DNA缺失的原因可能是线粒体DNA分子中同向重复序列的滑动复制或同源重组,由此引发的疾病包括慢性进行性眼外肌瘫痪、KSS等。
线粒体DNA拷贝数目突变
线粒体DNA拷贝数目突变指线粒体DNA的分子量大幅减少,这种突变类型较少见,仅见于一些致死性婴儿呼吸障碍、DL-乳酸中毒或肌肉、肝、肾衰竭的病例。线粒体脱氧核糖核酸数量减少的遗传方式通常为常染色体显性或隐性遗传,属于基因缺陷所致线粒体功能障碍。
线粒体基因病
1990年,美国遗传学家麦库西克(McKusick)根据医学遗传学的新进展提出一种新类型遗传病即线粒体基因病,它是指由线粒体DNA发生突变所致的遗传病,随同线粒体传递,呈细胞质遗传。
线粒体DNA基因病是累及多系统组织器官的疾病,因与能量代谢有关,中枢神经系统和骨骼肌等对能量依赖性强的组织常出现病症。Leber遗传性视神经病(LHON)、皮尔逊综合征、利氏综合征、卡恩斯-赛尔综合征、周期性呕吐综合征、细胞色素c氧化酶缺乏症等均与线粒体脱氧核糖核酸突变有关,线粒体突变也可能导致肌肉无力和疼痛、糖尿病、阿尔兹海默症和帕金森病等许多常见的临床疾病,也与衰老和癌症有关。临床体征和严重程度取决于线粒体DNA突变类型、突变DNA比例以及受累组织分布。
遗传性疾病
线粒体基因病在遗传方面导致的病症,主要包括Leber遗传性视神经病(LHON)、神经病-共济失调-色素性视网膜炎综合征(NARP)和糖尿病和耳聋(MIDD)等。
Leber遗传性视神经病与MT-ND1、MT-ND4、MT-ND4L和MT-ND6等线粒体脱氧核糖核酸基因突变有关,主要影响呼吸链功能,主要表现为视力异常,男性多发,由母系遗传,多在15~35岁出现视力下降,严重病例最终导致视力丧失。通常通过临床症状进行诊断,没有特别有效的治疗手段,艾地苯醌对早期患者有一定疗效。
皮尔逊综合征与线粒体DNA编码的核糖体RNA(称为RNR1)中的同质突变有关,临床主要表现为耳聋,常发生在儿童已经会说话之后,因此称语后耳聋,临床症状与使用特定类型的抗生素有关,环境因素也会影响与线粒体突变相关的表型。
神经病-脊髓小脑性共济失调色素性视网膜炎综合征与线粒体基因MT-ATP6的突变有关,MT-ATP6突变基因改变ATP合成酶的结构或功能,降低线粒体制造ATP的能力。
线粒体糖尿病和耳聋与线粒体基因MT-TL1、MT-TK和MT-TE等的突变有关,表现为糖尿病,有时还会出现听力损失,尤其是高音听力损失。MT-TL1、MT-TK和MT-TE基因提供了制造转运RNA分子的指令,这对于线粒体内的蛋白质生产至关重要。这些基因突变会减缓线粒体中蛋白质的产生并损害其功能,降低线粒体帮助触发胰岛素释放的能力。
代谢性疾病
线粒体基因病在代谢方面导致的病症代谢性疾病,包括与线粒体脱氧核糖核酸点突变相关的高血压、糖尿病和家族性高胆固醇血症等。
神经退行性疾病
此外,线粒体基因病在神经系统方面导致的神经退行性疾病主要与衰老有关,包括帕金森病、阿尔兹海默症等,发生原因包括缺失、点突变和重排等。
由线粒体DNA缺失导致的相关疾病发展进程与衰老有关。随着年龄增长逐渐加重,缺失比例逐渐增多,导致机体氧化磷酸化功能逐渐减弱。有研究发现老年人组织中存在高达12处线粒体DNA缺失,其中4977bp缺失较常见,在黄斑、心肌等处均可见。而线粒体脱氧核糖核酸重排也与年龄有关,一般45岁以后随年龄增长而增加。
线粒体DNA点突变是导致衰老相关的神经退行性疾病的主要原因。如研究发现线粒体DNA中至少五个基因(MT-ND1、MT-ND5、MT-TH、MT-TL1和MT-TV)的突变可导致线粒体脑肌病、乳酸性酸中毒和中风样发作(MELAS),这些基因均与氧化磷酸化所必需的大型酶复合物和制造tRNA分子的指令相关。
阿尔兹海默症是最常见的记忆和认知衰退神经退行性疾病之一,其被认为可能与线粒体DNA突变有关,可通过基因治疗将致病线粒体脱氧核糖核酸基因数目降低至发病阈值以下。
与癌症的关系
体细胞线粒体DNA突变与各种形式的癌症之间存在关联。如膀胱癌细胞中存在大量D环区域的突变,且线粒体DNA中的单核苷酸重复序列易发生缺失。同时也观察到了在其他基因中的缺失现象,如ND2、ATP酶8和C0III基因;肺癌组织中线粒体DNA突变为随机发生,点突变占绝大多数,也有插入突变和缺失突变。
应用领域
疾病诊断
多种疾病与线粒体DNA突变有关,这些疾病的致病机理及相关突变基因的发现为疾病诊断提供了标志物。如线粒体DNA耗竭综合症(MDS)是一种线粒体脱氧核糖核酸合成或复制障碍,导致其数量严重减少并累及多个器官或组织的一种染色体隐性遗传病,导致此综合症的基因有12种之多,做相关基因测序,发现基因突变可确诊。
法医学
通常情况下,胚胎的线粒体是来自母亲的卵细胞,所以母亲和女儿的线粒体DNA为完全一致,而父亲的精子只提供核DNA,而不提供线粒体。不明身份的DNA图谱与潜在的母系亲属的图谱做对比,可以确定他们是否拥有相同的线粒体DNA图谱,以及他们是否有亲缘关系。线粒体DNA几乎是代代相传的,每一百万年才有大约1%的随机突变。因此,可根据这不间断的母系线索,寻找亲缘关系。
因此,法医科学家可以在核DNA严重降解的情况下使用线粒体脱氧核糖核酸检测陈旧腐败检材。如提取头发、骨骼、牙齿等较残旧的生物样本几乎检测不到核DNA,但可以检测到线粒体DNA,通过线粒体DNA多态性分析可以对这一类样本进行个体识别和亲缘鉴定。
生物进化研究
鉴于线粒体在细胞呼吸中的关键作用,线粒体DNA中的特定序列在真核生物中是相对保守的,并在进化过程中被保留下来。然而,线粒体DNA也具有相对较高的突变率,这使得它对于研究生物体的进化关系(系统发育)非常有用。生物学家可以确定并比较不同物种之间的线粒体脱氧核糖核酸序列,并利用比较结果为所检查的物种构建进化树。如利用线粒体DNA分析对中国培育的奶山羊品种和国外引进品种进行分析,通过遗传分化系数和遗传分化指数等,确定不同品种间的亲缘关系远近,推测可能的进化过程。
物种鉴定
线粒体DNA可用于鹿科动物等物种鉴定。在鱼类中最常见用于物种鉴定研究的线粒体DNA基因是线粒体细胞色素b基因(mtcyt b),具有相对高的种间差异和较低的种内差异,能够鉴别亲缘关系较近的物种。
线粒体数据库
有一些线粒体数据库已建立并用于收集特定的线粒体DNA,如人类线粒体DNA数据库MITOMAP、仰韶文化人群线粒体全基因组等古代人类线粒体DNA数据库、人类线粒体蛋白质-蛋白质相互作用的注释数据库和分析平台MitoBreak和线粒体脱氧核糖核酸断点数据库MitoBreak。
还有一些针对动物的线粒体数据库,如鱼类线粒体DNA数据库MitoFish和动物界线粒体DNA学比较数据库MITOME。
相关研究
核线粒体DNA(NUMT)是线粒体DNA插入到核基因组中的DNA片段,在鸡、猪等真核生物基因组中均有发现,鸡的核DNA中普遍存在线粒体基因16S RNA、转运RNALeu和部分ND1的同源序列;猪核DNA中发现132个NUMT,片段大小在37~4453bp,90%以上片段大小处于40~1000bp之间。
2022年,一项样本数超6.6万人的全基因组序列分析表明,人类核线粒体脱氧核糖核酸存在,在人口中的比例不到 0.1%。人核DNA中有1637种不同NUMT,其中八分之一的人拥有超罕见的NUMT。人核线粒体DNA插入线粒体DNA是一直在发生的,这是基因组进化的一种新方式。估计每4000个新生儿中就有一个人的线粒体中的一些遗传密码会插入到细胞核DNA中,这些插入细胞核DNA的线粒体DNA会遗传给下一代。这些插入核DNA的线粒体DNA偶尔会导致非常罕见的疾病,包括罕见的遗传性癌症。
参考资料
Mitochondrial DNA.medlineplus.2023-09-18
mitochondrial-dna.sciencedirect.2023-09-18
mtDNA and Mitochondrial Diseases.nature.2023-09-18
Database Commons.ngdc.2023-09-18
InterMitoBase:anannotateddatabaseandanalysisplatformofprotein.National Library of Medicine.2023-09-18
Welcome to the MitoBreak database project.mitobreak.2023-09-18
Mitome: dynamic and interactive database for comparative mitochondrial genomics in metazoan animals.ncbi.2023-09-18
The origin and early evolution of mitochondria.genomebiology.2023-09-27
isolate-dna-mitochondria.bitesizebio.2023-09-20
Scientists discovered the first animal that doesn’t need oxygen to live. It’s changing the definition of what an animal can be.edition.2023-09-18
Paternal Inheritance of Mitochondrial DNA.nejm.2023-10-17
Biparental Inheritance of Mitochondrial DNA in Humans.National Library of Medicine.2023-10-17
hereditary-optic-neuropathies.msdmanuals.2023-09-18
Leber遗传性视神经病变的临床实践指南.中华医学遗传学杂志.2023-09-18
古基因组揭示仰韶文化古代人群的母系遗传结构.中国科学院古脊椎动物与古人类研究所.2023-09-18
FASTA format.mitofish.2023-09-18