2000年是植物科学的一个标志性年份。就在这一年,全世界科学家终于得到了拟南芥基因组的完整序列,他们一直都在盼望这一结果。在各大学和生物科技公司工作的300多名研究者用了4年时间,确定了组成拟南芥DNA的大约1亿2000万个核苷酸的顺序。这一工作花费了约7000万美元。(在今天看来,这一工程的花费和耗用的整体人力多得简直难以想象,因为技术的进步已经使单独一个实验室在不到一周的时间内就能测定拟南芥基因组的全序列,花费还不到初次测序时的千分之一。)
早在1990年,拟南芥就被美国国家科学基金会选中,作为打算测定基因组全序列的第一种植物,这是因为拟南芥独特的演化特征使其DNA分子比其他植物要小。虽然拟南芥含有与大多数动植物数目相仿的基因(约25,000个),在其DNA分子中却几乎不含被叫作非编码DNA的成分,这就让确定拟南芥的基因组序列相对容易一些。非编码DNA在基因组中到处都是,它可位于基因之间或染色体末端,甚至在一个基因内部也可找到。按比例来说的话,拟南芥的1亿2000万个核苷酸含有大约25,000个基因,而小麦的160亿个核苷酸中也含有相同数目的基因(人类则在29亿个核苷酸中含有大约22,000个基因,比拟南芥这种小植物略少)。因为拟南芥的基因组小,植株个头小,繁殖一代的时间短,在刚过去的20世纪中,它在全世界得到了广泛研究。对这种常见杂草所做的研究因而在许多领域获得了重要的突破性成果。几乎全部25,000个拟南芥基因都能在那些有重要农业价值或经济价值的植物——比如棉花和马铃薯中找到。这意味着在拟南芥基因组中确定的任何基因(比如说一个能抵抗某种侵害植物的细菌的基因)都能用基因工程的方法转到作物中,以提高其产量。
拟南芥和人类基因组的测序工作使我们获得了许多惊人发现。和本章所讲的话题最为相关的是,人们发现拟南芥基因组含有好多与人类疾病和残疾相关的基因。(另一方面,人类基因组也含有一些和植物发育相关的基因,比如一组叫作COP9信号小体的基因介导植物对光的反应。)科学家一边破解拟南芥的DNA序列,一边就发现其基因组含有BRCA基因(与遗传病乳腺癌有关)、CFTR基因(与囊肿性纤维化有关)和很多与听力缺陷有关的基因。
这里需要澄清一点:尽管基因常常用和它们相关的疾病来命名,但并不是基因本身引发了这些疾病或机能缺陷。只有在突变导致基因不能正常发挥功能时,才产生这些疾病。所谓突变,是构成基因的核苷酸序列的改变,可以破坏DNA编码。我们不妨再复习一下人类生理的基础知识:人体的DNA编码仅由四种不同的核苷酸组成,其缩写分别为A,T,C和G。四种核苷酸的特定组合,为不同的蛋白质提供了编码。少数核苷酸的突变或删除可以导致编码发生灾难性的改变。BRCA是这样一类基因:如果发生突变或其他破坏,可以引发乳腺癌,但在正常情况下,它们在决定细胞的分裂时间中起着关键作用。如果BRCA基因不能正常工作,细胞就会分裂得过于频繁,这就引发了癌症。CFTR基因在突变或遭到其他破坏之后,则可引致囊肿性纤维化,但在正常情况下却调控氯离子的跨细胞膜运输。如果由其编码的蛋白质不能正常工作,肺(及其他器官)中的氯离子运输会被阻断,引发浓稠黏液的积聚,临床上就表现为一种呼吸系统疾病。
这些基因的名字和它们的生物学功能无关,只和临床表现有关。那么这些基因在绿色植物中又有何功能呢?拟南芥基因组之所以含有BRCA,CFTR和几百个其他与人类疾病或机能缺陷有关的基因,是因为它们是基本的细胞生理所必需的。早在15亿年前,在作为植物和动物的共同演化祖先的单细胞生物身上,这些基因就已经演化出来了。当然,拟南芥所含有的这些人类“疾病基因”的对应基因如果发生突变,也会破坏相关的植物生理功能。比如说,拟南芥乳腺癌基因一旦突变,就会引发拟南芥植株的干细胞(没错,拟南芥也有干细胞)比正常干细胞分裂更多次,于是整株植物会对辐射高度敏感,这两种表现也都是人类癌症的标志特征。
这就让我们能理解什么是“聋子”基因了——在突变之后可以引发人类耳聋的基因。全世界的很多实验室已经确定了50多个人类“聋子”基因,其中至少有10个在拟南芥基因组中也存在。正如BRCA基因在拟南芥中的存在并不意味着植株有乳房一样,在拟南芥中发现聋子基因也不意味着植物有听觉。人类“聋子”基因有一种细胞学功能,可以让耳朵正常发挥作用,一旦这些基因发生突变,就会造成听力丧失。
在和听力缺陷相关的拟南芥基因中,有4个编码非常相似的蛋白质,叫作肌球蛋白。已知肌球蛋白是运动蛋白,它们仿佛是“纳米发动机”,能驱动各种蛋白质和细胞器绕着细胞中心运动。有一种肌球蛋白与听力有关,它有助于内耳毛细胞的形成。如果这种肌球蛋白发生突变,毛细胞的形态就不正常,也因此不会对声波做出反应。对植物而言,我们可以在其根上找到毛状的附属物,这些被恰切地称作“根毛”的结构可以帮助根从土壤中吸取水分和矿物质。拟南芥的4个“聋子”肌球蛋白基因中的某一个发生突变,会导致根毛不能正常伸长,植株从土壤中吸收水分的效率也就大大降低。
在植物和人类中都存在的肌球蛋白基因和其他基因在细胞层次上具有相似的功能。但如果把所有细胞装配在一起,对某一特定的生物体来说,功能就不同了。我们需要肌球蛋白帮助内耳毛发挥正常功能,最终帮助我们具备听力;植物却需要肌球蛋白保证根毛发挥正常功能,使它们能从土壤中饮水并找到养分。