人类基因组计划草图发布二十年,我们一直在进步

人类基因组计划草图发布二十年,我们一直在进步

人类染色体,图片来源:harsehaj


知天命,与“上帝”握手

2001年2月15日和2001年2月16日,国际人类基因组测序联盟和赛莱拉生物技术公司分别在《自然》和《科学》杂志发表了人类基因组草图。人类基因组工作草图的发布被认为是人类基因组计划成功的里程碑事件,如今,距离人类基因组工作草案发表已过去20年。二十年间,由人类基因组直接或间接引领的多个行业和科学研究蓬勃发展。
事实上,人类基因组计划可以追溯到1985年。这一年,美国科学家率先提出人类基因组计划,目的是把人体内约2.5万个基因,即30亿个碱基对的密码全部进行解析。五年后,也就是1990年,这一预算达30亿美元的“生命科学登月计划”正式启动。美国、英国、法国、德国、日本和我国科学家(华大团队等)共同参与了该计划。人类基因组草图不仅是人类探索生命奥秘的重要里程碑,也是遗传医学和生物技术产业时代开启的一个标志。人类基因组草图公布之初就引起了全球多个国家领导人和民众的瞩目。2001年8月28日,时任国家主席江泽民同志在中南海接见了包括华大创始人汪建、杨焕明、于军在内的人类基因组计划6国科学家代表。汪建、杨焕明、于军等人正是推动中国参与人类基因组计划的关键人物,也正是为了参与该计划,华大集团应运而生。不仅仅是华大集团,伴随人类基因组计划而蓬勃发展的行业数不胜数,例如信息科学和计算机科学的发展以及与生物学的融合,促使了各类“组学”出现,共同构建了生命科学的“大数据”时代。为了纪念人类基因组草图发表20周年,今年二月,《科学》(2月5日)和《自然》(2月11日)杂志分别出版人类基因组计划专刊并发表了系列文章,系统分析了自2001年以来基因组研究领域的科学研究进展、药物研发、人类疾病相关研究等,在总结过去的同时,也分析了当前基因组学领域所面临的诸多难题,为未来基因组研究提供新的视角。


图片来源:NatureScience


各种“组学”飞速发展的十年

2001年,人类基因组草图发布,与此同时,也开启了组学研究的新纪元和生物医药的新时代。随后多个里程碑事件的发生,也深刻影响了该领域的发展。
2004年,宏基因组学诞生。宏基因组学的出现使得科学家们对微生物的研究不仅仅局限于那些只能够在实验室中成功培养的菌种。实验室培养技术只能够捕捉到自然界中约1%的微生物。因此,宏基因组学大大拓展了微生物领域的研究。6年后,英国《自然》杂志以封面文章形式发表了来自华大研究团队的人体肠道菌基因组研究成果。这一成果的发布开启了国内宏基因组学研究,并引领了人体肠道微生物与健康、疾病直接关联的多项研究。2008年,新一代基因测序技术诞生。在此之前,核酸测序主要依赖Sanger测序法,虽然Sanger测序法的准确率较高,但在成本、通路和测序速度上则大大限制了它的大规模应用。2008年,在《自然》杂志上发表的两篇论文介绍了新一代测序技术,与Sanger测序法相比,新一代测序技术的重要突破是通过将单个DNA分子固定在某种基质上,能够允许对上百万个不同的DNA分子同时进行测序。上述两篇发表在《自然》杂志的文章之一就来自华大。同样以封面文章形式发表,该文章报道的第一个亚洲人基因组图谱也被称为“炎黄一号”

图片来源:Nature

同样是2008年,《自然》杂志发布了首个急性髓系白血病(AML)样本的全基因组序列。通过与正常皮肤细胞样本进行比较,研究人员发现了癌细胞中的8个全新基因突变。这一突破性研究显示,利用基因组测序能够发现其他传统技术无法发现的、可能导致肿瘤发生的全新基因突变,从而提供一系列潜在的药物靶点。这项结果代表着基因组测序技术完全可以用于研究诸如癌症这样的复杂性疾病,癌症基因组测序研究从此开启。
基因组图谱虽然揭示了基因组的DNA序列,但是DNA序列并不能真正反映其所代表的功能,因此,要进一步了解这些序列的功能,研究人员需要对DNA转录产物RNA进行检测。在2008年,一系列发表在不同杂志的研究均表明,可以使用新一代高通量测序技术对转录组进行研究。其基本原理是首先通过mRNA的Poly(A)尾部分离RNA,然后将它们逆转录生成cDNA并且使用下一代测序技术对cDNA进行测序。一年后,外显子组测序进入人们的视野,成为了研究单基因疾病的有力工具。在2009年,华盛顿大学的研究团队报告了首个利用全外显子组测序发现单基因疾病致病突变的概念验证结果。外显子测序对蛋白编码序列进行深度测序的能力大幅度加快了研究人员发现致病基因的速度,尤其是在罕见病领域。同年,中国科学家汤富酬教授(第一作者)在2009 Nature Methods发布了首个对单个小鼠卵裂球(blastomere)进行的全转录组研究,这一研究的发表标志着单细胞组学的到来。由于单细胞测序在解析细胞群体异质性、鉴定新型细胞亚群、探索罕见稀少细胞方面具有独特的优势,因此被广泛应用于生物医学领域。

携手并进,引领创新

人类基因组草图发布20年,也是基因组学研究如火如荼的20年。中国,作为人类基因组计划参与国家之一,完成了其中1%的工作。当前,提到基因组学时,很难避而不谈华大。华大集团,创建于19999999分,是为了人类基因组计划而生的。20多年过去了,华大已然成为“组学”领域的王牌公司之一。在科学研究层面,华大主导或参与了多项国际项目,勇于担当历史使命,比如,2002年4月,华大研究团队在美国《科学》杂志以封面文章的形式发表中国水稻(籼稻)基因组工作框架图学术论文,该研究成果推动了后续水稻相关研究工作的开展,并促进了水稻产量的增长,为保护国家粮食安全贡献了科学力量。

图片来源:Science

2004年,由华大主导完成的家蚕基因组文章发表于美国《科学》杂志,该研究意义非凡,这是因为家蚕可视遗传性状丰富,对害虫防治等具有重要应用价值,因此一早被确定为鳞翅目昆虫基因组计划代表生物,也一直是国际资源争夺的重点,家蚕基因组框架图也是我国科学家继完成人类基因组1%测序工作、水稻基因组框架图和精细图之后,向人类贡献的第三大基因组研究成果,更是建立21世纪丝绸之路的起点和里程碑。
2017年3月,酵母基因组人工合成项目重大成果在美国《科学》杂志上以封面文章、专刊形式发表,来自华大、天津大学、清华大学的中国科学家团队完成了人工合成真核生物酿酒酵母的全部16条染色体中的4条,占完成数量的66.7%。其中,华大主导了2号染色体的从头设计与全合成(长770 KB)。人造酵母新生命的诞生,标志着合成生物学里程碑式的进展。这个领域的快速突破,将变革生物制造、医药、能源、环境、农业等领域,带来颠覆性的发展。

图片来源:Science

2018年,华大在《细胞》杂志上发表了迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人无创产前基因检测数据进行深入研究的成果,填补大规模中国人基因组学研究空白,有助于推动我国精准医学事业的发展,加速基因科技在出生缺陷、癌症、感染等领域的应用。
近年来,华大一直推动着国产测序仪器的进步。2018年,华大集团旗下子公司华大智造发布了其自主研发的超高通量基因测序仪“DNBSEQ-T7”,这也是当时全球日产数据最高的测序仪。随着产品的不断革新,也使得华大智造的测序仪成为国际上极具竞争力的产品,推动了国内测序行业的蓬勃发展。同时,在整个行业的努力下,测序成本和时间由人类基因组计划时的38亿美金、13年,到今天的500美金、24小时。二十年间,已发生了翻天覆地的变化。值得一提的是,在新冠疫情大流行初期,华大基因新型冠状病毒检测试剂盒和华大智造DNBSEQ-T7测序系统双双正式通过国家药监局应急审批程序,成为首批正式获准上市的抗击新冠疫情的检测产品。诞生于新冠抗疫的华大高通量核酸检测实验室——“火眼”实验室,已累计在海外近30个国家和地区落地超过80座


北京大兴火眼实验室

展望未来,组学定将造福全人类

回顾二十年的发展历程,由衷地感觉到技术的革新为整个人类发展、人类健康带来了诸多影响。在未来,组学的发展也定将会朝着如何更好地解析科学难题、解决临床疑难杂症等方向发展。精准医学是利用遗传信息来对人体疾病进行预防和干预。新兴的精准医学检测可用于筛查大量人群,包括对胎儿进行产前诊断、新生儿进行基因组测序、液体活检以筛查癌症和成人阿尔茨海默病的预测性检测等等。在我国,在政府政策支持和技术有保障的大背景下,组学的研究成果已经惠及了普通大众,例如,2012年,天津市启动新生儿遗传性耳聋基因检测项目,2012到2019年间,华大为约60万天津的新生儿提供了检测,覆盖率超过70%,这一项目最明显的效果就是使得天津聋人学校的生源减少了80%;同时,深圳在全国率先将无创产前基因检测纳入公卫项目,从2011年到2018年,用了8年时间实现覆盖度达90%以上。据深圳市卫健委报告,2011年至2018年,深圳唐氏综合征发生率由2011年的4.94/万上升为2018年的13.42/万,但全市唐氏儿的出生率由2011年的2.27/万下降至2018年的0.82/万。此外,基因组学的发展也显著推动了药学领域的进步。在20世纪80年代之前,大多数药物的发现源自偶然或经验,那时候人们对药物分子组成及其作用靶点通常是未知的。2001年开始,也就是在人类基因组计划之后,这一切发生了重大转变。最新的研究进展显示,近年来,美国几乎所有获得许可的药物都能非常清晰地知晓其蛋白质靶点,这将大大推动循证医学的发展。同时,自2005年以来,类似于摩尔定律的新一代测序技术的发展产生了越来越多的数据,这些组学数据的积累也为数据的储存、处理、合理应用等带来了新的挑战。围绕算法的生物信息学和计算生物学的结合也催生了生物医学的新机构形式和新市场,体现了多种学科的交叉融合。最后,还是要提到数据共享精神。当下,数据共享比以往任何时候都更重要,这种重要性在未来会更加明显,例如及时有效的数据共享在当前的新冠疫情危机中起到了至关重要的作用。在新冠疫情之初,严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)基因组序列被快速确定,并在2020年1月10日被公布,为后续的疫苗和诊断检测试剂的研发提供了至关重要的基础。

结 语 

人类基因组计划所代表的,远远不止于基因本身,后续的实践证明,其在医学、农业、工业、环境、能源等领域都存在巨大的潜力,发挥着直接或间接的影响力。浩浩荡荡二十年,基因组学的发展日新月异,前人不断的积累和持续的探索成就了今天的辉煌成绩。科学理应没有国界,数据理应得到共享,但在当前日益复杂的国际大环境下,掌握核心技术、拥有自主知识产权的仪器等才会占据主动权。在过去的二十年中,我们始终没有放弃在“组学”领域中的追求,以华大为代表的一系列机构从原来的“跟跑”、“参与”,逐渐过渡到目前的“同步”、“引领”,走出了国人自主且自信的步伐。在未来,相信会有越来越多的研究机构、企业、高校等像华大智造推出的具有自主产权的测序仪一样,也会发布一系列知识产权属于中国的仪器、技术、系统等。我们期待着未来,希望我们也能引领未来。 

参考资料:

https://science.sciencemag.org/

https://www.nature.com/

https://www.genomics.cn/


来源:https://mp.weixin.qq.com/s/iBRX-yWTZr-E3Sf_pfNT7Q

· END ·

携手合作健康生活

广东省联合精准医学研究院