专题:第25届中国国际高新技术成果交易会_中国高新技术论坛
中国高新技术论坛于11月15日-17日举行。深圳华大生命科学研究院副院长金鑫出席并演讲。
以下为演讲实录:
谢谢主持人的介绍,也特别感谢大会组委的邀请,让我有这个机会和各位老师、各位朋友们来分享近期我们做的一些工作。
我今天分享的题目叫做BIT与IBT,实际上就是生命科学和信息科学相互的支撑和互相的促进。这个背景图就是华大刚刚落成的全球总部,在深圳美丽的大梅沙湾畔,希望大家有兴趣可以造访我们的新总部。
什么是生命?我们早上听了各位老师从脑机接口、合成生物学很多方面阐释了生命,但是从生命的本原和信息传递角度讲,实际上传递生物信息的最基本的材料就是我们的DNA,如果我们看细胞的结构,它中间的DNA就是一代一代传承,承载生命的核心信息的这么一个编码。人类基因组上面一共有30亿的碱基,在90年代到2000年代初,全世界科学家花了13年的时间,30多亿美金才完成了第一个人的基因组图谱的绘制,前排左二的中国科学家就是我的老师杨焕明院士,他参与了图谱绘制工作。
DNA是承载生命信息和传递生命信息的基本载体,生命科学不同于物理科学和数学的科学底座和基座,生命科学领域里面今天能够称得上法则和公式的东西非常少,大家普遍认同的法则就是这一条,叫做中心法则,这个中心法则就是讲生命的信息主要是承载和传递通过DNA,DNA把它转录变成一个实时的信息,变成RNA,RNA通过翻译形成了蛋白。之前的很多工作实际上都集中在DNA层面,就像人类基因组计划,刚刚分享的老师介绍到的RNA技术的突破和新兴的应用给我们带来了mRNA疫苗和新的治疗技术。蛋白现在也是非常重要的研究领域,它是很多生命过程的重要承载者。
但是之前一直有一个问题很难回答清楚,就是我们全身这么多细胞,每一个细胞都是同一套基因组、同一套基因序列,为什么有的变成了神经细胞,有的变成皮肤细胞,有的变成肌肉细胞,这些生命信息是怎么在不同的时间和空间维度之下展开的?在这个问题之下,我们一直努力的方向就是把IT技术领域建立的方法和技术支撑到我们的生命应用当中,我们希望从生老病死的各个维度把生命尽可能的做全景、全周期、多模态的数字化,在不同的模态数字化基础之上应用到IT技术更好理解生命。而要去做数字化的解析,有一个非常重要的底层工具和核心支撑就是基因测序仪,大家知道基因测序仪不仅可以测DNA,也可以测定RNA,像基因测序仪是做多为组学数字化的工具,它是一个非常核心和关键的工具。
在20多年前,所有的基因测序仪都是有少数几个美国顶尖的公司生产和制造的,我们一直不掌握这个底层工具,直到2013年初,我们才有机会开启了基因测序仪国产化和自主制造。随着2015年推出第一款自主知识产权和自主技术平台的全国产的基因测序仪,我们把这个数字化,生命数字化的工具能力不断地在推向极致。大家如果看到我们国产的基因测序仪,它的代号和命名是非常简单的,它的后面编号就是代表了它每一天能够产生多少数据,比如最早测序仪叫做G500,后来有2000,2000个G,后面有了T1、T5、T10。我们去年有一个测序仪是T20,每天可升产出20T的数据。有了这样的平台的支撑,我们可以从一个人的基因组到百万人、千万人,未来人人基因组。我们现在拥有自己基因组数据的人还屈指可数,我们在过完完整的一生,从打开生命图谱到最后谢幕,实际上我们都没有看过生命的说明书和使用手册,未来它会变成人人具备的数据,为我们的精准医学和应用转化助力。同时基因和生命科学的承载就是大国重器,政产学研资,大家在团队里面共同促进,尤其需要国家大力支撑。我们非常有幸从2011年起承载了由四部委批复的国家基因库的建设工作,我们现在建成了生物样本库和生物信息库和基因测序平台。
我们的生命中有很多未解之谜,我昨天去我女儿的幼儿园给幼儿园小朋友讲什么是生命,什么是细胞。小朋友非常好奇,问到很多问题,几个问题把我问住了。第一个问题是细胞在哪里,为什么我看不见。我给他们讲我们每个人是由受精卵发展而来的。他问受精卵是怎么来的。我们要去解释这个问题,需要用到新的工具,需要新的法则。我们之前研究生命都是研究一套基因组,一套基因组在全身几十万亿个细胞是一样的,我们每个人的人体细胞数量,成年人大概是30万亿-50万亿,这个数量相当于目前可观测宇宙所有横行的数量,你的身体就是一个宇宙。我们以前是拿一个组织集,希望把这个RNA、DNA都给解码出来,希望用这样的方式研究肿瘤怎么发展的。我们研究一个汽车怎么运行,不可能把它打成泥浆,看里面有多少的铁、铜,多少塑料,就可以理解汽车。实际上我们要知道它里面有哪些零部件,这些零部件在空间位置上怎么组织、怎么作用,这就是我们带来新的工具支撑,叫做时空组学技术。我们最早研究生命科学用显微镜,后来做DNA研究用到测序仪,我们就是在DNA测序技术的研究上发展这个技术,我们把纳米球承载到微孔的芯片上,每个纳米球与纳米球之间有几百个纳米,这是亚细胞的尺寸,我们一个空间尺寸里有几百个纳米求获得亚细胞的信息。我们再结合整个一套样本处理的过程,将生物的组织切片和基因测序芯片进行贴合,让它们进行结合,把基因转录的信息捕获到这个芯片上去,我们经过两轮检测把基因位置的信息捕获过来,通过检测和还原,得到了空间的图谱,这个空间图谱的技术在分辨率和视场方面都是在全球技术方面有一定的领先优势。简单来讲,做一个不太形象的比喻,这个生命的照相机又是一个超广角,又是一个超长焦,就是又能拍得很精细,又能拍得很大范围,这对我们解密生命信息很关键,都是一个利器。
我们在技术发展过程中间就解析了斑马鱼从卵生长为完整的生命个体,我们解析了小鼠的胚胎怎么从受精卵发展成一个完整的小老鼠。同时在大脑方面的研究,脑科学方面的研究,我们也可以提供助力。右边是一个猕猴脑的工作。左边是一个蝾螈,它的再生能力比较强,它的端脑和端肢可以再生,我们通过这个技术解析了非常有意思的机理和机制。还有一些生命的终极问题,我们都可以用新的生命组织解析技术来去支撑。我们作为生命组学工具的开发者和生产者,我们希望为各个领域,不管是科学研究和临床应用方面的专家、老师、团队提供这样一个生命组学技术的底层支撑,让整个领域都能有更快的进展,能够把我们的生命法则最终和时空法则结合起来,形成对生命整个过程完整的理解。
接下来我再快速讲一讲BIT方面怎么用生命科学的信息、技术去帮助解决今天一些IT的问题。我们做个简单的比喻它有相似之处,生命的基因的编码是ATCG,我们用DNA编码和存储大量的信息,我们的信息增长速度远远超过去建设这个数据存储中心的速度,我们用到生命中心法则的过程是DNA可以很快速、很低成本的复制。有人做过一个测算,我们用同样的物质单位来计算,它可以存储多少数据量,我们用硅的介质,它大约是兆B级别。石墨烯材料是TB级别,用DNA是EB级别,是多个数量级存储密度提升。我们把读和写再进一步延伸到存,我们可以把图谱的知识通过一定的方式进行编码写入到DNA里面,让这个DNA长期存储,我们有很多技术可以快速解析DNA,还原成我们所知的信息,尤其是这样的存储方式是使用于长期的冷备存储的。我们自有人类文明史以来,现在传承的最久的信息就是在石头上画画,其他的语言、文字刻在书本上、存在电脑里,硬盘的寿命是否超过百年,都是一个问题,但是刻在石头上的字和画在岩壁上的画传承万年以上。另外一个可以传承万年以上的就是DNA,现在已经有多个几万年之前的古人类的DNA骸骨的化石,我们可以从中间提取到来自古人类的DNA,帮着我们解析人类究竟是如何起源和迁徙的,和以前灭绝的古人类祖先的亲戚们发生怎样的联系,进行交流和互动。现在最古的是来自70万年前的西伯利亚冻土古代马的化石DNA,它就是一个干燥的环境,它的存储成本是比较低,未来会成为非常重要的人类存储的介质。
(现场播放视频)
这就是我们用DNA存储的技术对于开国大典的一段珍贵的影像视频进行了转码和存储,在这样一个小小的试管里面,你看不到的物质可以存储复杂的影像数据。
BIT和IBT,生命科学和信息科学是近年来人类领域里面发展最快的两个方向,我们从信息技术里面得到了很多的滋养,很大程度上助力了我们对生命周期的过程和解析,同时我们利用新兴的生命和科学技术反过来支撑到信息科学的发展。随着人工智能快速的发展,到了2035年、2050年,90%的工作可能会消失了,人类在这个地球上做什么呢?至少到那个时候,大家肯定会更加关注自己和自己身边的人会不会活得健康,活得开心,这就是我们即将迎来的生命时代,希望跟大家一起携手,在华大生命科技底层技术支撑之下,更好的走进新的生命经济时代。
谢谢大家。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。