首页    尹烨:生命科学的爆发可能像GPT一样很快到来

尹烨:生命科学的爆发可能像GPT一样很快到来

01

生命科学的爆发可能像GPT一样很快到来

上世纪80年代最开始出现抗体药物的时候,科研人员用的方法是直接打鼠源抗体,就是把小鼠身上产生的抗体直接打给人,结果100%排异。后来研发出了人鼠嵌合抗体,今天又可以通过基因重组、基因编辑等技术,在老鼠身上产生全人源化的抗体。

从这个意义上讲,本来就不存在绝对无关的物种,物种或只是人为的一种定义。某种程度上讲,所有物种的基因底层代码都是一样的。换句话说,DNA的语言,是跨越几乎所有物种的语言,它的底层是一样的,它的开关、标点符号是一样的。

生命科学的爆发可能像GPT一样很快就会到来。ChatGPT让我们明白,基因的密码是可以被自动化解读的。今天我们即使不会阿拉伯语,通过讯飞或者其它工具就可以和阿拉伯人对话。

现在测一个人的基因组,试剂成本已不到100美金,如果未来我们能把基因检测的整体成本降到这个程度,所有人都可以很容易地了解自己的基因序列,这就是生命科学非常有意思的地方。

我想说的是,一个新技术,从发明到真正实现应用是一个艰难而缓慢的过程。我们要承认,如果没有新冠疫情,mRNA疫苗要经过更漫长的审核才能上市。过去几年的核酸检测,虽然很有争议,但如果没有中国一大批相关机构开展大规模的核酸取样和检测,我们能把成本降低到混检1.2元/例吗?在美国,一份核酸检测报告要一两百美金。

当我们看到越来越多的新技术,都开始向着一个点突破的时候,科技的飓风就主宰了商业的沉浮。最典型的就是,ChatGPT出来以后,中国现在已经有了400多个AI大模型。

02

技术革命的下一站必将是生命科学

如果物理学是对的,地球的历史大概是46亿年,地球上有生命的历史大概34亿年。恐龙统治这个星球1.6亿年,而人类统治地球的时间,从农业时代开始算也就1万年,人类文明才不过五千年,文艺复兴至今也只有500年,人类真正认知宇宙才50年,我们知道ChatGPT才5个月,现在都在讨论很多个行业还能不能活下去。和浩瀚的地球相比,人类实在很渺小。归根到底,天地不仁,以万物为刍狗。这句话其实就是说,规律就是规律,对谁都一样。

这就是生物史,经历了五次大劫难后,哺乳动物在恐龙退场后登上历史舞台。恐龙没有了,哺乳动物开始从弱小走向强大。所有的科技创新都必须是边缘创新,最大的未必能活下来。适者生存,演化要和环境配合,这句话从自然界到产业界都适用。

从工业革命开始的250年来,我们先后经历了纺织和蒸汽机技术、钢材和铁路、电气和重化工业、汽车和电子计算机,现在进入到信息技术和生物技术。每一次技术革命都有一次标志性事件,比如蒸汽机之于工业革命。这次ChatGPT出来,目前估量它对我们的意义还早了一些,它的影响应该会在未来的两到三年开始真正地展现出来。

我们可能会问的问题是,人工智能来了,是否会造成大量失业?任何一次技术革命,确实会让一部分行业和就业消失,但同时会带来更多的行业和就业机会,更多的人口,更高的预期寿命,更多的文明遗迹,以及更少的战争和暴力。

回到今天,下一次的技术变革会是什么?我们经历了农业时代、工业时代、信息时代。农业时代解决的是人和粮食的关系,工业时代解决的是人和原子的关系,信息时代解决的是人和比特的关系。

技术革命的下一站必将是生命科学,生命科学的变革必将推动生命时代的到来。生命时代解决的是人和基因的关系,健康的人想长寿,长寿的人想健康,归根结底大家都是想更多体验这个世界的美好。

生命科学唯一不例外的,就是例外。这样的例外出来,我们的创新和下一代就有希望。在生命当中,基因交互之间的边界是模糊的,尤其是微生物,比如新冠病毒。新冠病毒肯定不是历史上第一个影响力这么大的病毒,只是人类第一次掌握了可以大规模精准检测和追踪变异的方法。我们有了测序仪,我们有了mRNA疫苗,可以大规模做核酸和抗原检测,把自己的状态弄明白。新冠疫情换个角度看,也是对于我们最好的一次生命科学科普。

回顾历史,社会发展从来没有确定性,在任何时刻,回头看都是确定,往前看都是不确定性。宏观上,很多时候我们无能为力,微观上必须有所作为,我们要靠提高自己的确定性来对抗环境的不确定性,这就是社会发展的状态。

创新不是无中生有,而是乱中生有,是从无到乱,再从乱到有。在科技创新当中,每一个了不起的大发明都是在特别复杂的混合环境当中长出有序,择出最优。

03

未来的竞争一定是大科学工程的竞争

丘吉尔说,“你能看到多远的过去,就能看到多远的未来”,用咱们中国的话叫“不谋万事者,不足谋一时,不谋全局者,不足谋一域”。所以,伟大的想法总是类似的。某种程度上,我们看不清楚未来的时候,要回顾历史,历史学就是未来学。

我想和大家回顾一下人类基因组计划(Human Genome Project, HGP),这是美国于1985年提出来的。当时美国人想对抗肿瘤,经历多次失败之后,人们发现如果不测基因组根本无法了解癌症的致病机理,只通过化疗放疗手术也无法从根本上解决癌症。但那个时候测一个人的基因组要300亿美金。肯尼迪说,登月不是因为它简单,而是因为它难。同样的道理,人类基因组计划的实施也不是因为它简单,而是因为它难。

未来的竞争一定是大科学工程的竞争。很多人记得曼哈顿原子弹计划、阿波罗登月计划、两弹一星计划、航天计划,这些都叫大科学工程。人类基因组计划一旦完成,从基因组到生物学、到健康、到社会领域都会有强大的平台支撑,更重要的是它能提供六大支柱,资源、技术发展、计算生物学、教育、培训、社会伦理和法律问题,也都会与之俱来。

人类基因组测序的试剂成本最低已仅仅99美金,20年时间,成本下降了一千万倍,这意味着每一个人都可以测基因组序列的时候不远了。

04

IT第一次被BT带着走

生命科学为什么进步?工欲善其事,必先利其器。华大自己内部有一句话,要评价是否是高科技公司,先看它是否是高效率公司。高效率公司必然是低成本的,低成本的前提是自己有工具。所以工具自主、工具决定论实际上是最主要的,不管今天数据模型多大,谁得到数据的成本最低,谁就赢了。

华大去年发了三篇封面文章,测的细胞数分别是20万、114万、1200万,数据量是10TB、20TB、50TB。也就是说,BT(生物技术)的发展对IT(信息技术)提出更高的要求,储存就是一个大问题。这是IT第一次被BT带着走,因为我们现在没有地方存数据。既要在软件上压缩,还要在硬件上扩容,还要做存储,这些问题就是当前的挑战。只要我们开始拉着IT走,生命科学差不多就能引领全球科技的发展。

最高效率的大数据存储设备是什么?就是DNA。1克DNA存储的数据能达到一个E(一个E相当于一千个P,一个P相当于一千个T,一个T相当于一千个G)的级别。目前人类已知所有的数据加一起,大概不超过30公斤DNA的存储量,这就是未来一个超高密度的存储载体。DNA存储有三个优点,第一个就是密度高;第二个保存时间(理论上可以)无限长;最后一个就是DNA复制几乎是不花钱的。

在生命科学领域,中国是追美国最紧的。你可以看到PD-1/PD-L1免疫细胞治疗、DNA测序合成,这些领域在中国和美国都是并驾齐驱的,甚至很多领域还能压美国半头。从这个意义上讲,生命科学领域我们还有很多机会。

05

预测未来最好的方式就是创造未来

《小王子》中有句话让我印象深刻——“如果你想让人们造一艘船,不要雇人去收集木头,不要发号施令、也不要分配任务,而是去激发他们对海洋的渴望。”

创新是自由之子,却是繁荣之母。越是颠覆性的创新,越是设计不出来的,因为创新就是做以前没有的事情,你要是都能设计出来的就一定不是创新。我们的工程可以设计,科技一定不可以设计。怎么营造一个创新的氛围,是最需要思考的事情。

总结一下,认知生命的重点是认知什么?

第一,探索自然的宏伟,感受人类的卑微;

第二,了解造物的神奇,认知众生的平等;

最后,悲天悯人的共情,超脱生死的达观。

什么叫技术?过去异想天开,今天勉为其难,未来习以为常的,就叫技术。但希望大家能够明白,已知圈越大,未知圈更大。任何技术,包括生命科学,都不能解决人类的所有问题,我们更不能唯技术论,忽略了我们的道德、伦理、宗教、文化和法律。切记,没有科技的人文可能是愚昧的,但是没有人文的科技一定是危险的。

纵使所有的人不能穿越星际,我不希望有一个力量可以阻碍我们去仰望星空,毕竟我们人类基本的神性就是相信相信的力量。这是人类的信仰,既是我们已见之事的实底,又是未见之事的确证,这个东西任何人不可以被剥夺掉。所有人都不能掌控未来,但是未来就是当下的积分,每个人都可以把握当下,当下就是未来的微分。

所以,谁把握了当下,谁就是把握了未来。过去的事已经发生,未来的事还没到来,但是这一刻才最宝贵。你怎么过今天,你就怎么过今生。预测未来最好的方式就是创造未来。