2019最值得期待生物技术有哪些?Nature采访7位专家
来源: Nature自然科研
从高分辨率成像到从零开始构建基因组尺度DNA,在接下来的一年里,生物技术领域或将迎来很多激动人心的发展。
七位专家分别预测了今年会有哪些技术进展将推动本领域向前发展。
拓展单细胞生物学
Sarah Teichmann,英国维康桑格研究所细胞遗传学主管
在过去的十年里,我们看到研究人员一次可以分类的单细胞数量有了大幅增长,并且该趋势还会继续下去,这主要是因为细胞捕获、细胞条形码技术,以及整合现有技术的方法都越来越先进了。
虽然听起来很普通,但正是数量的增长才允许我们做越来越多样的实验,并以越来越高的分辨率研究越来越复杂的样本。例如,以前我们只能关注一个人,而现在就可以同时分析20-100个人身上取到的样本了。也就是说,我们可以更好地理解群体多样性。我们还可以为更多的发育时间点、组织和个体进行细胞分类,从而提高研究的统计显著性。
我们实验室现在参与了一个项目,为横跨6个物种的25万个细胞进行分类。这个项目的结果表明,负责先天免疫反应的基因进化得很快,并且在不同物种之间有着很高的细胞间差异——这两个特性都能帮助免疫系统产生有效且精细调节过的免疫反应。
同时研究单细胞内不同基因组模块的技术也会有所发展。例如,我们不需要局限在RNA上,而是可以观察被称为染色质的蛋白质-DNA复合物是开放还是闭合的。这可以帮助我们理解细胞分化时的表观遗传学状态,以及免疫与神经系统中的表观遗传学记忆。
将单细胞基因组和表型联系起来,例如将细胞的转录组和蛋白质表达或形态联系起来,也会在方法上有所突破。我认为我们在2019年会看到更多这类发展,可能是完全通过测序也可能是结合了测序和影像的方式。事实上,我们已经看到了这两种技术在某种意义上正在趋同演变:测序的分辨率越来越高,而成像技术则向多重检测发展。
基因编辑技术的改进
Jin-Soo Kim,韩国国立首尔大学基础科学研究所基因工程中心主任、化学教授
蛋白质工程现在能推动基因工程发展了。第一代CRISPR基因编辑系统使用了Cas9核酸酶,它可以在指定的位置切开DNA。这两者的组合仍被广泛使用,但是很多经过改造的CRISPR系统把这种自然产生的核酸酶换成了其他变体,例如xCas9和SpCas9-NG。这就扩大了靶标空间——也就是基因组里可以被编辑的区域。还有些变体比第一代酶的靶向性更强,可以最大程度减小或避免脱靶效应。
去年,研究人员报告了CRISPR基因编辑技术进入临床应用会遇到的最新障碍。其中包括p53基因的启动(与癌症风险有关);意外的“中靶”现象,例如大范围删除;以及对CRISPR系统的免疫源性。为了在临床应用中使用基因编辑技术,必须首先处理这些限制性问题。其中有一些是因为DNA双链断裂。但不是所有的基因编辑酶都会造成双链断裂——“碱基编辑器”可以直接将一个DNA碱基变成另一个。因此,碱基编辑比传统的基因编辑更直接,也更高效。去年,瑞士的研究人员使用碱基编辑器修正了小鼠体内会引起苯丙酮尿症(毒素积累所致疾病)的基因突变。
但是碱基编辑器在可以编辑的序列上有限制,必须由原间隔序列临近基序的基因序列定义。蛋白质工程可以用来重新设计并改进现有的碱基编辑器,甚至可能创造出新的编辑器,例如将重组酶结合到灭活的Cas9上。和碱基编辑器一样,重组酶不会引发DNA双链断裂,但是可以将需要的序列插入到用户定义的位点。RNA引导的重组酶一定可以将基因编辑技术扩展到新的次元。
可能还要好几年才能看到基因编辑技术作为一种常规技术在临床上使用。但我们会在接下来的一两年里看到新一代的工具:毕竟对这项技术感兴趣的研究者很多,而且每天都在用。新的问题会不断出现,但崭新的解决方案也是一样,一定会给我带来惊喜。
提高显微镜分辨率
庄小威,哈佛大学化学与化学生物学教授,2019年科学突破奖(Breakthrough Prize)获得者
超高分辨率显微镜的概念验证在一二十年前刚刚出现,但到了今天,这项技术对生物学家而言已经相当常见又常用,并带来了知识的爆发。
研究中一个特别激动人心的领域就是确定基因组的三维结构和组织。越来越明显的一点是,基因组的三维结构在调控基因表达方面起着至关重要的作用。
在过去的一年里,我们报告了以纳米精度为染色质(构成染色体的结构)成像的工作,并将它和数千个不同种类细胞的序列信息关联起来。这项工作的空间分辨率比我们此前的工作要高一到两个数量级,因此我们能够观察到各个细胞将染色质组织成结构域——在不同细胞间有着相当大的差别。我们还提供了证明结构域是如何形成的证据,从而可以更好地理解染色质调控的机制。
在超高分辨率成像的领域里,我预测在染色质之外还会有显著的空间分辨率提升。大多数实验都在几十纳米的尺度下进行——很小,但是和观察的分子相比还不够小,特别是当我们要处理分子间反应的时候。但我们同时也能看到,荧光分子和成像技术的发展可以显著提高分辨率。我预计1纳米尺度的成像会成为日常。
与此同时,时间分辨率也越来越高了。现在,研究人员仍然需要在空间分辨率和成像速度之间取舍。但是有了更好的光照条件和更快的图像获取技术之后,就可以克服这些限制了。数万种基因和其他种类的分子共同塑造了细胞的行为。可以同时在基因组尺度观察到这些分子的行为为成像技术创造了强大的机会。
大脑连接图谱
曾红葵,美国艾伦脑科学研究所结构化科学执行主任
单个细胞之间的连接和不同种类的细胞之间的连接是非常复杂的。我们仅靠全局和群体尺度下的连接图谱已经不足以理解它了。所以,我们正在基于细胞种类,在单细胞尺度下绘制连接图谱。
我们可以靠“顺行”和“逆行”追踪法做到这一点,它们可以揭示从特定细胞延伸出去的结构,也就是轴突投射。我们还使用了其它基于单神经元形态学的研究方法,观察单个神经元的投射从哪里开始到哪里结束。
电子显微镜数据集的生成有了很大的进步,现在这些数据集比我们以前能得到的要大很多。例如,在霍华德·休斯医学研究所的珍利亚农场研究园区,研究人员正在绘制果蝇的所有神经元和突触的图谱。
获取图像和处理样本方面的提升是取得这些进步的关键;此外,计算力的发展也很重要。在艾伦脑科学研究所,我们正在借助机器学习算法构建小鼠大脑神经连接的虚拟图谱。
大脑中包含了极多的连接特异性。在还没有在全局和局部尺度下理解这些特异性之前,我们就只能把大脑当成一个黑匣子来理解它的行为或功能:此时我们缺乏理解神经活动和行为的物理基础。连接组学会填补这部分缺失的基础事实。
合成基因组的进步
Jef Boeke,美国纽约大学朗格尼医学中心系统遗传学研究所主任
当我发现从零开始合成一整套基因组已经成为可能的时候,我就想,这是个很好的机会,让我们可以从一个崭新的角度观察基因组的功能。
从纯科学的角度讲,很多小组都在合成简单的细菌和酵母菌的基因组上取得了进展。但是合成整个基因组仍然有着技术上的挑战,特别是哺乳动物的基因组。
减少DNA合成成本的技术会对此有所帮助,不过这项技术尚未投入市场。现在大多数DNA合成都是基于亚磷酰胺法进行的。它所能产生的核酸聚合物无论在最大长度上还是准确性上都有其极限。这个方法能像现在这样成功本身就是个奇迹。
大量公司和实验室正在探索酶催化DNA合成;和化学合成相比,这种方法可能会更快,更准确,更便宜。至今还没有公司提供这类商用分子。但是去年十月,巴黎的DNA Script公司宣布它合成了一段包含150个碱基的寡核苷酸,这和DNA合成的化学法所能实际做到的极限几乎相当了。我们都在等着听这个方向的后续报道。
此外,我们还研究出了如何组装人类染色体DNA的大型片段。通过这种方法,我们可以构造出包含10万或更多碱基的区域。现在我们会使用这种方法切割一些已知可以用来识别疾病易感性或其他表型特征的大型基因组区域。
我们可以很快地在酵母细胞中合成这些区域,这样就可以构造几十到上百种基因组变体用来测试——这是以前做不到的。我们也将能够对全基因组关联研究所分析出的和疾病易感性可能有关的上千个基因位点进行更精确的调查。这种切割策略最终可能让我们得以开始确认这些变体到底产生了什么影响。
揭示分子结构
Venki Ramakrishnan,英国医学研究委员会分子生物学实验室结构生物学家
理解结构是理解功能的关键一步。冷冻电子显微镜(cryo-EM)让研究人员使用比原先更少、纯度更低的样本就可以确定高分辨率的结构。这意味着我们不仅能看到原先不可能看到的结构,还可以着手研究更难的问题,比如蛋白质复合体的动态变化或是生物化学路径里的不同状态。
现在的冷冻电镜领域大致处于二十世纪六七十年代晶体学所处的情况。第一波技术已经产生了,但整个领域仍然在快速前进。下一代的监测器——例如英国科技设施委员会的设计工程师Nicola Guerrini和她的同事们正在开发的那种——将会提供更好的信号,让我们能够观察到更小的分子。
我们已经看到了很多激动人心的结构。例如,我们分子生物学实验室里的神经科学家Michel Goedert和结构生物学家Sjors Scheres所带领的团队观察了一种叫做tau的蛋白质所构成的丝,意外地发现它在阿尔兹海默症等不同类型的失智症下会显示出不同的蛋白质折叠方式。
另一个发展方向是样本制备。在冷冻电镜里,溶液中的一小部分分子会经过一个很细的网格,多余的分子会被擦干净,留下的一小薄层会被冷冻起来。但是在空气-水界面上的分子会变性,或者说断裂。此外,击中样本的电子可能会使分子带电,导致分子移动并变模糊。很多人都在努力减小这些效应以使样本稳定,让测量更加准确。
有了这些发展,我们就应该可以观察到细胞里和细胞表面正在进行的分子事件。我们可能可以观察到复杂的构象改变循环,例如DNA复制和剪接,并由此窥见整个分子过程。
应用人工智能和深度学习算法
Casey Greene,美国宾夕法尼亚大学佩雷尔曼医学院系统药理学与转化疗法助理教授
生命科学家已经很擅长使用深度学习软件和人工智能(AI)来构建预测性模型了。例如,一个模型可以告诉我们如何找到基因调控元素所结合的位点。但是我们现在需要一些能够揭示出更深一层知识的模型;例如,基因调控本身的细节,以及为什么某些基因特征特别重要。
接下来一年里,我最期待的是一些足够稳健,可以普遍应用到各种论文发表时所附的随机基因组数据集上的计算方法,例如迁移学习。
这种方法会首先使用和问题略微相关的数据集来学习问题的大致特征,然后再用学习到的算法来分析你真正关心的数据集。例如,在去年发表的一项研究里,我们希望利用一种罕见疾病——抗中性粒细胞胞浆抗体相关性血管炎——的数据集训练一个模型,但是并没有足够多的数据。因此,我们使用从1400多项其他研究中所获得的RNA测序数据训练了我们的模型,然后将这个模型应用到我们要研究的疾病上,并揭示出了促使疾病症状产生的免疫与代谢功能相关的基因网络。我预计很快就会看到更多这种利用迁移学习来探索新问题的论文。
我希望有一天,这些算法不仅能够为特定的场景和特定的问题提供预测性模型和答案,还可以告诉我们生物学上到底发生了什么才会产生我们所看到的数据。我预计接下来的一年会朝着这个方向迈进,但这需要投入大量技术和其他资源来帮助解读模型。要是五年之内能走到这一步的话,那就太好了。