机器学习如何推动结构生物学
“我看不出解决5,000块拼图和我们在实验室进行的研究有什么大区别,”哈佛医学院布拉瓦尼克研究所细胞生物学助理教授Farnung说。“我们试图从视觉上弄清楚这个过程是什么样子,然后我们就可以形成关于它如何运作的想法。”
人体中几乎所有细胞都含有相同的遗传物质,但这些细胞在发育过程中会变成什么组织类型(例如,它们会变成肝脏还是皮肤)在很大程度上取决于基因表达,基因表达决定了哪些基因被打开和关闭。基因表达受转录过程的调控,这是Farnung工作的重点。在转录过程中,分子机器读取存储在DNA内的遗传蓝图中包含的指令,并创建执行指令的分子RNA。其他分子机器读取RNA并利用这些信息制造为身体几乎所有活动提供能量的蛋白质。
Farnung研究负责转录的分子机器的结构和功能。
在接受《哈佛医学新闻》的对话时,Farnung讨论了他的工作以及机器学习如何加速他所在领域的研究。
哈佛医学新闻:您的研究试图回答的核心问题是什么?
Farnung:我总是说,我们对最小的后勤问题感兴趣。人类基因组几乎存在于每个细胞中,如果你把组成基因组的DNA拉长,它大约有两米,或六英尺半长。但这个两米长的分子必须适合细胞核,而细胞核只有几微米大小。这相当于把一条从波士顿延伸到康涅狄格州纽黑文(约150英里)的钓鱼线塞进一个足球里。为了实现这一点,我们的细胞将DNA压缩成一种叫做染色质的结构,但这样分子机器就无法再访问DNA上的基因组信息了。这就产生了冲突,因为DNA需要足够紧凑才能放入细胞核内,但分子机器必须能够访问DNA上的基因组信息。我们特别感兴趣的是可视化一种叫做RNA聚合酶II的分子机器如何获取基因组信息并将DNA转录成RNA的过程。
HMNews:您使用什么技术来实现分子机器的可视化?
Farnung:我们的一般方法是从细胞中分离出分子机器,并使用特定类型的显微镜或X射线束对其进行观察。为此,我们将编码感兴趣的人类分子机器的遗传物质引入昆虫或细菌细胞中,因此细胞会大量制造这种机器。然后,我们使用纯化技术将机器从细胞中分离出来,以便我们可以单独研究它。然而,这变得很复杂,因为我们通常不只是对单个分子机器感兴趣,我们也将其称为蛋白质。有数千种蛋白质相互作用来调节转录,所以我们必须重复这个过程数千次才能了解这些蛋白质-蛋白质相互作用。
HMNews:人工智能开始渗透到基础生物学的方方面面。它是否改变了您进行结构生物学研究的方式?
Farnung:在过去的30或40年里,我所在领域的研究一直是一个繁琐的过程。一个博士生的职业生涯将致力于学习一种蛋白质,而要了解蛋白质在细胞中的相互作用,则需要数千名学生的职业生涯。然而,在过去的两三年里,我们越来越多地寻求计算方法来预测蛋白质相互作用。谷歌DeepMind发布了AlphaFold,这是一个可以预测蛋白质折叠的机器学习模型,这是一个重大突破。重要的是,蛋白质的折叠方式决定了它们的功能和相互作用。我们现在正在使用人工智能来预测数以万计的蛋白质-蛋白质相互作用,其中许多相互作用从未在实验中描述过。并非所有这些相互作用实际上都发生在细胞内,但我们可以通过实验室实验来验证它们。
这非常令人兴奋,因为它确实加速了我们的科学研究。当我回顾我的博士学位时,前三年基本上是失败的——我没能发现任何蛋白质-蛋白质相互作用。现在,有了这些计算预测,我实验室的博士生或博士后可以非常有信心,实验室验证蛋白质-蛋白质相互作用的实验将会成功。我称之为分子生物学的强化版——但合法——因为我们现在可以更快地找到我们想要回答的实际问题。
HMNews:除了效率和速度之外,人工智能还如何重塑您的领域?
Farnung:一个令人兴奋的变化是,我们现在可以以无偏见的方式测试人体中的任何蛋白质与任何其他蛋白质,看看它们是否有可能相互作用。我们领域中的机器学习工具正在造成与个人电脑对社会造成的破坏类似的破坏。
我刚成为研究员时,人们使用X射线晶体学来揭示单个蛋白质的结构——这是一项精美的高分辨率技术,可能需要很多年的时间。后来,在我攻读博士学位和博士后期间,低温电子显微镜(简称低温电子显微镜)出现了——这项技术使我们能够以高分辨率观察更大、更动态的蛋白质复合物。过去10年来,低温电子显微镜使我们对生物学的理解取得了很大进展,并加快了药物开发。
我以为自己很幸运能参与到所谓的低温电子显微镜带来的分辨率革命中。但现在,感觉蛋白质预测的机器学习正在带来第二次革命,这对我来说真是太神奇了,让我不禁想知道我们将会看到多少加速。据我估计,我们现在的研究速度可能比10年前快5到10倍。看看机器学习如何改变我们在未来10年进行生物研究的方式将会很有趣。当然,我们必须小心管理这些工具,但我很高兴能够以10倍的速度发现我思考已久的问题。
HMNews:除了实验室之外,您的工作还有什么下游应用?
Farnung:我们正在从基础层面了解人体内的生物机理,但了解基本的生物机制有助于我们开发出针对各种疾病的有效治疗方法,这一点一直很有希望。例如,事实证明,分子机器对DNA染色质结构的破坏是许多癌症的主要驱动因素之一。一旦我们弄清楚了这些分子机器的结构,我们就能理解改变几个原子来复制导致癌症的突变的效果,此时我们就可以开始设计针对蛋白质的药物。
我们刚刚与HMS治疗计划合作启动了一个项目,该项目正在研究染色质重塑剂,这是一种在前列腺癌中发生严重突变的蛋白质。我们最近获得了这种蛋白质的结构,并正在进行虚拟筛选,以查看哪些化合物与其结合。我们希望能够设计一种抑制这种蛋白质的化合物,并有可能开发成一种可能减缓前列腺癌进展的成熟药物。我们还在研究与自闭症等神经发育障碍有关的蛋白质。机器学习可以在这方面为我们提供帮助,因为我们用来预测蛋白质结构和蛋白质-蛋白质相互作用的工具也可以预测小分子化合物如何与蛋白质结合。
HMNews:说到合作,跨研究领域和学科的工作对您的研究有何重要性?
Farnung:合作对我的研究非常重要。生物学领域变得如此复杂,有如此多不同的研究领域,以至于不可能了解一切。合作使我们能够让具有不同专业知识的人聚在一起研究重要的生物学问题,例如分子机器如何访问人类基因组。我们与HMS的其他研究人员在许多不同层面上进行合作。有时,我们利用我们的结构专业知识来支持其他实验室的工作。有时,我们已经解决了某种蛋白质的结构,但我们需要合作来了解该蛋白质在更广泛的细胞环境中的作用。我们还与使用其他类型分子生物学方法的实验室合作。合作对于推动进步和更好地理解生物学至关重要。
推荐阅读
- 搜狗输入法怎么设置字体大小和字号,搜狗输入法怎么设置字体大小
- 手机网速太慢怎么办,修改一个地方飞快
- 手游我的世界天堂门怎么做,我的世界手机版天堂门怎么做
- 电脑软件打不开双击没反应,双击IE图标无反应,IE浏览器打不开解决办法
- ppt设置单词配读音,PPT为课件中的单词配上读音
- 固态硬盘安装后如何分区,详解固态硬盘分区方法
- 国6排放的车能加92号汽油吗,国6排放标准实施时间什么时候
- 怎么免费注册iPhone,Apple_ID
- 微信在哪里查看自动扣费项目,手机微信自动扣费怎么查看与关闭
- 2021年中级经济师网上报名(2021全国经济师考试报名入口)
- 现在纯碱价格是多少 纯碱网最新价格报价
- 怎么设置qq背景,如何设置手机qq的聊天背景为默认的背景
- 2021醉酒驾车的处罚标准是什么,醉酒驾驶怎么处罚2022年,醉酒驾车的处罚标准是什么
- 夏普空调维修服务(夏普空调维修)
- 笔记本电脑聚合物电池和锂电池哪个好,修复笔记本聚合物电池的方法与技巧
- 欧冠欧联杯分配名额,欧冠 欧联杯 欧协杯区别(中超积分榜总排名)
- 2020特岗教师报名时间(2020特岗教师报名时间表)
- 树莓派2和树莓派3的区别(树莓派2和树莓派3对比评测)
- 电脑版qq音乐有没有听歌识曲,电脑版QQ音乐如何听歌识曲
- Intel 酷睿2双核 T6570(intel 酷睿2双核 t6500)