大多数人类疾病都可以追溯到细胞的故障部分——例如,肿瘤能够生长是因为基因没有被准确地翻译成特定的蛋白质,或者代谢疾病的出现是因为线粒体不能正常发射。但要了解疾病中细胞的哪些部分会出错,科学家们首先需要有一份完整的部分列表。
通过将显微镜、生物化学技术和人工智能相结合,加州大学圣地亚哥分校医学院的研究人员和合作者取得了他们认为可能在理解人类细胞方面取得重大飞跃的成果。
该技术称为多尺度集成单元 (Music),于 2021 年 11 月 24 日在Nature 上进行了描述。
“如果你想象一个细胞,你可能会在你的细胞生物学教科书中描绘出五颜六色的图表,包括线粒体、内质网和细胞核。但这就是整个故事吗?绝对不是,”加州大学教授 Trey Ideker 博士说。圣地亚哥医学院和摩尔斯癌症中心。“科学家们早就意识到我们不知道的比我们知道的要多,但现在我们终于有办法更深入地研究了。”
Ideker 与瑞典斯德哥尔摩 KTH 皇家理工学院和斯坦福大学的 Emma Lundberg 博士一起领导了这项研究。
在初步研究中,MuSIC 揭示了人类肾脏细胞系中包含的大约 70 种成分,其中一半以前从未见过。在一个例子中,研究人员发现了一组形成陌生结构的蛋白质。与加州大学圣地亚哥分校的同事 Gene Yeo 博士合作,他们最终确定该结构是一种结合 RNA 的新蛋白质复合物。该复合物可能参与剪接,这是一种重要的细胞事件,可以将基因翻译成蛋白质,并有助于确定哪些基因在何时被激活。
细胞内部——以及在那里发现的许多蛋白质——通常使用两种技术之一进行研究:显微镜成像或生物物理关联。通过成像,研究人员将各种颜色的荧光标签添加到感兴趣的蛋白质上,并在显微镜的视野中跟踪它们的运动和关联。为了观察生物物理关联,研究人员可能会使用一种特定于蛋白质的抗体将其拉出细胞,看看还有什么附着在它上面。
左图:经典的教科书单元图意味着所有部分都清晰可见并已定义。(信用:OpenStax/维基媒体)。右图:由 MuSIC 技术生成的新细胞图揭示了许多新颖的组件。金色节点代表已知细胞成分,紫色节点代表新成分。节点的大小反映了该组件中不同蛋白质的数量。图片来源:加州大学圣地亚哥分校健康科学
多年来,该团队一直对绘制细胞内部工作原理图感兴趣。MuSIC 的不同之处在于使用深度学习直接从细胞显微镜图像中绘制细胞图。
“这些技术的结合是独特而强大的,因为这是第一次将不同尺度的测量结果结合在一起,”该研究的第一作者、Ideker 实验室生物信息学和系统生物学研究生 Yu Qin 说。
显微镜可以让科学家们看到一个微米的水平,大约是一些细胞器的大小,比如线粒体。较小的元素,例如单个蛋白质和蛋白质复合物,无法通过显微镜看到。从单一蛋白质开始的生物化学技术使科学家们能够深入到纳米尺度。
“但你如何弥合从纳米到微米尺度的差距?长期以来,这一直是生物科学的一大障碍,”艾德克说,他也是加州大学癌细胞图谱计划和加州大学圣地亚哥计算生物学中心的创始人和生物信息学。“事实证明,你可以用人工智能来做到这一点——查看来自多个来源的数据并要求系统将其组装成细胞模型。”
该团队训练 MuSIC 人工智能平台查看所有数据并构建细胞模型。系统尚未将单元格内容映射到特定位置,例如教科书图表,部分原因是它们的位置不一定是固定的。相反,组件位置是可变的,并且会根据细胞类型和情况而变化。
Ideker 指出,这是一项测试 MuSIC 的试点研究。他们只研究了 661 种蛋白质和一种细胞类型。
“明确的下一步是穿透整个人类细胞,”艾德克说,“然后转移到不同的细胞类型、人和物种。最终我们可能能够通过比较之间的不同来更好地了解许多疾病的分子基础。健康和患病的细胞。”