全细胞(Whole-Cell,WC)建模是"21世纪的重大挑战",对生命科学、生物工程和医学的变革具有巨大的前景。实验和计算结构生物学的巨大进步,致我们对细胞和细胞组分的结构理解呈指数级增长。高分辨率成像和冷冻电镜技术提供了大型蛋白质复合物原子结构的实验途径。数据可访问性和计算资源的进步为整个细胞的结构研究打开了大门,建立整个细胞的结构模型的可能性似乎已经触手可及。
由于细胞环境的复杂性,要实现三维全细胞(3DWhole-Cell,3D-WC)模型捕捉细胞中所有大分子和膜的结构、位置、取向和相互作用的快照,仍然存在许多挑战。构建整个细胞的分子模型的能力依赖于从原子到细胞水平对生物微观层面的充分理解。细胞是异质性的拥挤环境,充满了不同大小和形状的成分,具有可变的浓度和相互作用的模式,组装和整理必要的数据仍然是构建细胞环境3D模型的主要挑战,主要分为:(1)目前对于细胞中分子结构理解的数据仍然存在大量的空白;(2)如何整合分散的海量数据。
对于任何生物体来说,具有基因组尺度覆盖的高质量的3D蛋白结构仍然是稀缺的。计算结构预测可以填补这一空白,而且在许多情况下,效果很好。最近来自深度学习方法AlphaFold2和RoseTTAFold的成功尤其令人鼓舞。而且随着Uniprot数据库和PDB数据库的收录的序列和结构数据的不断完善,为整合海量的数据提供了基础。
图1.一个完整的MG细胞所需要数据资源
图2.完整细胞3D-WC-MG模型构建所需成分清单
图3.可视化3D-WC-MG模型
这项研究是对整个细菌细胞的大分子结构进行微观模拟的理论模型证明。据我们所知,这是第一个完整的细胞在大分子细节的结构模型,这份研究目的是作为一个例子来展示如何利用目前的知识和当前的技术构建一个完整的细胞结构模型。
参考文献
MaritanM,AutinL,KarrJ,etal.Buildingstructuralmodelsofawholemycoplasmacell[J].Journalofmolecularbiology,2022,434(2):167351.