虽然在过去十年中发生了人类微生物组的研究进展主要是由于多OMICS网络分析,未知未知数保持.例如,人体肠道微生物组的综合基因目录中存在的最高可达40%的基因未映射到功能数据库。

来自斯坦福大学(美国)的科学家,一个食盒(美国),联合基因组学院(美国),生物医学科学研究中心亚历山大弗莱明(希腊),以及劳伦斯伯克利国家实验室(美国)现在已经发现了人类微生物群中4539种保守小蛋白,功能未知

很难将被人相关微生物编码的基因链接到特定表型。这可以通过忽略小开放阅读框架(SORF)来解释,该镜谱(SORF)长期编码小于50个氨基酸的小蛋白质,由于方法论方法的限制。

使用人类微生物组项目数据集在1773个健康人类相关元基因组中,有4539个小蛋白家族。大多数只在口腔和肠道中被识别,可能是因为在使用的人类微生物组项目数据资源中,其他身体部位的数据集代表不足。

分类分类、跨身体部位和细胞内的定位以及抗菌功能的预测表明人类微生物组编码的小蛋白质可能执行广泛的以前未知的功能

大多数家族在传统的参考基因组中不存在,且不包含已知的蛋白结构域只有一小部分以前表征的小蛋白质在微生物组样品中丰富.核糖体蛋白、群体感应小蛋白AgrD和ComC以及酚溶性调质蛋白都是存在于人类微生物组数据集中的已知小蛋白。

公开可用的元素数据集的比较还显示出小蛋白质家族子集的转录和翻译的证据。

预测的功能小蛋白家族包括管家,细胞-细胞间的串扰,适应,和防御其他细菌或噬菌体.透明细菌和环境之间大部分相互作用的跨膜和分泌蛋白在肠道中更丰富。

更有趣的是这一事实多个小蛋白质家族,如那些与移动元素相关的,被映射到生命的多个领域.虽然大多数小蛋白家族被归为细菌,但有8个家族被归为真核生物域,152个家族被归为细菌、真核生物和病毒等多个生命域。作者承认,这些发现可能表明小蛋白质的古老保存或进化上遥远的生物之间的遗传转移。

总的来说,对被忽视的sORF及其编码的小蛋白的研究可以更好地理解人类微生物组编码的全部编码潜能。由于人类微生物组中丰富的小蛋白质具有以前没有报道过的新功能,宏基因组挖掘的努力对于微生物组领域从描述性科学向机械学科学的转变至关重要。

参考:

Sberro H,Fremin Bj,Zlitni S等人。人类微生物的大规模分析显示成千上万的小型新基因细胞.2019年;178:1245-1259.E14。