Science
这篇文章介绍了一种名为 CellFM 的新型大规模基础模型,其专门用于分析单细胞转录组数据。作者们通过汇编 1亿个人体细胞 的多样化数据集来训练 CellFM,并采用了一种改进的 RetNet架构 来确保高效的训练和性能。该模型包含 8亿个参数,在细胞注释、基因功能预测和基因相互作用分析等多个单细胞任务中,都展现出优于现有模型的卓越性能。该研究强调了像 CellFM 这样的综合模型在应对单细胞数据分析固有挑战方面的潜力,并预示着其在生物学和医学研究中的广泛应用前景。 References: * Zeng Y, Xie J, Shangguan N, et al. CellFM: a large-scale foundation model pre-trained on transcriptomics of 100 million human cells[J]. Nature Communications, 2025, 16(1): 4679.