结论 总的来说,该文章以无标签的 RNA 序列数据预训练语言模型 RNA-FM,并通过直接或间接的方式,在结构或功能等一系列不同的任务上进行全面的验证,证明了 RNA-FM 确实可以有效地提升计算方法在下游任务中的表现。 RNA-FM 的出现一定程度上缓解了 RNA 带标注数据紧张的现状,为其他研究者提供了便捷的访问大批量的无标签数据的接口,其将以 RNA 领域基础模型的身份,为该领域的各种各样的研究提供强有力的支援与帮助。 作者简介 本文有两个共同第一作者。陈佳阳,香港中文大学研究助理。胡智航,香港中文大学在读博士生。 本文有两位通讯作者。孙思琦,复旦大学智能复杂体系实验室和上海人工智能实验室青年研究员,主页 https://intersun.github.io。 李煜,香港中文大学助理教授,MIT James Collins Lab 访问助理教授,Broad Institute of MIT and Harvard 研究科学家,哈佛大学 Wyss Institute 访问学者,Forbes 30 Under 30 Asia list–Class of 2022, Healthcare & Science。主页:https://liyu95.com。