生物医学大数据往往规模宏大、内容复杂,存储、管理、处理和有效挖掘这些数据让不少科研人员感到头疼。近日,广州国家实验室研究员李亦学接受南方+采访时介绍,由广州国家实验室牵头、北京火山引擎科技有限公司参与研发的生物医学大数据操作系统“Bio-OS”,能够帮助科研人员生成标准化、易使用、易获取的科研分析平台,降低其处理海量数据的复杂度。
工作流管理、人机交互、硬件资源管理、AI大模型……在李亦学的设想中集结了多项智能工具的Bio-OS,有望像“安卓系统”一样,通过开源实现蓬勃发展,改变生物医学科研工作的生态。
“借助操作系统,生物医学方向的科研人员只需专注于自己擅长领域,不必过多地聚焦于计算机技术和计算方法。” 李亦学说,科研人员借助该操作系统,能快速完成实验数据计算工作,让科学发现更快“浮出水面”。
Bio-OS包含了丰富的应用体系,能够满足大部分生物医学大数据存储、分析需求。例如,该操作系统的分布式组网可以形成智能化的资源汇聚、算力支撑和数据分析挖掘体系,为搭建疾病检测、监测、预测、预警网络等方面提供技术支撑。
李亦学透露,团队正与广州医科大学附属第一医院、广东省人民医院、中山大学附属第六医院等医疗机构合作,在呼吸系统疾病、肿瘤多组学分析方向上开展工作。
目前,该操作系统已连通国际主流开源社区,接入50万余全球全基因组数据集,沉淀了10000多种算子和1400多套工作流,涵盖了基因组分析、转录组分析、单细胞与空间转录组分析、代谢与蛋白质组分析、病原与微生物应用、AI相关应用等,为科研人员提供一站式开箱即用的分析资源。
“该操作系统在医疗机构、科研单位、高校和企业中具备广泛应用前景,能加速我国生物医学数据密集型科研发展。”李亦学表示,团队目前已与中国科学院上海营养与健康研究所、中山大学生物医学实验室、上海复旦大学表型组研究院等多家科研院所和医疗机构达成合作意向。
南方+记者 吴雅楠 钟哲
【作者】 吴雅楠;钟哲
广东科技头条