news 2026/5/10 13:56:04

上海AI Lab:真实场景虚拟细胞模型基准评测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
上海AI Lab:真实场景虚拟细胞模型基准评测

摘要

虚拟细胞模型旨在通过计算预测细胞对各类扰动的响应,已成为药物研发与精准医疗的前沿手段。但当前研究存在明显缺口:各类模型在标准基准测试中表现优异,但其预测结果在实际应用中的生物学意义尚不明确。这主要源于现有评估方案的缺陷——评估设置过度简化、流程不统一,无法反映真实生物系统的复杂性与变异性。本文提出1套标准化、模块化的虚拟细胞预测基准评测框架,在未见细胞背景、未见扰动类型、跨数据集泛化3类真实挑战性场景下评测各类模型,更贴合实际应用需求。分析表明,模型性能具有高度的场景依赖性,受任务设计与评估标准显著影响;常规评估设置会高估模型性能,简单的数据集合并策略甚至会降低性能;严格泛化条件下模型性能大幅下降,表明模型对细胞背景偏移的鲁棒性有限。在未见扰动场景中,包括简单线性模型在内的各类方法仅能捕捉全局转录趋势,无法还原细粒度的扰动特异性效应。此外,不同评估指标侧重不同的生物学特性,导致模型排名差异显著。本框架提供了更可靠、贴合生物学意义的评估方案,为虚拟细胞模型的实际应用提供清晰指引。

sunsiqi1@pjlab.org.cn

gaozhangyang@pjlab.org.cn

#虚拟细胞模型 #扰动响应预测 #单细胞测序 #基准评测 #泛化性能 #跨数据集整合 #评估指标

结果

虚拟细胞预测基准评测框架

1  VCBench基准评测流程与方法总览

(a) 虚拟细胞预测示意图。虚拟细胞模型以扰动前细胞状态为输入,包括基因表达谱及可选的细胞类型、扰动标识(如基因敲除、药物处理)等背景信息,目标是预测扰动后的基因表达,同时捕捉全局表达偏移与基因水平响应。

(b) 将虚拟细胞预测分为3类场景:未见细胞泛化、未见扰动泛化、多数据集合并。在每类场景下,基于6项代表性研究的7个常用数据集,评测11种典型方法,并采用3类指标开展全面对比。

未见细胞泛化场景的基准评测分析

2  基于单细胞基础模型嵌入与随机划分策略的未见细胞评测

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 13:55:56

告别命令行恐惧!Mac上Cornerstone 4.0保姆级SVN图形化操作指南

告别命令行恐惧!Mac上Cornerstone 4.0保姆级SVN图形化操作指南 在软件开发的世界里,版本控制是每个开发者必须掌握的技能。Subversion(SVN)作为经典的集中式版本控制系统,至今仍在许多企业和项目中广泛使用。然而&…

作者头像 李华
网站建设 2026/5/10 13:54:49

永久保存微信聊天记录的终极方案:WeChatMsg开源工具完整指南

永久保存微信聊天记录的终极方案:WeChatMsg开源工具完整指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we…

作者头像 李华
网站建设 2026/5/10 13:52:44

网盘直链解析架构:基于JavaScript的跨平台API集成解决方案

网盘直链解析架构:基于JavaScript的跨平台API集成解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / …

作者头像 李华
网站建设 2026/5/10 13:49:46

ChatGPT对话时间线:构建可追溯、可分析的AI对话治理工具

1. 项目概述与核心价值最近在折腾一个很有意思的开源项目,叫chatgpt-conversation-timeline。光看名字,你可能觉得这又是一个围绕 ChatGPT API 的简单包装工具,但实际深入后,我发现它的设计思路和解决的实际痛点,远比想…

作者头像 李华