上海AI Lab：真实场景虚拟细胞模型基准评测-开发者社区

摘要

虚拟细胞模型旨在通过计算预测细胞对各类扰动的响应，已成为药物研发与精准医疗的前沿手段。但当前研究存在明显缺口：各类模型在标准基准测试中表现优异，但其预测结果在实际应用中的生物学意义尚不明确。这主要源于现有评估方案的缺陷——评估设置过度简化、流程不统一，无法反映真实生物系统的复杂性与变异性。本文提出１套标准化、模块化的虚拟细胞预测基准评测框架，在未见细胞背景、未见扰动类型、跨数据集泛化３类真实挑战性场景下评测各类模型，更贴合实际应用需求。分析表明，模型性能具有高度的场景依赖性，受任务设计与评估标准显著影响；常规评估设置会高估模型性能，简单的数据集合并策略甚至会降低性能；严格泛化条件下模型性能大幅下降，表明模型对细胞背景偏移的鲁棒性有限。在未见扰动场景中，包括简单线性模型在内的各类方法仅能捕捉全局转录趋势，无法还原细粒度的扰动特异性效应。此外，不同评估指标侧重不同的生物学特性，导致模型排名差异显著。本框架提供了更可靠、贴合生物学意义的评估方案，为虚拟细胞模型的实际应用提供清晰指引。

sunsiqi1@pjlab.org.cn

gaozhangyang@pjlab.org.cn

#虚拟细胞模型 #扰动响应预测 #单细胞测序 #基准评测 #泛化性能 #跨数据集整合 #评估指标

结果

虚拟细胞预测基准评测框架

图1 VCBench基准评测流程与方法总览

(a) 虚拟细胞预测示意图。虚拟细胞模型以扰动前细胞状态为输入，包括基因表达谱及可选的细胞类型、扰动标识（如基因敲除、药物处理）等背景信息，目标是预测扰动后的基因表达，同时捕捉全局表达偏移与基因水平响应。

(b) 将虚拟细胞预测分为3类场景：未见细胞泛化、未见扰动泛化、多数据集合并。在每类场景下，基于6项代表性研究的7个常用数据集，评测11种典型方法，并采用3类指标开展全面对比。

未见细胞泛化场景的基准评测分析

图2 基于单细胞基础模型嵌入与随机划分策略的未见细胞评测

告别命令行恐惧！Mac上Cornerstone 4.0保姆级SVN图形化操作指南

告别命令行恐惧！Mac上Cornerstone 4.0保姆级SVN图形化操作指南在软件开发的世界里，版本控制是每个开发者必须掌握的技能。Subversion（SVN）作为经典的集中式版本控制系统，至今仍在许多企业和项目中广泛使用。然而&…

李华

永久保存微信聊天记录的终极方案：WeChatMsg开源工具完整指南

永久保存微信聊天记录的终极方案：WeChatMsg开源工具完整指南【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we…

李华

JoyCon-Driver终极指南：如何在Windows上完整使用Switch手柄的所有功能

JoyCon-Driver终极指南：如何在Windows上完整使用Switch手柄的所有功能【免费下载链接】JoyCon-Driver A vJoy feeder for the Nintendo Switch JoyCons and Pro Controller 项目地址: https://gitcode.com/gh_mirrors/jo/JoyCon-Driver 你是否拥有任天堂Swi…

李华

WeClaude：2000行Python实现微信与Claude Code本地桥接，打造隐私安全的移动编程助手

1. 项目概述：一个让微信成为你编程助手的本地桥接器作为一名在自动化工具和AI应用领域折腾了十多年的开发者，我见过太多试图把AI能力塞进即时通讯工具的尝试，但大多数要么过于臃肿，要么隐私堪忧。最近，我在GitHub上发现…

李华

网盘直链解析架构：基于JavaScript的跨平台API集成解决方案

网盘直链解析架构：基于JavaScript的跨平台API集成解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …

李华

ChatGPT对话时间线：构建可追溯、可分析的AI对话治理工具

1. 项目概述与核心价值最近在折腾一个很有意思的开源项目，叫chatgpt-conversation-timeline。光看名字，你可能觉得这又是一个围绕 ChatGPT API 的简单包装工具，但实际深入后，我发现它的设计思路和解决的实际痛点，远比想…

李华