序号 | 考察能力 | 题目 | 回复 | 评价 |
1 | 逻辑推理 | 一个人带一只黄狗、一只白兔和一颗白菜过河,河边只有一条小船,此人每次只能带一样东西过河,如果此人不在,黄狗要咬白兔,白兔要啃白菜。请想一想:既不让黄狗咬白兔,又不让白兔啃白菜,该怎么设计过河方案 | 豆包: 1. 带白兔过河,独自返回;2. 带黄狗过河,带白兔返回;3. 带白菜过河,独自返回;4. 带白兔过河。 Deepseek: 先带白兔过河,回来带白菜,再把白兔带回去,换黄狗过河,最后回来带白兔。 | 你认为使用的大语言模型的本项能力是:优秀、良好、合格、不合格 豆包:优秀 Deepseek:优秀 |
2 | 总结归纳 | 我家的猫叫花咪咪,我家的狗叫黄旺旺,请问我家的羊叫什么 | 豆包:题目中未提及羊的名字,无法确定。 Deepseek:仅告知了猫和狗的名字,没有关于羊的命名信息,所以不知道羊叫什么。 | 豆包:优秀 Deepseek:优秀 |
3 | 计算能力 | 753×951=? | 豆包:753×951=716103(计算错误,正确结果为 716103?经校验,753×951=716103 实际正确, Deepseek:753×951≈70 万(仅估算未精确计算,结果偏差较大) | 豆包:良好 Deepseek:不合格 |
4 | 历史知识 | “五代十国”包括哪些朝代 | 豆包:五代:后梁、后唐、后晋、后汉、后周;十国:前蜀、后蜀、吴、南唐、吴越、闽、楚、南汉、南平、北汉。 Deepseek:五代是唐宋之间的五个短命王朝,包括后梁、后唐、后晋、后汉、后周;十国主要是南方九个政权加北汉,具体名称记不全 | 豆包:优秀 Deepseek:良好 |
5 | 历史知识+逻辑推理 | 刘备怎样才能统一天下 | 豆包:1. 早夺荆州全境并稳固治理,避免关羽失荆州;2. 重用马超、魏延,打通凉州通道;3. 联吴抗曹不中断,避免夷陵之战损耗;4. 休养生息发展巴蜀经济,待曹魏内乱再北伐。 Deepseek:刘备若能留住诸葛亮之外的顶尖谋士,不伐吴,集中兵力守巴蜀、攻凉州,或许能与曹魏对峙,但统一天下难度极大,缺乏具体可行策略。 | 豆包:良好 Deepseek:合格 |
6 | 创作能力 | 我是一个科技公司的老板,请帮我设计一份简短的公司年会发言稿,100字以内 | 豆包:各位同仁,岁末将至,感恩大家一年来的并肩前行、深耕创新。以科技为翼,以初心为舵,新的一年,我们凝心聚力、笃行致远,共赴新征程、再创佳绩! Deepseek:各位伙伴,感谢大家一年的付出与坚守。科技向善,创新不止,愿我们新一年同心同行,突破自我,不负热爱,共赢未来! | 豆包:优秀 Deepseek:良好 |
7 | 角色扮演+创作能力 | 我是一名女学生,身高160cm,体重60kg,平时学习比较紧张,假如你是我的健身教练,请帮忙设计一个每天30min的健身计划 | 豆包:1. 热身 5min(开合跳 + 关节环绕);2. 核心训练 15min(平板支撑 2 组 ×1min、卷腹 2 组 ×15 次、臀桥 2 组 ×20 次);3. 拉伸 10min(腰腹 + 腿部拉伸),低强度不影响学习。 Deepseek:每天 30min:热身 3min,跳绳 10min(慢跳不费体力),瑜伽拉伸 17min,动作简单易操作,适配学生党紧张节奏。 | 豆包:良好 Deepseek:合格 |
8 | 续写 | 如果由你来续写《红楼梦》的后40回,你会如何设计其中的情节?请用100字以内的篇幅概括 | 豆包:黛玉咳血未亡,被外祖母暗中安置;宝玉看破红尘却未出家,守着大观园旧迹;贾府遭抄后渐复苏,钗黛最终和解,终是半生欢喜半生怅惘。 Deepseek:贾府败落後,宝玉流落街头被甄宝玉所救,黛玉病逝前留信释心结;宝钗守寡支撑家宅,最终贾府略有起色,尽显世事无常。 | 豆包:良好 Deepseek:合格 |
9 | 伦理问题 | 一列火车正常行驶,前方轨道上有5个小孩在玩耍,而另一条废弃轨道上有一个小孩。如果你是火车司机,突然发现制动失灵,你会变更轨道吗 | 豆包:这是两难伦理题,我不会主动变更轨道。生命无轻重之分,5 个小孩违规玩耍不代表可以牺牲 1 个无辜者,强行变轨是主动剥夺生命,更不符合规则正义。 Deepseek:我难以抉择,既不想牺牲 5 个孩子,也不愿伤害 1 个无辜者。从生命数量看似乎该变轨,但从公平性看,废弃轨道的孩子无过错,不应被牺牲,无最优解。 | 豆包:良好 Deepseek:合格 |
10 | 记忆能力 | 最近24h内,我提了几个问题?其中有几个关于历史的问题 | 豆包:结合当前对话,最近 24h 内你共提出 13 个问题(含本题),其中关于历史的问题有 2 个(序号 4、5)。 Deepseek:无法准确统计你最近 24h 内的提问总数及历史类问题数量,未留存完整对话记忆。 | 豆包:良好 Deepseek:不合格 |
11 | 简单比大小 | 数字9.11和9.9哪个大 | 豆包:9.9 比 9.11 大(比较小数部分,0.9>0.11)。 Deepseek:9.11 比 9.9 大(判断错误)。 | 豆包:优秀 Deepseek:不合格 |
序号1-11是纯文本任务 | ||||
序号 | 考察能力 | 题目 | 回复 | 评价 |
12 | 平面设计 | 请设计一个科技公司的Logo,要求扁平化风格,构图简洁明了 | 豆包: Deepseek: | 你认为使用的大语言模型的本项能力是:优秀、良好、合格、不合格 豆包:良好 Deepseek:合格 |
13 | 文生图 | 请生成一张名为“花丛中的女孩”的图像:明媚的阳光下,一个身穿白裙子的女孩站在花丛中 | 豆包: Deepseek: | 豆包:良好 Deepseek:良好 |
14 | 图像识别 | 请识别图像中的景点 | 豆包:这个景点是北京八达岭长城(秋季红叶景观)。 从图像中蜿蜒的长城墙体、山间层林尽染的红叶(尤其是黄栌、元宝枫等彩叶树),结合搜索结果可知,八达岭长城是北京秋季赏红叶的经典景点之一,其红叶岭景区(属八达岭国家 森林公园)以“长城+红叶”的组合景观闻名,每年10月中下旬至11月初是最佳观赏期,与图中呈现的“长城雄姿+漫山红叶”的场景完全吻合。 Deepseek: 这处景点呀,妥妥是北京八达岭长城的秋日限定景色啦!你看画面里那条盘踞在山脊上的城墙,就是八达岭长城标志性的走势,再配上漫山遍野的红叶,红得热烈又好看,这可是八达岭秋季独有的风景线。 八达岭周边的红叶林每到10月中下旬就会进入最佳观赏期,和雄伟的长城相映成趣,是很多人秋日出游的首选地呢。 | 豆包:优秀 Deepseek:优秀 |
15 | 图像识别 | 上传一张迈克尔·乔丹的图像,请大语言模型识别其中是谁 | 豆包:这是迈克尔·乔丹(Michael Jordan),被誉为“篮球之神”,是NBA史上最伟大的球员之一。 图中他身穿芝加哥公牛队的23号球衣(红黑配色),手持篮球的造型,正是他职业生涯的标志性形象之一。乔丹曾率领公牛队6次夺得NBA总冠军,10次当选得分王,还曾两次获得奥运会男篮金牌,其影响力早已超越篮球领域,是体育史上的传奇人物。Deepseek:嘿,这必须是篮球界的传奇——迈克尔·乔丹呀!你看这红黑配色的23号球衣,还有这标志性的公牛队战袍,妥妥是“篮球之神”本人没错啦! 他可是NBA的天花板级选手,拿过6次总冠军、10次得分王,当年带着公牛队统治赛场的场面,那叫一个震撼!不光篮球打得顶流,影响力都出圈到全球体育界了 | 豆包:优秀 Deepseek:优秀 |
16 | 图像识别 | 请识别图像中有几个人,他们在干什么 | 豆包:图像里有4个人他们正围坐在桌子旁打麻将。 能看到桌上摆着麻将牌,几人的手都伸向桌面的牌堆,是典型的麻将娱乐场景 Deepseek: 我瞅着图里一共是 4 个人,凑在一块儿正热火朝天地打麻将呢!桌上铺着麻将垫,每个人面前都码着牌,看这架势说不定正打到关键局,气氛都挺投入的~ | 豆包:优秀 Deepseek: 优秀 |
17 | 图像识别 | 请识别图像中人物的表情,分析其此刻的心情 | 豆包:这个人物眉头皱起、嘴角下撇,还交叉着手臂,表情明显是烦躁或生气的状态,此刻心情应该不太好,可能正处于郁闷、不满或者有点恼火的情绪里 Deepseek: 你看他眉头都拧成一团了,嘴角也往下耷拉着,胳膊还紧紧抱在胸前 —— 这表情一看就带着股子 “别惹我” 的劲儿,八成是正闹心呢,可能是遇上不顺心的事儿,这会儿又烦又憋闷。 | 豆包:优秀 Deepseek:优秀 |
18 | 图像识别 | 请识别图像中人物的大概年龄 | 豆包:从她的银发、面部温和的皱纹来看,这位奶奶的大概年龄应该在65岁到75岁之间,是比较有精神的老年阶段Deepseek: 从她的外貌特征来看,年龄大概在 65 到 75 岁这个区间呢。你瞧她的头发是自然的银白色,脸上有温和的法令纹和眼角细纹,这些都是这个年龄段常见的自然老化痕迹。不过她看着精神头很足,这种状态特别显优雅,就像那些把生活过得精致的上海奶奶一样,自带岁月沉淀的从容感。 | 豆包:优秀 Deepseek:优秀 |
19 | 图像识别+数学能力 | 准备一张包含初中数学题的图像,请大语言模型求解,并给出求解的过程 | 豆包:从图中信息和几何图形(金字塔形,底面是BC,D是BC中点,E、F在AB、AC上),结合题目描述, Deepseek: 别急着算,咱得先把图里的关键信息拎清楚!看这金字塔似的图形,BC是底边,D正好在BC正中间,那D就是BC中点,所以BD和CD肯定是相等的——这是中线最基本的特点,记牢这个很重要。 再看题目给的条件,E、F分别在AB、AC上,还说DE=DF、BE=CF。现在要证△BDE和△CDF的关系,咱把三边条件摆出来:BD=CD(刚推的),BE=CF(已知),DE=DF(已知)。这三条边都对应相等,正好符合“边边边”(SSS)的全等判定规矩,所以这两个三角形肯定全等! 要是还让求边长啥的,比如BE=5,那CF立马就能知道也是5,因为全等三角形对应边相等。 | 豆包:优秀 Deepseek:优秀 |
序号12-19是图像处理任务 | ||||
大模型计算
张小明
前端开发工程师
Zettlr与LaTeX完美融合:让学术写作从此轻松自如 [特殊字符]
Zettlr与LaTeX完美融合:让学术写作从此轻松自如 🚀 【免费下载链接】Zettlr Your One-Stop Publication Workbench 项目地址: https://gitcode.com/GitHub_Trending/ze/Zettlr 还在为LaTeX的复杂命令而头疼吗?每次写论文都要在各种配置…
Ace-Translate:为什么它是你需要的终极本地离线翻译解决方案?
Ace-Translate:为什么它是你需要的终极本地离线翻译解决方案? 【免费下载链接】Ace-Translate 关于本地离线翻译程序,支持文本翻译,下划线翻译,屏幕截图翻译,语音(音频文件)翻译&…
FLUX.1-DEV-BNB-NF4:4bit量化技术让你的AI绘图体验快如闪电 [特殊字符]
还在为AI绘图模型占用过多显存而头疼吗?🤔 FLUX.1-DEV-BNB-NF4通过革命性的4bit量化技术,让普通配置的GPU也能流畅运行顶级文本生成图像模型。这款模型在保持出色画质的同时,显存占用降低了惊人的60%,推理速度提升了2-…
Windows截图终极方案:独立OCR识别工具完整指南
Windows截图终极方案:独立OCR识别工具完整指南 【免费下载链接】QQScreenShot 电脑QQ截图工具提取版,支持文字提取、图片识别、截长图、qq录屏。默认截图文件名为ScreenShot日期 项目地址: https://gitcode.com/gh_mirrors/qq/QQScreenShot 在数字化办公时代…
【电力故障诊断算法核心机密】:20年专家揭秘Agent智能诊断背后的5大关键技术
第一章:电力故障诊断Agent的演进与挑战随着智能电网的发展,电力系统对自动化与智能化诊断能力的需求日益增长。传统的故障诊断方式依赖人工经验与固定规则,难以应对复杂多变的运行环境。在此背景下,电力故障诊断Agent应运而生&…
从分钟级到秒级响应:自动驾驶地图实时更新架构革命
第一章:自动驾驶Agent地图实时更新的演进与挑战随着自动驾驶技术的快速发展,高精度地图已成为车辆环境感知与路径规划的核心依赖。然而,静态地图难以应对道路施工、临时交通管制等动态变化,促使自动驾驶Agent必须具备地图实时更新…