news 2026/4/21 10:19:04

大模型的探索与实践-课程笔记(二):用大模型赋能科研流程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型的探索与实践-课程笔记(二):用大模型赋能科研流程

科研是一个固定流程,合理使用 AI 能够极大地避免重复劳作。

Take-away Messages

寻找问题 -> 导师的工作

文献调研 -> PASA

修正思路 -> Agent

理论推导 -> 很难

实验分析 -> Cursor, Trae

论文写作 -> 语法润色,详实?

步骤 1:寻找问题

最核心、决定上限

  • 原则:不可直接靠大模型生成创新问题(往往是无意义的A+B)。好问题必须根植于现实痛点(如:自动将微信聊天中的开会时间提取并同步至日程表)。
  • 好问题的特征:现实中存在需求(C),恰好可以被某方法(B)解决。

问题是一个“真”问题:真正能解决人们现实困难的、提升工作效率的问题

至少,要说服自己吧!

【如何系统性挖掘“好问题”】

  • 寻找 Knowledge Gap(知识盲区):大模型无法直接告诉你“该研究什么”,但它是极好的“文献缝隙探测器”。可以提取近 3 年该领域顶会的 50 篇论文的Future WorkLimitation章节,喂给模型并提问:“基于这些文献的局限性,目前该领域尚未解决的共性痛点是什么?”

  • 跨界调研:很多好问题来自于交叉领域。例如,将 NLP 领域的 Agent 架构或 RAG 技术,直接平移到投研领域的非结构化数据处理中。业务场景的复杂度天然会为你催生出有价值的工程/科研问题。

步骤 2:文献调研

  • 核心工具:使用PASA Agent(https://pasa-agent.ai/)或Deep ResearchKimi,Gemini,GPT等大模型内置)进行模糊搜索。
  • 好处:高效、可模糊词搜索,可直接根据你想做什么进行搜索。但搜出相关文献后,仍然要继续查看引用被引文献。
  • 实操建议:应用型项目一定要去GitHub寻找已有开源代码,在此基础上局部修改以解决你的特定痛点。
    • 如果是一个偏学术的问题:至少得用大模型搜搜文献
    • 如果是一个偏应用的问题:至少得用Google/github找一下现有的结果【不要重复造轮子!!!!!】

【建立现代化的文献流】

  • 精准溯源:除了模糊搜索,利用 Connected Papers 或 Research Rabbit 等工具找到该领域的“开山之作”和“最新综述”。

  • AI 辅助精读:读懂一篇代码的价值远超读十篇水会论文。对于 GitHub 上的开源项目,利用 AI IDE(如 Trae/Cursor)直接阅读源码。先让大模型总结项目的文件结构(Tree),再针对核心算法模块进行逐行解释,这是消化前人成果最快的捷径。

步骤 3:修正思路

打造“虚拟导师”

正常做科研,看了相关文献后,要去和老师讨论:

哪些文献做了类似的事
这些文献有什么可进一步做的
原来的思路有什么问题
现在,可以先和大模型讨论讨论
  • 大模型妙用:利用 Prompt 让大模型扮演导师。
    • Prompt 示例:“现在请模拟场景:有 A 与 B 两个导师。A 更关注想法的新颖性,B 更关注可实现性。请围绕文献 [1,2,3] 以及我的思路 [...] 进行交叉讨论,并对我提问。

【引入“红蓝对抗”与审稿人机制】

  • 压力测试 (Red Teaming):你的思路在实现前必须经过审视。设定 Prompt:“你现在是本领域最严苛的 Reviewer(审稿人),请指出我上述思路中的 3 个致命缺陷,并重点拷问我的 Baseline(基线模型)选择是否合理,数据是否有泄露风险。”

  • 通过这种自我对抗,能在动手写第一行代码前,排雷掉大部分逻辑漏洞。

步骤 4:理论推导

  • 大模型能力边界:虽然能解大量的微积分、概率论习题,但无法直接证明长篇的核心复杂定理
  • 使用建议:必须将理论推导拆解成极度细化的步骤,再喂给开启了“思维链(深度思考)”的模型,它可以帮你完成机械的推算验证。

曾经:需要很好的数学功底

• 线性代数、数学分析、概率论、数理统计

ODE、复变、实变、泛函、回归、时序…

需要很多年的学习积累才可以做到

现在:仍然需要很好的数学功底

很遗憾,大模型做数学做的还不是很好…

但一些简单的问题,大模型已经可以帮你实现了

拆分复杂问题到简单的问题,从而利用大模型进行简单的证明【亲测好用】

→使用思维链技术

步骤 5:实验分析

  • 使用 Trae / Cursor 辅助代码编写。一定要注意 5000 行上限的边界,超长代码需模块化处理。
  • 如果有和其他baseline的比较… 一定是加分项!

【AI 辅助编程的黄金法则】

  • TDD(测试驱动开发):不要直接让大模型写几百行的核心业务逻辑,它一定会跑偏。正确的做法是:先让模型写 Test Cases(测试用例)和边界条件检查,确认测试逻辑无误后,再让它去填充主函数。

  • 随时 Commit:在使用 Cursor 的 Agent/Builder 模式大规模重构代码前,必须进行 Git Commit(存档)。AI 改崩代码是常态,良好的版本控制是底线。

学术写作

学术写作与日常英语写作完全不同,核心在于严谨的逻辑、简明扼要以及高度结构化。当使用大模型辅助润色时,极易踩坑。

1. 识别并消除“大模型味”

直接让大模型生成论文,极易出现以下“灾难性”特征:

  • 无脑分点:一写东西必是各种1. 2. 3. - - -
  • 华丽形容词滥用:充斥夸张、华丽却无用的形容词与副词(学术写作极度忌讳,要求朴实无华)。
  • 句式过度复杂:滥用极其冗长的从句、伴随状语。
  • 名词乱解释:强制在每个专业名词(甚至缩写)后带上括号解释,甚至产生知识幻觉(编造完全不存在的术语解释)。

👉应对 Prompt 建议:“请精简地重写下面这段话,要求:1. 以自然段落形式输出,禁止分点列短语;2. 语言平实客观,去除所有夸张的形容词和副词;3. 多用简单句,避免冗长的复杂从句。”且一定要人工基于原文比对。

2. 学术写作的核心要求与八股结构

  • 严密的逻辑链条:句子与句子之间必须有明显的逻辑关联词(如However, Therefore, Specifically, Furthermore),前一句的主干往往是下一句的承接起点。(切忌将重要的状语置于句首阻断主语逻辑)。
  • 结构化(遵守“八股文”)
    • 不要挑战现有论文的章节篇幅安排(例如 CS 领域的 Intro 通常就是 1.5 ~ 2.5 页,不要写 4 页废话)。
    • Section 的起手式:每一章的开头必须有一句路标,例如:“In this section, we present...”。
  • 摘要 (Abstract) 万能模板
    1. 大背景:在XXX领域中,XXX方向十分重要。
    2. 转折与痛点:然而,现有工具注重...却忽略了...的弱点。
    3. 本文贡献:本文提出XXX方法,能够解决XXX。
    4. 具体操作:具体而言,(讲1-2句核心机制)。
    5. 实验结果:实验表明达到了XXX效果。
工具名称类别核心功能与特色应用领域
PASA Agent文献检索字节跳动出品。支持模糊意图搜索,能精准检索计算机(CS)领域的高质量文献,通常只推 20-30 篇强相关论文。文献调研:寻找特定方向(如“大模型多模态的不确定性度量”)的相关论文。比 Google Scholar 更精准。
Deep Research深度调研OpenAI、Gemini、Kimi 等平台内置的高阶搜索功能。能像写报告一样将相关文献和知识点串联起来。文献调研与思路汇总:适合快速了解一个完全陌生的领域并生成调研报告。
DeepSeek (R1/V3)大语言模型R系列(R1):开启深度思考(思维链),极擅长数学推导和代码编写,但文字可能“言之无物/不像人话”。V系列(V3):不带深度推理,但生成文本的文风更像自然人类。理论推导辅助、实验代码编写、日常对话。
Claude大语言模型目前公认写代码能力最强的大模型。实验分析:适合处理相对复杂的项目代码重构或生成任务。
Cursor / TraeAI 编程 IDE集成了强大 AI 问答能力的本地代码编辑器。课上强调其处理代码的上限一般在 5000-6000 行左右,超过容易出现幻觉或崩盘。项目实操/实验分析:在现有的 Github 开源库上添加自定义小功能。
Grammarly传统辅助润色专门检查英语语法的传统工具。学术写作润色:查语法、冠词、介词的利器。现阶段常与大模型结合使用。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 10:18:12

安卓防抓包POC测试怎么做?从方案设计到合同条款的完整指南

市面上安全厂商的宣传语天花乱坠,但真正效果如何,只有做了才知道。POC(概念验证)测试,是甲方唯一能“亲眼看见”厂商真实能力的环节,也是决定采购成败的关键。然而,很多企业要么走流程式地跑一遍…

作者头像 李华
网站建设 2026/4/21 10:18:10

从NeRF到3DGS:为什么说球谐函数是处理视角相关外观的‘瑞士军刀’?

从NeRF到3DGS:球谐函数如何成为视角相关建模的终极工具 在计算机图形学和三维重建领域,视角相关外观(view-dependent appearance)的建模一直是核心挑战之一。想象一下金属表面随着观察角度变化而产生的光泽变化,或者玻璃材质在不同视角下呈现…

作者头像 李华
网站建设 2026/4/21 10:12:54

StructBERT中文情感识别效果展示:新能源汽车用户论坛情绪演化图谱

StructBERT中文情感识别效果展示:新能源汽车用户论坛情绪演化图谱 1. 引言:从用户声音中洞察市场脉搏 如果你是一家新能源汽车公司的产品经理,每天面对海量的用户论坛帖子,你会怎么快速了解用户对新车发布、软件更新或充电服务的…

作者头像 李华
网站建设 2026/4/21 10:10:37

从‘心跳’到‘接管’:深入浅出图解Heartbeat工作原理,搞懂Linux高可用集群的通信与仲裁机制

从‘心跳’到‘接管’:深入浅出图解Heartbeat工作原理,搞懂Linux高可用集群的通信与仲裁机制 想象一下医院的监护仪——当患者的心跳曲线突然变成一条直线,系统会在毫秒级触发警报,备用电源和应急设备同步启动。Linux高可用集群中…

作者头像 李华