news 2026/2/2 14:15:06

大模型算法社招面试全攻略:技术要点+简历优化+代码题解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型算法社招面试全攻略:技术要点+简历优化+代码题解析

本文作者分享了从国企跳槽至大模型算法领域社招的完整经历。详细介绍了职业规划考量、简历准备技巧,以及大模型相关技术面试要点,包括SFT、RAG、Agent等热门技术方向。同时提供了常见代码题考察情况和业务方向分析,为想进入大模型领域的求职者提供全面指导,是一份实用的求职攻略。


一、职业道路规划

在国企工作即将六年的我,终于下定决心走出来。

每当HR面问到我跳槽的原因,我总是机械地回答两个点,一是平台、技术、项目深度没有发展空间,二是薪资。

但当我扪心自问时,离开国企我会失去什么?

我会失去工作的相对稳定性,也会失去这悠闲一些的工作节奏,近些年的一些降薪、工作时长改变和业绩指标改革,也让我觉得国企并不一定是铁饭碗,变革时刻在进行,身如孤船在国企这片大海只能随波逐流,不受个人意志所改变。

性格使然,太过闲散的工作对我是种折磨,在无聊中寻找乐趣简直太难受了。国企也如温水煮青蛙,不进行自我驱动的学习和改变,心气都将被消磨殆尽。

这些年也尝试过一些副业的想法,只收获了一些编程能力的锻炼,随着市场的不景气,收入也逐渐归零。投身股市,自认没有这个本领和抗风险能力。

所以,我还是选择出来看看。既希望进去大模型的风口一搏,也有中年危机的步步紧逼。

二、面经总结

一堆废话感想略过,直接上干货。相对于去年看机会的浅尝辄止,拿了几个中厂offer,今年目标更新为互联网大厂。

1、简历关

今年大模型的行情还不错,凭借本硕学历+国企背景,除了预训练的岗位约不到面试外,各个大中厂过简历毫无问题。

简历内容说实话,没什么发挥空间,保证写上去的所有内容都如数家珍即可,我也没有针对不同厂修改过不同简历。但是可以随着面试节奏和问题热点,补充你的简历内容,比如一开始agent我做的比较浅就没写,但是问的很多+热门,后续我把这块也进行了补充,这样agent的一些岗位也都可以有面试。

2、面试问题

基本以项目细节拷打+穿插大模型八股+代码考察为主,我总结了不同项目遇到的一些常见考察点和自己浅薄的思考,供大家参考。

(1)SFT

  • 各种微调技术原理(高频):基本以LoRA考察为主,包括作用原理、初始化方法、参数、其他变种等。
  • 原理可以从增量权重矩阵的本征维度出发,解析解SVD的不可行性,从而引出秩r作为超参+模型学习的方法;
  • 初始化方法是AB之一全0初始化,并可以介绍LoRA-GA和LoRA-Pro的方法(一般面试官对初始化的变种了解不深);参数有alpha和r;其他变种问的频率较低。 如何评估微调效果?通用能力+生成能力+人工通用能力是否下降?通用数据集测评,解决方法?训练集加入通用数据集,更换不同size基模,全参微调
  • 幻觉?从欠拟合和过拟合的角度分析,有尝试过自动化识别幻觉的方法吗?RAG+LLM评估

(2)RAG

  • Retrival 检索源:数据的收集、清洗,可说的内容不多
  • 索引优化: 分块策略:固定、overlap、递归分割、small2big等方法,从句子和语义截断的思路分析优缺点
  • chunk的原数据附加:源文档提取,人工构造(反向HyDE,上下文编码)
  • 查询优化:HyDE等方法
  • 向量数据库:选型,如何更新数据,问的很少
  • Embedding BM25+Embedding混合检索:BM25的原理,为什么有效果(统计词频TF-IDF角度)
  • 使用的Embedding model原理(M3E,XiaoBu,BGE等):三类任务的InfoNCE+CoSENT混合损失训练,其他对比损失介绍 MRL:混合动态维度,问的很少
  • Generation Reranker Model(mMARCO/MiniCPM/Jina等):原理,为什么需要重排(从原始语义空间的信息完整性出发),和Embedding区别,效果有提升吗
  • LLM SFT 评估指标
  • Embedding model:Recall
  • ReRanker modell:MRR、NDCG
  • End-to-End:Accuracy(LLM基于query、ground truth和生成answer评估)

(3)Agent

  • ReAct prompt的构造方法:prompt构造CoT,我做的比较早,并写在简历上了,所以会问Function call怎么训练的:Function call数据集SFT+强化学习
  • MCP:比较新,可以体现对前沿技术的追踪和理解
  • Agent一些成熟框架:我做的比较浅,没怎么用过

(4)Deepseek&Qwen3&RL

这块单独拿出来说,问的太多了,考察对新技术的追踪和掌握。

  • R1/Qwen3预训练和后训练方法:参考相关技术报告,三/四阶段训练,由于我不做pretraining方向,所以基本能回答上各阶段方法和目标即可。
  • MLA、MoE、PPO/DPO/GRPO:原理+公式,GRPO的改进点和如何实现,大部分面试官的关注点到这结束,个别的会问到critic model损失和训练方法,如何理解未来收益

(5)大模型基础

  • Transformer及其进化
  • Encoder-Decoder架构介绍
  • Positional Encoding
  • Tokenizer:WordPiece、BPE,问的不多
  • Attention(高频):还是常规问题,公式、除以 \sqrt{d_{k}} 原因(方差一致+梯度消失)
  • MHA:动机,不同语义子空间和不同位置提取信息,MQA、GQA、MLA变种,参考上文
  • Normalization:LayerNorm和BatchNorm区别(维度意义+分布假设),具体实现,为什么需要gamma和beta参数
  • FFN:为什么需要,Attention捕捉序列内部,FFN增强单个位置的特征表达
  • Activation Function:介绍几种,ReLU、GELU、GLU、Swish、SwiGLU等掌握几种即可
  • Optimizer:基本没人问
  • BERT
  • 预训练任务:MLM+NSP
  • 变种基本没人问了
  • Decoder-only:泛化性+注意力退化+KV cache+轨迹依赖
  • 多轮对话训练:损失如何计算,只计算最后一轮回答
  • 梯度消失(链式法则和激活函数特性):更换激活函数、归一化、残差、权重初始化
  • 怎么处理长文本:RoPE+bias+长上下文预训练
  • 二分类、多分类的损失函数和评估指标:交叉熵,查准、召回、F1
  • 计网基础:点击url到网页渲染过程发生了什么?get post区别和其他HTTP方法?只有抖音二面问到了,一脸懵,给我搞成web开发了

(6)代码题

统计看来动态规划考察最多,绝大多数集中在Leetcode中等难度。

  • 美团:编辑距离、层次遍历、删除倒数第n个节点、平方根
  • 快手:最长递增子序列、旋转数组最小值(有无重复)
  • 滴滴:最少平方数、最长无重复子串
  • 拼多多:最长特殊子序列
  • 携程:最长无重复子串
  • 阿里云:分词最大概率乘积、层次遍历变种
  • 抖音:跳跃一次的最大连续子数组和
  • 作业帮:最长fib子序列
  • 腾讯:中序后序重建二叉树
  • 百度:旋转数组查找,两个栈实现队列,最长公共子数组
  • 蚂蚁:ip寻址

三、业务方向

  • 安全合规
  • 智能客服/助手
  • 传统搜推

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/30 16:33:52

算法题 增减字符串匹配

942. 增减字符串匹配 问题描述 给定只含 "I"(增加)和 "D"(减少)的字符串 s,令 n s.length。 根据 s 构造一个排列 perm(长度为 n 1),使得对于所有的 i&#x…

作者头像 李华
网站建设 2026/1/30 4:34:00

基于Django的蔬菜批发管理系统设计与实现

基于Django的蔬菜批发管理系统设计与实现 一、系统开发背景与意义 蔬菜批发行业作为农产品流通的关键环节,长期面临供应链效率低、损耗率高、交易流程繁琐等问题。传统模式下,供应商信息分散导致采购比价困难,库存依赖人工盘点易造成积压或缺…

作者头像 李华
网站建设 2026/2/1 7:49:39

京东价格API:历史价格趋势分析与定价参考技术实现

本文介绍如何通过京东开放平台API获取商品历史价格数据,并基于时间序列分析构建定价参考模型。以下为完整技术方案:一、API接入准备认证流程开发者需注册京东宙斯账号,申请price_histroy接口权限,获取app_key和app_secret。请求头…

作者头像 李华
网站建设 2026/2/1 14:10:58

Spring AI实战:实现流式对话中的会话终止功能

前言在AI对话系统中,流式响应(Streaming)已成为提升用户体验的重要技术。然而,当用户面对长时间生成的回复时,往往希望能够在中途终止对话。本文将详细介绍如何在基于Spring AI的项目中实现流式对话的会话终止功能&…

作者头像 李华
网站建设 2026/1/31 12:55:43

告别查重 + AIGC 双重警报!宏智树 AI 教你给论文注入人工原创灵魂

作为深耕论文写作科普的教育博主,后台每天都被毕业生的求助刷屏:“查重率降到 15%,却因 AIGC 检测超标被打回”“降重后语句不通顺,导师吐槽像机器翻译”“AI 写的初稿怎么改才能躲过双重审查”。 随着高校学术审核标准升级&…

作者头像 李华