AI Agent基本概念-开发者社区

AI Agent基本概念

一、为什么有了LLM还需要Agent

早期的大语言模型可以回答我们提出的问题，对应给出图片、代码、攻略等。但仅仅局限于回复，不能帮我们执行，且交互性较差。而Agent在LLM的基础上，可以回答我们的问题，并制定方案去执行，且在执行过程中可以与提问者进行交互，共同完成某些事情。

二、什么是AI Agent

感知层（Perception）：负责感知、接收用户指令。包括文本、图片、其他非结构化文件等。

大脑（Brain）：其实就是LLM，理解用户意图，并形成决策。

规划（Planning）：按照决策拆分出更细的执行步骤。

工具（Tools）：执行具体步骤时调用的工具、API等。

记忆（Memory）：管理上下文，提供长期知识存储。

三、什么是大语言模型（LLM）

大语言模型，简单理解其实就是个概率模型，根据提出的问题，判断结果所需的文字大概率的集中于哪些词也就是token（词元），再对得到的结果进一步分析，循环往复，最终将得到的词组成一段通顺的文字。

用户与LLM进行交互的重点是Prompt（提示词）工程，我们给出的问题指令越清晰得到的最终结果准确性越高。

一个prompt通常由四部分组成：

上下文：问题中涉及的身份、背景。

指令：明确任务的目标。

示例（非必须）：一个prompt的格式示例。

格式要求：格式说明。

3.1 DeepSeek API调用

先从官网申请API Key，它是用来识别调用客户身份的唯一标识。通俗讲就是官网注册后会分配给一串字符，证明是你自己，将来调用API产生的所有token消耗都是通过唯一标识计算的。申请API Key的链接如下：

https://platform.deepseek.com/

（创建完以后及时保存）

注册完以后您发现，没有token，要花钱买。是的没错，并不赠送免费token，且输入输出都是要token的，而且输出会更贵一点点，就是要花钱（好奇心驱使下我还是花钱了）。

重要参数

base_url（必填）：https://api.deepseek.com 或者https://api.deepseek.com/v1（其中V1仅为兼容OpenAI并不是版本号）。

model（必填）：eepseek-chat（DeepSeek 的非思考模式，响应速度快）；deepseek-reasoner（DeepSeek 的思考模式，推理能力更强，适合复杂问题）。

代码案例如下

importosfromopenaiimportOpenAI# 初始化客户端client=OpenAI(# 此处环境变量中配置的是我们申请的apikeyapi_key=os.environ.get('DEEPSEEK_API_KEY'),base_url="https://api.deepseek.com")try:response=client.chat.completions.create(model="deepseek-chat",# system 角色相当于对系统的人设进行定义# user 角色代表用户输入的问题# assistant 是模型生成的回复，可以将历史答复写入，实现多轮上下文对话messages=[{"role":"system","content":"你是一个证券行业知识助手"},{"role":"user","content":"什么是永续债"},],# 非流式打印，一次性打印所有结果；如果是流式打印，输出是实时输出的（逐字返回）stream=False)# 打印回复内容print("答复：",response.choices[0].message.content)exceptExceptionase:print("调用失败：",str(e))

输出结果如下

答复： 永续债，又称“无期债券”，是指没有明确到期日或期限非常长的债券。其特点如下： 1. **无固定到期日**：发行方无需在特定日期偿还本金，但通常设有赎回权（如5年后可赎回）。 2. **利息支付**：定期支付利息，但发行方可能有权延迟付息（通常需满足一定条件）。 3. **股债混合属性**：在会计处理上，永续债可能被计入权益（而非负债），以降低企业杠杆率；但在法律上，它仍属债务工具。 4. **高票息**：因期限不确定且风险较高，票面利率通常高于普通债券。 5. **常见用途**：银行补充资本（如二级资本债）、企业长期融资等。 **风险提示**：投资者需关注发行方是否延迟付息、赎回条款及利率调整机制（如利率跳升）。在中国，永续债由证监会、央行等监管，发行人包括金融机构和大型国企。

3.2 通义千问API调用

同样也是需要先申请APIKEY，申请链接如下（可以用阿里云的账号登录）

https://bailian.console.aliyun.com

这个比较友好，有一定的免费额度供我们使用。

非流式调用代码案例

fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.environ.get('QIANWEN_API_KEY'),# 华北2（北京）的 base_url（其他地区参考官网）base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",)completion=client.chat.completions.create(model="qwen3.6-flash-2026-04-16",messages=[{'role':'system','content':'你是一个证券行业知识助手'},{'role':'user','content':'什么是永续债'}])print(completion.choices[0].message.content)

流式处理调用代码案例

fromopenaiimportOpenAI client=OpenAI(api_key=os.environ.get('QIANWEN_API_KEY'),base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",)completion=client.chat.completions.create(model="qwen3.6-flash-2026-04-16",messages=[{'role':'system','content':'你是一个证券行业知识助手'},{'role':'user','content':'什么是永续债'}],stream=True,stream_options={"include_usage":True})forchunkincompletion:# chunk 里可能没有 choices 或 deltaifhasattr(chunk,"choices")andlen(chunk.choices)>0:choice=chunk.choices[0]ifhasattr(choice,"delta")andhasattr(choice.delta,"content"):print(choice.delta.content,end='',flush=True)

输出结果如下（是markdown格式的）

作为证券行业知识助手，我为您系统梳理**可转债（Convertible Bond）**的核心要点： --- ### 🔹 一、基本定义 **可转债**全称为“可转换公司债券”，是上市公司依法发行的一种**混合型证券**。它兼具**债权**与**股权**双重属性： - **债性**：持有期内按约定支付票息，到期偿还本金； - **股性**：在约定期限内，投资者可按事先约定的条件，将债券转换为公司普通股； - 若未行权转股，则作为普通债券持有至到期。 --- ### 🔹 二、核心特征：进可攻、退可守 | 维度 | 说明 | |------|------| | **下行保护（债底）** | 即使正股大跌，转债价格通常不会跌破纯债价值+合理利息，形成“安全垫” | | **上行弹性（股性）** | 正股上涨时，转债价格跟随走强，涨幅由“转股溢价率”决定，通常略低于正股但波动更小 | | **内含期权** | 本质是“利率债券 + 欧式看涨期权”，价值受正股价格、波动率、剩余期限、利率环境等多因素影响 | --- ### 🔹 三、关键条款解析（决定走势的核心） | 条款 | 触发条件（常见标准） | 作用与影响 | |------|------------------|-----------| | **转股价格** | 通常取募集公告前20日均价与前1交易日均价孰高 | 决定转换比例（转股数=100元÷转股价） | | **向下修正（下修）** | 正股持续低迷，公司股东大会通过后实施 | 降低转股价 → 提升转股价值 → 刺激转债上涨 | | **强赎条款（公司权利）** | 正股连续N个交易日收盘≥转股价130%（具体以募集说明书为准） | 公司可按面值+应计利息强制赎回，倒逼投资者转股或卖出 | | **回售条款（投资者权利）** | 正股连续N个交易日收盘≤转股价70%~80% | 投资者可按约定价格将转债卖回给公司，提供底线保护 | | **票面利率** | 通常较低（首年约0.2%~2%），多数逐年终端递增 | 弥补低息缺陷，利息免征个人所得税 | --- ### 🔹 四、投资优势与风险提示 ✅ **优势** - 风险收益比优化：牛市跟涨、熊市抗跌 - 交易友好：沪深交易所上市，**T+0交易**，无涨跌幅限制（设临时停牌），**免收印花税** - 资金效率高：保证金占用少，适合波段与套利策略 ⚠️ **主要风险** - **信用风险**：发行人违约或评级下调（如ST转债、低评级债） - **强赎踏空**：未及时应对强赎公告，被低价强制赎回 - **流动性风险**：小规模转债易出现买卖价差大、难以成交 - **正股暴雷**：公司基本面恶化导致“股债双杀” - **溢价率陷阱**：高溢价转债（>30%）偏债性，上涨乏力；负溢价极少，多为折价套利机会 📊 **核心定价指标**：`转股溢价率 = (转债价格 - 转股价值) / 转股价值 × 100%` 溢价率低 → 偏股性强，跟涨明显；溢价率高 → 偏债性强，防御为主。 --- ### 🔹 五、A股市场实务提示 1. **适用人群**：稳健型偏成长投资者、资产配置者、具备基础交易能力的个人/机构 2. **筛选逻辑**：优先选择正股基本面扎实、信用评级AA及以上、余额适中（20亿以内较活跃）、条款博弈明确（如下修空间大）的标的 3. **操作节奏**：密切关注强赎公告期、下修提案进展、正股技术面与行业景气度 4. **合规提醒**：部分券商对新手开通可转债交易权限设有资产与经验门槛（如最近20个交易日日均资产≥10万元+2年交易经验） --- 💡 **一句话总结**：可转债是“带期权的债券”，通过条款设计实现风险与收益的动态平衡。理性参与需读懂募集说明书、跟踪溢价率与正股趋势，避免盲目追高或忽略强赎规则。 如需了解具体转债的条款拆解、溢价率测算方法或历史周期表现特征，可提供代码或名称，我将为您进一步分析。 *注：以上内容为专业知识普及，不构成任何投资建议。市场有风险，决策需谨慎。*

四、提示词（Prompt）

提示词简单说就是我们向AI提问的表述，这在很大程度上决定了模型的性能以及准确率，所以有必要设计一套模板，让提问者的问题按照模板提出，提高答案命中率，好的提示词可以减少API调用，节约成本，而且可以一步到位，避免多次往复造成时间和成本的消耗（其实和人一样就是一个提高对其颗粒度的事情）。也就是提示词工程。

与AI对话的角色分为三种：

system：系统角色，用来设置AI的身份规则，在问答开始前生效
user：用户角色，用户提出的问题
assistant：助手角色，模型历史答复，可以让AI在历史基础上进行答复

user和assistant永远以user开始，交替出现。

4.1 提示词技巧

向谁解释 + 篇幅限制 + 沟通边界 + 用途 + 任务拆解 + 精炼简洁

向新入职的证券小白（向谁）用500字左右（篇幅）书面语（边界）说明期货是什么，并举例说明（任务拆解）

数据与指令分离
使用自定义标签将数据与指令分离
```
情分析<question>标签中的问题并给出答案 <question> 鸡兔同笼..... </question>
```
常用标签
标签内容
待分析的文档或文章
<user_input> 来自外部的、不完全可信的用户输入
背景信息、参考资料
示例内容
需要回答的具体问题
需要处理的数据

标签	内容
待分析的文档或文章
<user_input>	来自外部的、不完全可信的用户输入
背景信息、参考资料
示例内容
需要回答的具体问题
需要处理的数据

4.2 避免AI胡说八道

AI仅仅是个概率学问题，并不会像人一样思考，即便有些问题没有答案，它也会竭尽所能预测答案中可能包含的词元，然后按照格式特别认真的回答。专业说法叫“幻觉”。所以要求我们在使用AI的时候首先自己要真的明白，有能力辨别对错优劣，而不是盲目使用。当然也有一些私有化的平台做的不错，对未知问题给出了默认的答复（如：恒生U+的问答助手）。当然也有一定的办法避免类似情况发生。

规定未知答复

你是一个资深反洗钱专员，请分点罗列2026反洗钱新规的政策变动。如果不确定请直接回答“无可靠内容”

限定材料范围

请依据<document>中的内容分析，未来网络生态链技术的A股走势

逐步递进

请列举现有AI IDE工具的使用情况，以及token收费情况，按照客户量从多到少排列，最后给出推荐

标注消息来源以及置信度

请分析XXX产品与上证50的指数拟合程度，标注消息来源，并说明置信度。 可信：消息确切可靠 一般：可靠但不完全确认 不可信：没有找到依据，仅仅是猜测

五、词元（Token）

AI处理文本的单位，它既不是词也不是字或者单词（对于AI而言其实无法严格区分字和词）。1000个token大约500个汉字左右，700个左右的单词。

模型的输入和输出都是需要消耗token的而且一般输出比输入的token计费标准会高一些。

一般在输入中，将重点信息放置在整个输入的开头或者结尾，因为中间内容更容易被模型遗忘。

六、推理和规划

对于AI Agent来说就是将问题拆解成一个个的步骤，以及自我调整修复的过程。

思维链CoT（Chain of Thought）
思维链顾名思义就是让大模型在输出结果前，显示的给出思维过程。能有效的避免答非所问，也为后续问题的进一步探索提供了依据。
ReAct 框架（Reasoning + Acting）
让大模型遵循先思考再行动再观察的原则，适合渐进式的问题探索。
但是思考、行动、观察的动作都是堆积在上下文中的，及容易陷入死循环，或者因为上下文超出而导致分析出现错误。
规划先行执行模式（Plan-and-Execute）
ReAct就是走一步做一步，对每一步进行分析。而Plan-and-Execute就像我们做项目一样，先分析一下出个设计出来，再按照设计逐步完成任务。
树状多路径探索（Tree-of_Thoughts）
一个问题的解决往往不止有一种方法，可能会有多种方式，就像数据结构中的树结构一样，有了全路径以后，对具体的步骤节点打分加权，再按照深度优先或者广度优先的方式得到一个最优实施路径。
自我反思与纠错（Reflection）
和我们人一样对于执行错误的步骤进行分析，提高模型自身命中率。

者因为上下文超出而导致分析出现错误。

规划先行执行模式（Plan-and-Execute）
ReAct就是走一步做一步，对每一步进行分析。而Plan-and-Execute就像我们做项目一样，先分析一下出个设计出来，再按照设计逐步完成任务。
树状多路径探索（Tree-of_Thoughts）
一个问题的解决往往不止有一种方法，可能会有多种方式，就像数据结构中的树结构一样，有了全路径以后，对具体的步骤节点打分加权，再按照深度优先或者广度优先的方式得到一个最优实施路径。
自我反思与纠错（Reflection）
和我们人一样对于执行错误的步骤进行分析，提高模型自身命中率。