AI Agent基本概念
一、为什么有了LLM还需要Agent
早期的大语言模型可以回答我们提出的问题,对应给出图片、代码、攻略等。但仅仅局限于回复,不能帮我们执行,且交互性较差。而Agent在LLM的基础上,可以回答我们的问题,并制定方案去执行,且在执行过程中可以与提问者进行交互,共同完成某些事情。
二、什么是AI Agent
感知层 (Perception):负责感知、接收用户指令。包括文本、图片、其他非结构化文件等。
大脑(Brain):其实就是LLM,理解用户意图,并形成决策。
规划(Planning):按照决策拆分出更细的执行步骤。
工具(Tools):执行具体步骤时调用的工具、API等。
记忆(Memory):管理上下文,提供长期知识存储。
三、什么是大语言模型(LLM)
大语言模型,简单理解其实就是个概率模型,根据提出的问题,判断结果所需的文字大概率的集中于哪些词也就是token(词元),再对得到的结果进一步分析,循环往复,最终将得到的词组成一段通顺的文字。
用户与LLM进行交互的重点是Prompt(提示词)工程,我们给出的问题指令越清晰得到的最终结果准确性越高。
一个prompt通常由四部分组成:
上下文:问题中涉及的身份、背景。
指令:明确任务的目标。
示例(非必须):一个prompt的格式示例。
格式要求:格式说明。
3.1 DeepSeek API调用
先从官网申请API Key,它是用来识别调用客户身份的唯一标识。通俗讲就是官网注册后会分配给一串字符,证明是你自己,将来调用API产生的所有token消耗都是通过唯一标识计算的。申请API Key的链接如下:
https://platform.deepseek.com/(创建完以后及时保存)
注册完以后您发现,没有token,要花钱买。是的没错,并不赠送免费token,且输入输出都是要token的,而且输出会更贵一点点,就是要花钱(好奇心驱使下我还是花钱了)。
重要参数
base_url(必填):https://api.deepseek.com 或者https://api.deepseek.com/v1(其中V1仅为兼容OpenAI并不是版本号)。
model(必填):eepseek-chat(DeepSeek 的非思考模式,响应速度快);deepseek-reasoner(DeepSeek 的思考模式,推理能力更强,适合复杂问题)。
代码案例如下
importosfromopenaiimportOpenAI# 初始化客户端client=OpenAI(# 此处环境变量中配置的是我们申请的apikeyapi_key=os.environ.get('DEEPSEEK_API_KEY'),base_url="https://api.deepseek.com")try:response=client.chat.completions.create(model="deepseek-chat",# system 角色相当于对系统的人设进行定义# user 角色代表用户输入的问题# assistant 是模型生成的回复,可以将历史答复写入,实现多轮上下文对话messages=[{"role":"system","content":"你是一个证券行业知识助手"},{"role":"user","content":"什么是永续债"},],# 非流式打印,一次性打印所有结果;如果是流式打印,输出是实时输出的(逐字返回)stream=False)# 打印回复内容print("答复:",response.choices[0].message.content)exceptExceptionase:print("调用失败:",str(e))输出结果如下
答复: 永续债,又称“无期债券”,是指没有明确到期日或期限非常长的债券。其特点如下: 1. **无固定到期日**:发行方无需在特定日期偿还本金,但通常设有赎回权(如5年后可赎回)。 2. **利息支付**:定期支付利息,但发行方可能有权延迟付息(通常需满足一定条件)。 3. **股债混合属性**:在会计处理上,永续债可能被计入权益(而非负债),以降低企业杠杆率;但在法律上,它仍属债务工具。 4. **高票息**:因期限不确定且风险较高,票面利率通常高于普通债券。 5. **常见用途**:银行补充资本(如二级资本债)、企业长期融资等。 **风险提示**:投资者需关注发行方是否延迟付息、赎回条款及利率调整机制(如利率跳升)。在中国,永续债由证监会、央行等监管,发行人包括金融机构和大型国企。3.2 通义千问API调用
同样也是需要先申请APIKEY,申请链接如下(可以用阿里云的账号登录)
https://bailian.console.aliyun.com这个比较友好,有一定的免费额度供我们使用。
非流式调用代码案例
fromopenaiimportOpenAIimportos client=OpenAI(api_key=os.environ.get('QIANWEN_API_KEY'),# 华北2(北京)的 base_url(其他地区参考官网)base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",)completion=client.chat.completions.create(model="qwen3.6-flash-2026-04-16",messages=[{'role':'system','content':'你是一个证券行业知识助手'},{'role':'user','content':'什么是永续债'}])print(completion.choices[0].message.content)流式处理调用代码案例
fromopenaiimportOpenAI client=OpenAI(api_key=os.environ.get('QIANWEN_API_KEY'),base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",)completion=client.chat.completions.create(model="qwen3.6-flash-2026-04-16",messages=[{'role':'system','content':'你是一个证券行业知识助手'},{'role':'user','content':'什么是永续债'}],stream=True,stream_options={"include_usage":True})forchunkincompletion:# chunk 里可能没有 choices 或 deltaifhasattr(chunk,"choices")andlen(chunk.choices)>0:choice=chunk.choices[0]ifhasattr(choice,"delta")andhasattr(choice.delta,"content"):print(choice.delta.content,end='',flush=True)输出结果如下(是markdown格式的)
作为证券行业知识助手,我为您系统梳理**可转债(Convertible Bond)**的核心要点: --- ### 🔹 一、基本定义 **可转债**全称为“可转换公司债券”,是上市公司依法发行的一种**混合型证券**。它兼具**债权**与**股权**双重属性: - **债性**:持有期内按约定支付票息,到期偿还本金; - **股性**:在约定期限内,投资者可按事先约定的条件,将债券转换为公司普通股; - 若未行权转股,则作为普通债券持有至到期。 --- ### 🔹 二、核心特征:进可攻、退可守 | 维度 | 说明 | |------|------| | **下行保护(债底)** | 即使正股大跌,转债价格通常不会跌破纯债价值+合理利息,形成“安全垫” | | **上行弹性(股性)** | 正股上涨时,转债价格跟随走强,涨幅由“转股溢价率”决定,通常略低于正股但波动更小 | | **内含期权** | 本质是“利率债券 + 欧式看涨期权”,价值受正股价格、波动率、剩余期限、利率环境等多因素影响 | --- ### 🔹 三、关键条款解析(决定走势的核心) | 条款 | 触发条件(常见标准) | 作用与影响 | |------|------------------|-----------| | **转股价格** | 通常取募集公告前20日均价与前1交易日均价孰高 | 决定转换比例(转股数=100元÷转股价) | | **向下修正(下修)** | 正股持续低迷,公司股东大会通过后实施 | 降低转股价 → 提升转股价值 → 刺激转债上涨 | | **强赎条款(公司权利)** | 正股连续N个交易日收盘≥转股价130%(具体以募集说明书为准) | 公司可按面值+应计利息强制赎回,倒逼投资者转股或卖出 | | **回售条款(投资者权利)** | 正股连续N个交易日收盘≤转股价70%~80% | 投资者可按约定价格将转债卖回给公司,提供底线保护 | | **票面利率** | 通常较低(首年约0.2%~2%),多数逐年终端递增 | 弥补低息缺陷,利息免征个人所得税 | --- ### 🔹 四、投资优势与风险提示 ✅ **优势** - 风险收益比优化:牛市跟涨、熊市抗跌 - 交易友好:沪深交易所上市,**T+0交易**,无涨跌幅限制(设临时停牌),**免收印花税** - 资金效率高:保证金占用少,适合波段与套利策略 ⚠️ **主要风险** - **信用风险**:发行人违约或评级下调(如ST转债、低评级债) - **强赎踏空**:未及时应对强赎公告,被低价强制赎回 - **流动性风险**:小规模转债易出现买卖价差大、难以成交 - **正股暴雷**:公司基本面恶化导致“股债双杀” - **溢价率陷阱**:高溢价转债(>30%)偏债性,上涨乏力;负溢价极少,多为折价套利机会 📊 **核心定价指标**:`转股溢价率 = (转债价格 - 转股价值) / 转股价值 × 100%` 溢价率低 → 偏股性强,跟涨明显;溢价率高 → 偏债性强,防御为主。 --- ### 🔹 五、A股市场实务提示 1. **适用人群**:稳健型偏成长投资者、资产配置者、具备基础交易能力的个人/机构 2. **筛选逻辑**:优先选择正股基本面扎实、信用评级AA及以上、余额适中(20亿以内较活跃)、条款博弈明确(如下修空间大)的标的 3. **操作节奏**:密切关注强赎公告期、下修提案进展、正股技术面与行业景气度 4. **合规提醒**:部分券商对新手开通可转债交易权限设有资产与经验门槛(如最近20个交易日日均资产≥10万元+2年交易经验) --- 💡 **一句话总结**:可转债是“带期权的债券”,通过条款设计实现风险与收益的动态平衡。理性参与需读懂募集说明书、跟踪溢价率与正股趋势,避免盲目追高或忽略强赎规则。 如需了解具体转债的条款拆解、溢价率测算方法或历史周期表现特征,可提供代码或名称,我将为您进一步分析。 *注:以上内容为专业知识普及,不构成任何投资建议。市场有风险,决策需谨慎。*四、提示词(Prompt)
提示词简单说就是我们向AI提问的表述,这在很大程度上决定了模型的性能以及准确率,所以有必要设计一套模板,让提问者的问题按照模板提出,提高答案命中率,好的提示词可以减少API调用,节约成本 ,而且可以一步到位,避免多次往复造成时间和成本的消耗(其实和人一样就是一个提高对其颗粒度的事情)。也就是提示词工程。
与AI对话的角色分为三种:
system:系统角色,用来设置AI的身份规则,在问答开始前生效
user:用户角色,用户提出的问题
assistant:助手角色,模型历史答复,可以让AI在历史基础上进行答复
user和assistant永远以user开始,交替出现。
4.1 提示词技巧
向谁解释 + 篇幅限制 + 沟通边界 + 用途 + 任务拆解 + 精炼简洁
向新入职的证券小白(向谁)用500字左右(篇幅)书面语(边界)说明期货是什么,并举例说明(任务拆解)数据与指令分离
使用自定义标签将数据与指令分离
情分析<question>标签中的问题并给出答案 <question> 鸡兔同笼..... </question>常用标签
标签 内容 待分析的文档或文章 <user_input> 来自外部的、不完全可信的用户输入 背景信息、参考资料 示例内容 需要回答的具体问题 需要处理的数据
4.2 避免AI胡说八道
AI仅仅是个概率学问题,并不会像人一样思考,即便有些问题没有答案,它也会竭尽所能预测答案中可能包含的词元,然后按照格式特别认真的回答。专业说法叫“幻觉”。所以要求我们在使用AI的时候首先自己要真的明白,有能力辨别对错优劣,而不是盲目使用。当然也有一些私有化的平台做的不错,对未知问题给出了默认的答复(如:恒生U+的问答助手)。当然也有一定的办法避免类似情况发生。
规定未知答复
你是一个资深反洗钱专员,请分点罗列2026反洗钱新规的政策变动。如果不确定请直接回答“无可靠内容”限定材料范围
请依据<document>中的内容分析,未来网络生态链技术的A股走势逐步递进
请列举现有AI IDE工具的使用情况,以及token收费情况,按照客户量从多到少排列,最后给出推荐标注消息来源以及置信度
请分析XXX产品与上证50的指数拟合程度,标注消息来源,并说明置信度。 可信:消息确切可靠 一般:可靠但不完全确认 不可信:没有找到依据,仅仅是猜测
五、词元(Token)
AI处理文本的单位,它既不是词也不是字或者单词(对于AI而言其实无法严格区分字和词)。1000个token大约500个汉字左右,700个左右的单词。
模型的输入和输出都是需要消耗token的而且一般输出比输入的token计费标准会高一些。
一般在输入中,将重点信息放置在整个输入的开头或者结尾,因为中间内容更容易被模型遗忘。
六、推理和规划
对于AI Agent来说就是将问题拆解成一个个的步骤,以及自我调整修复的过程。
思维链CoT(Chain of Thought)
思维链顾名思义就是让大模型在输出结果前,显示的给出思维过程。能有效的避免答非所问,也为后续问题的进一步探索提供了依据。
ReAct 框架(Reasoning + Acting)
让大模型遵循先思考再行动再观察的原则,适合渐进式的问题探索。
但是思考、行动、观察的动作都是堆积在上下文中的,及容易陷入死循环,或者因为上下文超出而导致分析出现错误。
规划先行执行模式(Plan-and-Execute)
ReAct就是走一步做一步,对每一步进行分析。而Plan-and-Execute就像我们做项目一样,先分析一下出个设计出来,再按照设计逐步完成任务。
树状多路径探索(Tree-of_Thoughts)
一个问题的解决往往不止有一种方法,可能会有多种方式,就像数据结构中的树结构一样,有了全路径以后,对具体的步骤节点打分加权,再按照深度优先或者广度优先的方式得到一个最优实施路径。
自我反思与纠错(Reflection)
和我们人一样对于执行错误的步骤进行分析,提高模型自身命中率。
者因为上下文超出而导致分析出现错误。
规划先行执行模式(Plan-and-Execute)
ReAct就是走一步做一步,对每一步进行分析。而Plan-and-Execute就像我们做项目一样,先分析一下出个设计出来,再按照设计逐步完成任务。
树状多路径探索(Tree-of_Thoughts)
一个问题的解决往往不止有一种方法,可能会有多种方式,就像数据结构中的树结构一样,有了全路径以后,对具体的步骤节点打分加权,再按照深度优先或者广度优先的方式得到一个最优实施路径。
自我反思与纠错(Reflection)
和我们人一样对于执行错误的步骤进行分析,提高模型自身命中率。