AI里的Agent、Skill、大模型到底是什么关系？看完这篇终于懂了

AI教程19小时前更新小小编

1 2

最近和几个做AI的朋友聊天，发现一个有意思的现象：

大家都在说Agent、Skill、大模型，但很少有人能说清楚这三个东西到底是什么关系。

有人说"Agent就是加了工具的大模型"，有人说"Skill是Agent的插件"，还有人说"大模型就是Agent的一部分"。

说实话，这些说法都对，但都不够准确。

今天我想用一个更清晰的框架，把这三者的关系彻底讲明白。

一、先说结论：一个公司的比喻

如果把一个AI系统比作一家公司：

角色	对应	负责什么
CEO（大脑）	LLM 大模型	理解问题、做决策、给建议
执行团队（身体）	Agent 智能体	规划任务、调度资源、执行行动
部门专业能力（技能包）	Skill 技能	财务、法务、营销等专业知识和流程

一个完整的AI系统 = LLM（思考） + Agent（行动） + Skill（专业化）

现在，让我们逐个拆解。

二、LLM（大模型）：会思考但不会行动的"大脑"

它能干什么？

LLM就是我们常说的GPT、Claude、文心一言这些东西。它的核心能力是：

能力	示例
理解语言	你说"帮我写个邮件"，它知道你要什么
生成文本	根据你的需求写出连贯的文字
推理	"如果A发生，那么B可能..."
总结	把一篇长文章提炼成几句话

它不能干什么？

关键点：LLM只是一个"文本处理引擎"，它不能直接影响现实世界。

举个例子：

✅ 你问它"怎么订机票"，它能告诉你步骤
❌ 但它不能帮你打开浏览器、登录网站、填表单、付款

LLM就像一个坐在办公室里的顾问——很聪明，但没有手脚。

三、Agent（智能体）：能行动的"执行者"

Agent是什么？

Agent是把LLM的"智能"和"行动能力"结合起来的系统。

它的核心架构包括4个模块：

模块	作用	类比
感知（Perception）	接收信息（用户输入、API数据、文件等）	眼睛和耳朵
规划（Planning）	把复杂任务拆解成步骤	大脑的执行功能
行动（Action）	调用工具、执行操作	手和脚
记忆（Memory）	记住历史对话和重要信息	大脑的记忆系统

一个具体例子

任务： "帮我订一张明天去上海的机票"

LLM能做的：

"您可以访问携程或飞猪，搜索明天去上海的航班，
选择合适的时间和价格，然后填写乘客信息并支付。"

Agent能做的：

1. [感知] 理解任务：订机票、目的地上海、时间明天
2. [规划] 拆解步骤：
   - 查询航班信息
   - 筛选符合条件的航班
   - 获取用户偏好（时间/价格）
   - 填写订单
   - 完成支付
3. [行动] 调用工具：
   - 调用航班查询API
   - 调用支付API
4. [记忆] 记住：用户常坐的航空公司、座位偏好

看到区别了吗？LLM只是"告诉你怎么做"，Agent是"帮你做完"。

四、Skill（技能）：Agent的"专业能力扩展包"

Skill是什么？

如果说Agent是一个执行者，那Skill就是它的"工作手册"或"专业培训包"。

举个例子：

一个通用Agent就像一个刚毕业的大学生——聪明，但缺乏专业经验。

当你给它装上一个"财务分析Skill"，它就变成了一个懂财务的专家。

Skill的技术实现

Skill不是传统意义上的"代码插件"，而是一套专门的提示词模板+工作流程+领域知识。

一个Skill通常包含：

组成部分	内容	示例
SKILL.md	核心指令文件	"你是一个财务分析专家，擅长..."
工作流程	执行步骤	"第一步：读取财报，第二步：计算指标..."
领域知识	专业术语和规则	"毛利率 = (营收 - 成本) / 营收"
辅助脚本	Python/Bash脚本	复杂计算、数据处理

渐进式披露机制

这是Skill的一个关键技术创新。

问题： LLM的上下文窗口有限（比如200K tokens），如果一次性加载100个Skill的所有内容，会爆掉。

解决方案： 分层加载

第一层（元数据）：Skill名称、简短描述
    ↓ 只有相关时才加载
第二层（指令）：详细的工作流程和最佳实践
    ↓ 只有需要时才加载
第三层（资源）：脚本、参考文档

类比： 就像你的大脑不会一次性记住所有知识，而是"需要时才调取"。

五、三者关系的完整图景

关系总结

用户请求
    ↓
【Agent】接收任务
    ↓
【Agent】调用【LLM】理解任务并做决策
    ↓
【Agent】根据任务类型，加载相关【Skill】
    ↓
【Skill】提供专业知识和工作流程
    ↓
【Agent】执行具体行动（调用工具、API等）
    ↓
【LLM】辅助推理和生成输出
    ↓
返回结果给用户

用人体类比

AI组件	人体对应	作用
LLM	大脑（思考中枢）	理解、推理、决策
Agent	身体（执行系统）	规划、行动、记忆
Skill	专业训练	医生的医学知识、律师的法律知识

一个完整的AI系统 = 有大脑 + 有身体 + 有专业技能的"人"

六、为什么这个区分很重要？

1. 判断AI工具的成熟度

工具类型	特征	成熟度
只有LLM	ChatGPT、Claude对话	玩具阶段
LLM + Agent	能自动执行多步骤任务	生产力工具
LLM + Agent + Skill	能可靠完成专业任务	企业级应用

举例：

ChatGPT = 只有LLM（你问它答）
Cursor = LLM + Agent（能自动写代码、调试、运行）
企业级AI客服 = LLM + Agent + Skill（能处理退款、查询订单、解决问题）

2. 理解AI的能力边界

只有LLM的系统：

❌ 不能记住你上次说了什么（无记忆）
❌ 不能主动执行任务（无行动）
❌ 不能调用外部工具（无工具集成）

有Agent的系统：

✅ 能记住上下文
✅ 能自主规划和执行
✅ 能调用API、数据库、搜索引擎

有Skill的系统：

✅ 能可靠地完成专业任务
✅ 能按照行业标准执行
✅ 能处理复杂的垂直领域问题

3. 预测AI的发展方向

2026年的趋势：

阶段	特征
过去（2023）	LLM爆发，大家都在玩ChatGPT
现在（2026）	Agent普及，AI从"对话"变成"行动"
未来（2027+）	Skill生态，专业化AI大规模应用

类比：

LLM时代 = 智能手机刚出现（大家都在玩）
Agent时代 = App Store出现（开始有实用工具）
Skill时代 = 垂直领域App成熟（每个行业都有专业应用）

七、程序员该关注什么？

1. 从"写代码"到"编排Agent"

过去： 你写每一行代码现在： 你告诉AI写什么代码未来： 你设计Agent的工作流，AI自己写代码

2. Skill开发会成为新的"插件经济"

就像WordPress有插件、VSCode有扩展，未来AI Agent也会有Skill市场。

机会： 开发垂直领域的Skill（财务分析、法律咨询、医疗诊断等）

3. 理解架构比会用工具更重要

会用ChatGPT ≠ 懂AI

真正有价值的是：

理解LLM的能力边界
知道什么时候需要Agent
能设计Skill来解决专业问题

最后说一句

LLM、Agent、Skill不是三个独立的东西，而是AI系统从"玩具"进化到"生产力工具"的三个必要层次。

LLM给了AI"智能"
Agent给了AI"行动力"
Skill给了AI"专业能力"

当这三者结合，AI才能真正替代人类的工作。

而这个过程，正在发生。

💬 今天的问题

你用过的AI工具，属于哪个层次？（LLM / Agent / Skill）
你觉得你的工作，会被哪个层次的AI替代？
如果让你开发一个Skill，你会选什么领域？

评论区聊聊 👇

Agent Skills 终极指南：入门、精通、预测

AI教程 # AI技能开发 # Claude技能 # 智能体应用

小小编

31种打光提示词模板送给你，AI绘图直接套

AI教程 # 人像布光 # 光影提示词 # 布光技巧

小小编

严谨写作：如何让模型"先给引用/后下结论"？

AI教程 # AI幻觉防范 # 严谨写作 # 提示词工程

小小编

如何在 Codex 中直接使用 Claude Code 的 Skills

AI教程 # 技能同步 # 符号链接 # 跨平台共享

小小编

2 条评论

评论已关闭...

社恐摸鱼侠读者
这比喻挺形象的，公司那套一下就懂了
19小时前
糟心玩意儿读者
LLM真就是个嘴强王者，光说不动手😂
10小时前

AI里的Agent、Skill、大模型到底是什么关系？看完这篇终于懂了

一、先说结论：一个公司的比喻

二、LLM（大模型）：会思考但不会行动的"大脑"

它能干什么？

它不能干什么？

三、Agent（智能体）：能行动的"执行者"

Agent是什么？

一个具体例子

四、Skill（技能）：Agent的"专业能力扩展包"

Skill是什么？

Skill的技术实现

渐进式披露机制

五、三者关系的完整图景

关系总结

用人体类比

六、为什么这个区分很重要？

1. 判断AI工具的成熟度

2. 理解AI的能力边界

3. 预测AI的发展方向

七、程序员该关注什么？

1. 从"写代码"到"编排Agent"

2. Skill开发会成为新的"插件经济"

3. 理解架构比会用工具更重要

最后说一句

热门话题

31种打光提示词模板送给你，AI绘图直接套

没有更多了...

相关文章

Agent Skills 终极指南：入门、精通、预测

31种打光提示词模板送给你，AI绘图直接套

严谨写作：如何让模型"先给引用/后下结论"？

如何在 Codex 中直接使用 Claude Code 的 Skills

2 条评论

热门文章

热门网址