Agent Skill 是什么?
当前位置:点晴教程→知识管理交流
→『 技术文档交流 』
做 Agent 开发一段时间后,大部分人都会遇到同一个问题: Prompt 越写越长,模型执行越来越飘。 你把所有规范、流程、示例一股脑塞进系统 Prompt,token 蹭蹭涨,模型的注意力却被稀释了——它在"同时看着"几十件事,结果每件事都做得不够准。 Agent Skill 就是在解决这个问题。 核心思路:按需加载把不同能力拆成独立的"技能包",Agent 根据当前任务,只加载需要的那一个。 就像你电脑装了几十个软件,但你只打开当前要用的那个,其他的不占内存。 Context Window 就是 Agent 的"内存",留给当前任务的空间越干净,执行越稳定。 一个 Skill 的三层结构第一层:Metadata(元信息)技能的"身份证"——叫什么、能干什么、什么时候触发。 Metadata 很轻,系统可以把所有技能的 Metadata 一起加载,让 Agent 先选用哪个技能,而不需要把完整内容全暴露出来。 第二层:Instruction(执行指令)真正告诉 Agent "这件事怎么做",只在执行这个技能时才加载进上下文。 第三层:Resources(外部资源)有些技能执行时还需要额外的东西:规则库、模板、脚本、外部工具调用等。这些放在 Resources 层,Agent 按需拉取,用完即走。 三层各司其职
这就是所谓的渐进式披露——信息随执行进度逐步展开,而不是一开始全部堆在上下文里。 设计 Skill 时最容易踩的坑粒度问题。 一个技能对应一个完整的用户意图,不要太粗也不要太细。
描述要精准。 Agent 靠 Metadata 的 description 来判断用不用这个技能,描述模糊就容易选错。 举例比如我们现在需要生成一个视频,但是并不知道怎么做,这时候可以借助这个skill,skills.sh/vercel-labs…,我们把这个 skill 安装到本地
然后直接向 ai 提问,ai 会自动寻找这个 skill,并利用这个skill生成视频 |
相关文章
正在查询... |