AI领域的新技能不是提示工程,而是上下文工程 (搬运自HackerNews 2025-07-01)
作者:微信文章AI领域的新技能不是提示工程,而是上下文工程
随着AI代理(Agents)的兴起,讨论的焦点正从“提示工程”转向一个更广泛且强大的概念:上下文工程(Context Engineering)。正如Tobi Lutke所说,上下文工程是“为任务提供所有必要上下文,使其能够被大语言模型(LLM)合理解决的艺术”。
什么是上下文?
上下文不仅是发送给LLM的单一提示,而是模型生成响应前所看到的一切。它包括以下部分:
指令/系统提示:定义模型行为的初始指令,可以包含示例或规则。用户提示:用户直接提出的问题或任务。状态/历史(短期记忆):当前对话的上下文,包括之前的用户和模型响应。长期记忆:跨会话的持久知识库,如用户偏好或项目摘要。检索信息(RAG):来自外部文档或数据库的最新相关知识。可用工具:模型可以调用的功能定义(如发送邮件或查询库存)。结构化输出:模型响应的格式定义(如JSON对象)。
为什么上下文工程如此重要?
构建真正有效的AI代理的关键不在于代码的复杂性,而在于提供的上下文质量。以下是两个示例:
廉价演示代理
上下文贫乏:仅看到用户的请求。响应:“谢谢你的消息。明天我有空。请问你具体想约什么时间?”
神奇代理
上下文丰富:包括日历信息、历史邮件、联系人列表和工具定义。响应:“嘿Jim!明天我全天都有会议。周四上午有空吗?我已经发了一个邀请,你看是否合适。”
神奇之处不在于更智能的模型或算法,而在于为任务提供了正确的上下文。
从提示工程到上下文工程
“提示工程”专注于在单一文本中设计完美的指令,而“上下文工程”则更为广泛:
上下文工程是一门设计和构建动态系统的学科,旨在为LLM提供完成任务所需的一切信息、工具和格式。
上下文工程的特点:
系统而非字符串:上下文是系统在LLM调用前生成的动态输出。动态性:根据任务实时调整,可能包括日历数据、邮件或网页检索。信息与工具的时机:确保模型不会遗漏关键细节。格式的重要性:清晰的信息摘要比原始数据更有用。
结论
构建强大且可靠的AI代理越来越依赖于上下文工程,而非寻找完美的提示或模型更新。这是一项跨领域的挑战,涉及业务用例的理解、输出的定义以及信息的结构化。
参考资料:
Tobi Lutke的推文Karpathy的推文上下文工程的兴起
页:
[1]