AI智能体

通过RAG增强大模型回答原本无法回答的问题

前言你报名参与了导游志愿者活动,但对景点并不熟悉的你很难给出令游客满意的景点介绍。你意识到可以通过查询资料来帮助你完成导游工作,这时的你不再扮演知识的输出者,而是知识的总结者。同样地,给大模型配备知识库,也可以让它参考查询到的信息回答原本无法回答的问题。这种结合了信息检索与文本生成的方法就是我们本节课程要介绍的检索增强生成(RAG)

如何为AI智能体构建高效的上下文工程(Context Engineering)?

大模型时代,真正的瓶颈不再是“怎么写提示”,而是“该给模型看什么”。上下文工程(Context Engineering)正取代提示工程,成为构建高性能AI智能体的核心——因为LLM的注意力是有限资源,信息过载反而导致性能衰减。高效智能体的关键,在于用最小、最密的信息集,精准引导模型行为。

Claude放的大招“Agent Skills”:如何让 Agent 具备真实世界能力?

Anthropic推出的Agent Skills,本质是将“提示词工程”升级为“技能模块化”,让Claude能像人一样按需加载知识。它通过“渐进式披露”机制,解决了AI上下文窗口的Token浪费问题,让通用模型瞬间变身专业领域的“特种兵”。但这看似完美的“技能商店”蓝图,也带来了不容忽视的供应链安全风险。

通过优化提示词来提升回答质量

前言想象一下,你正在给一个同事指派一个工作任务,如果只给了他一句话来描述这个需求,他的任务完成效果可能很难达到你的预期。但如果你提供了明确的目标、建议的思考方向和执行策略等更多参考信息,他更有可能以高标准完成任务。使用大语言模型也一样,你的提问方式(提示词)决定了大语言模型的回答质量。在本章节,我们将学习一些编写提示词的技巧,来获得更优质的回答

如何为智能体编写高效工具?

本文探讨了如何为AI智能体设计和优化工具以提升性能。文章提出通过构建原型、开展评估并与智能体协作的迭代流程来改进工具。核心原则包括:1)选择适合智能体的工具而非简单包装API;2)使用命名空间区分工具;3)返回高价值上下文信息;4)优化token使用效率;5)对工具描述进行提示工程优化。研究表明,这些方法能显著提升智能体表现,如Claude Sonnet 3.5在SWE-bench评估中错误率大幅降低。随着AI发展,这种评估驱动的工具优化方法将确保工具与智能体能力同步提升。

拓展学习:多模态大模型、MoE混合专家模型、大小模型云端协同

1多模态大模型1.1什么是多模态大模型每一种信息的来源或者形式,都可以称为一种模态(Modality)。例如,人类会通过色香味点评食物,并通过文字和图片记录。这里的视觉、嗅觉、味觉、文字、图片都是不同的模态。而在大模型领域,模态指的是数据或信息的类型或表达形式,文本、图像、视频、音频等都是不同的模态。多模态,顾名思义,就是指结合两种及以上的模态,进行更综合的数据处理和分析。

通过插件增强大模型的能力

你已经熟练使用大模型的;来自动处理各种批量任务。不过,你可能也发现,并不是所有任务大模型都能完美解决。例如,当你给大模型一批小学难度的计算题,比如393乘以285,它竟然给出了错误答案。就像不擅长数学的人可以使用计算器来解决复杂的算术问题一样,大模型也可以借助插件这种工具来解决它原本难以解决的问题。

认识大模型

你有过使用搜索引擎搜索问题却怎么也找不到有效信息的时候吗?拥有大模型之前我们使用搜索引擎去搜索问题,然而由于网页内容质量参差不齐,你有可能看了五个网页也找不到自己的答案拥有大模型之后直接将输入搜索引擎的问题输入大模型,比如“如何安装Python”,由于大模型有非常庞大且高质量的知识,因此它会输出正确答案,而且会包含不同系统的Python安装方法,比我们直接使用搜索引擎寻找答案方便多了

通过微调改善大模型在垂直领域的表现

微调类似于考生应对闭卷考试的过程,考生需要在考试前经过老师的教学,把书本上的内容吃透,才能写出正确答案。通常只看一遍书不够,要反复看书,多做习题,查漏补缺,及时纠正错误的认知。这种临时抱佛脚的过程,会让很多人精疲力尽,考完试什么事也不想做了。微调也是这样,准备微调数据集的过程已经比较复杂了,微调工作中需要反复尝试,不断寻找最优参数组合,因此整体成本通常比较高。