云原生集成开发环境——TitanIDE
通过网页在任何地方更安全、更高效地编码2024-10-23
281
近年来,AI 这一热门词汇频繁出现在我们的工作和生活中,相信大家对 ChatGPT、文心一言、通义千问等这些大语言模型都已有所耳闻,甚至亲自体验过。而最近,一股新的AI风潮正在兴起——那就是“AI智能体”。或许有些人对这个概念还感到陌生,接下来,就让我们一起深入了解 AI 智能体,并探讨它与大语言模型之间的紧密联系。
1、什么是 AI 智能体 ?
先从 AI 智能体英文名称(AI Agent)开始说起。
什么是 Agent 呢?—— Agent 是代理的意思。
代理又是什么呢?
讲个大多数人都熟悉的就是房产代理,即便你没买过房子,肯定住过房子,说起房子所有人都不陌生。比如说你想买套房,当然可以选择万事亲力亲为,但那太难了,找房源、对比、下定、付款、办证、交税等一系列好多事情都要做。
这时,你可以选择把这些活都交给代理来做,告诉他你的需求,比如多大面积、预算以及其他条件,代理就开始帮你收集房源,和你沟通确认后,办证、交税等辛苦活都可以替你完成。相对于亲力亲为,交给房产代理可就轻松多了。
言归正传,AI 智能体,即人工智能体(Artificial Intelligence Agnet),是具有自主性、学习能力和推理能力的计算机程序,是一种能够通过感知环境信息、进行决策和执行动作的智能实体。可以依靠 AI 赋予的能力完成特定任务,并在此过程中不断对自我进行完善和改进。具备通过独立思考、调用工具去逐步完成给定目标的能力。
它可以像房产代理一样,你把需求告诉它,就能通过自主思考、进行决策和执行动作帮你完成。可以是简单的,比如一个自动回复邮件的软件;也可以是复杂的,如自动驾驶汽车中的决策系统,或者是能够在复杂环境中进行战略决策的高级智能系统。
对比前面提到的房产代理,AI 智能体通常具备以下几个特点:
AI 智能体的工作与房产代理的工作流程非常类似,只不过会更加智能化、自动化,进一步的把人从重复、无创新的工作中解脱出来。
如下图,AI 智能体主要由以下4个部分组成:
用一个简单的例子,再次说明 AI 智能体的工作流程。
出门前,我问AI智能体是否需要带雨伞,代理接收到这个问题后,把问题传输给大脑,大脑理解、分析、拆解问题,告诉代理需要收集目的地的信息,代理协调其他智能体(感知)收集信息回传给大脑,大脑结合这些信息进行决策,把需要带雨伞的结果告知代理,代理通知行动系统,行动系统取出雨伞递给我。
2、大语言模型和 AI 智能体(AI Agent)的区别 ?
像我们之前接触到的 Chat GPT、文心一言、通义千问、讯飞大模型等这些都是属于大语言模型。大语言模型(LLM)是一种人工智能(AI)算法,它使用深度学习技术和大量大型数据集来理解、总结、生成和预测新内容。
大语言模型与人类之间的交互是基于 prompt(提示词) 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果,例如 ChatGPT 都需要明确任务才能得到有用的回答。
大语言模型和 AI 智能体的区别在于 AI 智能体可以独立思考并做出行动,具有更高的自主性和智能性。它不再仅仅依赖于预设的规则和算法,而是能够通过学习不断优化自己的行为,以适应不同的环境和任务。仅需给定一个目标,它会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,自己给自己创建 prompt,来实现目标。
大语言模型也作为 AI 智能体的核心组件之一,为其提供了强大的自然语言处理能力和知识库。通过不断训练和优化,大语言模型能够生成更加准确和流畅的文本,为 AI 智能体提供更加丰富的信息和支持。这使得 AI 智能体在理解和回应用户指令时更加得心应手,能够更好地满足用户的需求和期望。
我们看见的 AI 智能体往往以问答机器人作为交互入口,通过自然语言触发全自动的工作流,中间没有人工介入。人只负责发送指令,并不参与对 AI 结果的反馈。
大语言模型LLM当前的一些缺点:
比如让 ChatGPT 买一杯咖啡,ChatGPT 给出的反馈一般类似 “无法购买咖啡,它只是一个文字 AI 助手”之类的回答。但你要告知基于 ChatGPT 的 AI 智能体工具让它买一杯咖啡,它会首先拆解如何才能为你购买一杯咖啡并拟定代用某 APP 下单以及支付等若干步骤,然后按照这些步骤调用 APP 选择外卖,再调用支付程序下单支付,过程无需人类去指定每一步操作。这就是 AI 智能体的用武之地,它可以利用外部工具来克服这些限制。
总而言之,AI 智能体就是结合大语言模型能去自动思考、规划、效验和执行的一个计算体,以完成特定的任务目标,如果把大语言模型比作大脑,那 AI 智能体可以理解为小脑 + 手脚。
3、怎么将 AI 智能体运用到工作中 ?
行云创新融合了大语言模型、RAG技术、工作流自动化、插件集成与知识库调用等多项不同领域技术,打造了一个高度个性化的企业级数智化智能体——NebulaAI。支持自主创建AI应用,构建私有知识库、自定义式插件、集成第三方业务系统,助力企业打造智能生态。智能体应用主要可用于以下多个行业业务场景:
1)制造业:
2)金融业:
3)医疗业:
4)旅游业:
5)教育业: