一文带你读懂什么是AI智能体，和大语言模型有什么关系？

2024-10-23

3857

近年来，AI 这一热门词汇频繁出现在我们的工作和生活中，相信大家对 ChatGPT、文心一言、通义千问等这些大语言模型都已有所耳闻，甚至亲自体验过。而最近，一股新的AI风潮正在兴起——那就是“AI智能体”。或许有些人对这个概念还感到陌生，接下来，就让我们一起深入了解 AI 智能体，并探讨它与大语言模型之间的紧密联系。

1、什么是 AI 智能体？

先从 AI 智能体英文名称（AI Agent）开始说起。

什么是 Agent 呢？—— Agent 是代理的意思。

代理又是什么呢？

讲个大多数人都熟悉的就是房产代理，即便你没买过房子，肯定住过房子，说起房子所有人都不陌生。比如说你想买套房，当然可以选择万事亲力亲为，但那太难了，找房源、对比、下定、付款、办证、交税等一系列好多事情都要做。

这时，你可以选择把这些活都交给代理来做，告诉他你的需求，比如多大面积、预算以及其他条件，代理就开始帮你收集房源，和你沟通确认后，办证、交税等辛苦活都可以替你完成。相对于亲力亲为，交给房产代理可就轻松多了。

言归正传，AI 智能体，即人工智能体（Artificial Intelligence Agnet），是具有自主性、学习能力和推理能力的计算机程序，是一种能够通过感知环境信息、进行决策和执行动作的智能实体。可以依靠 AI 赋予的能力完成特定任务，并在此过程中不断对自我进行完善和改进。具备通过独立思考、调用工具去逐步完成给定目标的能力。

它可以像房产代理一样，你把需求告诉它，就能通过自主思考、进行决策和执行动作帮你完成。可以是简单的，比如一个自动回复邮件的软件；也可以是复杂的，如自动驾驶汽车中的决策系统，或者是能够在复杂环境中进行战略决策的高级智能系统。

对比前面提到的房产代理，AI 智能体通常具备以下几个特点：

○ 自主性：智能体能够在没有人类直接指导的情况下运行，并对自己的行为负责。
○ 学习能力：通过机器学习等技术，智能体可以从经验中学习，并改进其未来的行为。
○ 适应性：智能体能够根据环境的变化调整自己的行为。
○ 推理能力：智能体可以使用逻辑推理来解决问题或进行决策。
○ 通信能力：在多智能体系统中，智能体之间可以进行通信和协作。

AI 智能体的工作与房产代理的工作流程非常类似，只不过会更加智能化、自动化，进一步的把人从重复、无创新的工作中解脱出来。

如下图，AI 智能体主要由以下4个部分组成：

○ 代理：这是AI智能体的协调中心，接受委托人的请求，把请求转发给大脑，根据大脑的反馈收集信息，把大脑的指令传递给行动系统。
○ 大脑：类似人脑，通常是大模型充当这个角色，有着比人脑大的多的知识库，比人脑强得多的记忆能力和计算能力。
○ 感知：各种收集信息的设备，比如雷达、摄像仪、录音机、传感器等等，类似人的感官，感知外部世界。
○ 行动：就像人的手脚一样，执行大脑发出的拿东西、走路等行动指令。

用一个简单的例子，再次说明 AI 智能体的工作流程。

出门前，我问AI智能体是否需要带雨伞，代理接收到这个问题后，把问题传输给大脑，大脑理解、分析、拆解问题，告诉代理需要收集目的地的信息，代理协调其他智能体(感知)收集信息回传给大脑，大脑结合这些信息进行决策，把需要带雨伞的结果告知代理，代理通知行动系统，行动系统取出雨伞递给我。

2、大语言模型和 AI 智能体（AI Agent）的区别？

像我们之前接触到的 Chat GPT、文心一言、通义千问、讯飞大模型等这些都是属于大语言模型。大语言模型（LLM）是一种人工智能（AI）算法，它使用深度学习技术和大量大型数据集来理解、总结、生成和预测新内容。

大语言模型与人类之间的交互是基于 prompt（提示词）实现的，用户 prompt 是否清晰明确会影响大模型回答的效果，例如 ChatGPT 都需要明确任务才能得到有用的回答。

大语言模型和 AI 智能体的区别在于 AI 智能体可以独立思考并做出行动，具有更高的自主性和智能性。它不再仅仅依赖于预设的规则和算法，而是能够通过学习不断优化自己的行为，以适应不同的环境和任务。仅需给定一个目标，它会根据给定任务详细拆解出每一步的计划步骤，依靠来自外界的反馈和自主思考，自己给自己创建 prompt，来实现目标。

大语言模型也作为 AI 智能体的核心组件之一，为其提供了强大的自然语言处理能力和知识库。通过不断训练和优化，大语言模型能够生成更加准确和流畅的文本，为 AI 智能体提供更加丰富的信息和支持。这使得 AI 智能体在理解和回应用户指令时更加得心应手，能够更好地满足用户的需求和期望。

我们看见的 AI 智能体往往以问答机器人作为交互入口，通过自然语言触发全自动的工作流，中间没有人工介入。人只负责发送指令，并不参与对 AI 结果的反馈。

大语言模型LLM当前的一些缺点：

○ 会产生幻觉。
○ 结果并不总是真实的。
○ 对时事的了解有限或一无所知。
○ 很难应对复杂的计算。
○ 没有行动能力。
○ 没有长期记忆能力。

比如让 ChatGPT 买一杯咖啡，ChatGPT 给出的反馈一般类似 “无法购买咖啡，它只是一个文字 AI 助手”之类的回答。但你要告知基于 ChatGPT 的 AI 智能体工具让它买一杯咖啡，它会首先拆解如何才能为你购买一杯咖啡并拟定代用某 APP 下单以及支付等若干步骤，然后按照这些步骤调用 APP 选择外卖，再调用支付程序下单支付，过程无需人类去指定每一步操作。这就是 AI 智能体的用武之地，它可以利用外部工具来克服这些限制。

总而言之，AI 智能体就是结合大语言模型能去自动思考、规划、效验和执行的一个计算体，以完成特定的任务目标，如果把大语言模型比作大脑，那 AI 智能体可以理解为小脑 + 手脚。

3、怎么将 AI 智能体运用到工作中？

行云创新融合了大语言模型、RAG技术、工作流自动化、插件集成与知识库调用等多项不同领域技术，打造了一个高度个性化的企业级数智化智能体——NebulaAI。支持自主创建AI应用，构建私有知识库、自定义式插件、集成第三方业务系统，助力企业打造智能生态。智能体应用主要可用于以下多个行业业务场景：

1）制造业：

○ 生产线管理：实现生产线的自动化调度和实时监控，根据订单需求、设备状态等因素调整生产计划
○ 智能需求预测：分析历史销售数据、市场需求趋势、季节性因素等，建立精准的库存预测模型，帮助企业提前调整库存水平。
○ 自动化库存管理：实时监控库存状态，预测库存需求，提供智能补货建议，确保库存的及时补充和有效利用。
○ 能源管理：实时监测生产设备的能源消耗情况，制定能源采购和储备计划。并定期评估生产设备的能源效率，制定针对性的节能措施。

2）金融业：

○ 智能信用评估：对借款人的信用记录、财务状况等信息进行分析，为金融机构提供信用评级和风险预警，辅助贷款审批决策。
○ 智能风险管理：对市场数据进行实时分析，预测市场走势和潜在风险，提供投资建议和风险管理策略。
○ 合规审查：自动化处理合规审查工作，提取合规风险点，并提供预警信息。确保审查结果的高度准确性。

3）医疗业：

○ 疾病预测：对患者实现生产线的自动化调度和实时监控，根据订单需求、设备状态等因素调整生产计划
○ 医疗影像分析：自动识别和分析医学影像中的病变区域，提供辅助诊断信息。
○ 患者管理：实时监测患者的健康状况，通过远程监护功能，为患者提供及时的医疗服务。
○ 医疗资源优化：分析医院的运营数据，预测未来的资源需求，制定合理的医疗资源分配计划。

4）旅游业：

○ 旅游规划：分析用户的旅游偏好、预算、时间等条件，为用户量身定制旅游计划。
○ 智能预订系统：通过智能体实现机票、酒店、景区门票等旅游产品的在线预订，帮助用户节省时间和费用。
○ 智能流量管理：实时监测和分析旅游景区的游客流量和分布情况，提供预警和调度机制，优化游客流量。
○ 旅游数据分析：对旅游业内大量各类旅游数据进行整合分析，进行可视化展示和报告生成，帮助旅游企业了解市场动态和用户需求。

5）教育业：

○ 智能辅导：根据学生的学习进度和能力，智能体可以为其推荐最适合的学习资源和路径。并识别其学习薄弱处，提供针对性的强化练习和解析。
○ 学生表现测评：收集和分析学生的学习数据和作业、考试答题情况，生成个性化的学习报告和建议。
○ 教学质量管理：实时监测和分析旅游景区的游客流量和分布情况，提供预警和调度机制，优化游客流量。收集和分析教师的教学行为和学生反馈，提供教学质量评估报告，改进教学方法和策略。
○ 教学内容创作：帮助教育者自动生成练习题、模拟测试等教学内容，提供教学材料的多样性和质量。

上一篇：基于公有大模型和NebulaAI构建AI+MES生产管理系统

下一篇：平台工程：构建企业数字化转型的基石