Sequoia《生成式 AI 第一幕,智能体推理时代开启》
“在生成式AI革命的两年后,研究领域从‘快速思维’——快速反应的预训练回答,向着‘慢速思维’——推理时的深度思考发展。这一转变正在催生一批全新的智能应用”
本文作者:Chris,Mixdesk AI 研究中心
引言
2024年各领域 AI Agent AI 客服 集中爆发,生成式AI在企业应用层价值迅速放大,全球 AI 应用层公司将通过提供具有自主推理能力的场景服务工具,逐步占据市场。在本期内容中我们将立足客户服务场景,对 AI Agent 定义、工作原理、技术演进结合Mixdesk AI Agent 研发实践探讨 AI Agent AI 客服的发展趋势。
AI Agent 是什么?它的工作原理?
定义与工作原理
AI Agent,也就是人工智能体,通俗的讲,是一个高度拟人计算程序,借助“大模型”大脑,它能完全理解所处环境发生的事情,自己思考问题、做决定、自主执行完成任务。从技术层面看,AI Agent 基础架构是由4个关键部分组成:规划Planning、记忆Memory、工具Tools、行动Action。

规划 Planning
LLM 可以赋予智能体“规划”的思维模式,对复杂的任务进行拆解,拆分为多个步骤,一步步思考和解决,借助RAG等技术工具使输出结果更加准确。
记忆 Memory
类似于人类的“记忆”机制,智能体拥有短期记忆与长期记忆,单次会话的上下文记忆会被短暂的储存,以用于多轮会话,在任务完结后被清空;长期记忆如用户的特征信息、业务信息等通常用向量数据库来存储和快速检索。
工具 Tools
智能体具备使用各种“工具”的能力。比如通过调用软件系统不同应用模块的 API,获取到指定的业务信息,以及执行业务的操作权限。通过调用外部的插件工具,来获取原本 LLM 并不具备的能力。
行动 Action
智能体基于规划和记忆来执行具体的“行动”,完成特定任务。
AI Agent 与大模型 、RAG 的关系
LLM大模型、RAG 检索增强常与 AI Agent 一同出现,他们之间在实际场景应用中究竟有什么样的联系呢?
LLM可以被看作是 Agent 的“思考中枢”。Agent 利用 LLM 的推理能力,将复杂问题细化为多个小问题,并确定它们的解决顺序,即哪些问题需要优先处理。随后,AI Agent 会依据这个顺序,依次调用 LLM、RAG 技术或外部工具来逐一解决这些小问题。在这一过程中 RAG 可以实现加入本地知识库、实时数据等来增强大模型的检索和生成能力,提高信息查询和生成质量。

客户服务 AI Agent 应用价值与技术难点
同样是对话,为什么 AI Agent 如此不同?
在大模型技术广泛应用之前,客户服务自动化主要依靠聊天机器人/Chatbot 来实现。聊天机器人按照预先编写的对话流程工作,通常会重复固定的回复,而 AI Agent 能够进行智能推理。
与 AI Agent 对话的体验更像是与一位聪明的客服人员交流,而与聊天机器人的对话则像是在选项菜单中挑选答案。传统聊天机器人需要创建常见问题列表,并为每个问题准备脚本化的回答,这一过程既耗时又难以扩展。相比之下,AI Agent 如同一名具有巨大潜力的数字员工,能够迅速接入现有的信息源,快速学习并提供个性化的解决方案,帮助客户解决问题。

对于企业来说客户服务 AI Agent 有哪些立竿见影的应用价值?
在营销客服领域,AI Agent 的应用正迅速革新传统模式。技术成熟的 AI Agent 可以高效执行营销及客服场景中标准化重复任务,并通过人机协作的方式处理一些复杂场景。
更智能的售前接待与线索获取:7X24小时在线,意图识别,情绪分析,快速精准的响应,可高度还原真人售前人员,提升售前对话线索获取效率。
更高效的售后服务与客户支持:自动化标准任务、智能路由、人机协同,提升服务效率、解放更多人力,提升客户体验。
无障碍出海营销与客户服务:多语言自动翻译切换,跨时区服务,直接为企业出海业务、全球获客提供最实用的工具。
Mixdesk
AI Agent

客户服务AI Agent技术难点
有了大模型,为什么还会衍生出种类繁多的 Agent?这是因为现实世界是复杂的,在企业活动中的每个场景也是复杂的,现实场景需要大量特定的应用推理,这些推理无法有效地被纳入到一个通用模型中。这就是《生成式 AI 第一幕:智能体推理时代开启》一文中提到的 AI 应用层正在不断自定义特定场景的“认知架构”。

以客户服务领域为例,无论是售前还是售后场景中的 AI Agent 构建,并不是给基础的 AI 模型加个操作界面那么简单,这是一种十分复杂的开发系统,面对不同的AI模型,就像面对一个多才多艺的团队,每个成员都有自己的特长,需要通过一种高效的协调方式,也就是路由机制来集成。除此之外,还会用到特殊的数据库来存储和管理信息(RAG 向量/图形数据库),确保数据安全和合规。最重要的是,Agent 需要实现模仿人类的思考方式,帮助解决复杂问题。
Mixdesk的技术演进—— AI Agent 的诞生
本章节内容来自Mixdesk AI 研究中心负责人访谈实录。
根据产品发展的普遍规律,产品演进通常遵循三个阶段:
起步阶段:在这一阶段,产品的核心功能得以实现,以满足用户的基本需求。
成熟阶段:随着功能的不断丰富和完善,产品开始支持更高层次的用户交互,包括人工干预和调整,以提升用户体验。
创新阶段:在这一高级阶段,产品通过智能化技术实现自主学习和适应,以提供更加个性化和高效的服务。
Mixdesk各产品线正是遵循这一演进路径,紧跟前沿技术,从最初的基础功能实现,逐步过渡到功能丰富和用户友好的优化,到目前全线拥抱AI,重新定义场景需求,推动产品下一层级的发展。
第一代:RASA 时代
Rasa Open Source,一个诞生于2019年的开源机器学习框架。2022年初,Rasa 3.x 的发布,这个机器学习框架迅速在智能客服领域得到广泛应用,Mixdesk也在当时推出了基于 Rasa 的客服机器人商业化产品,覆盖服务售前营销和售后问答场景。

这个阶段的AI客服主要依赖于意图识别和实体提取技术,能够处理结构化的对话流程。但在处理复杂、多轮对话时不够智能。例如,它难以精确理解上下文语境,无法处理复杂的用户询问,应对不在预设范围内的问题时候缺乏灵活性,当需要优化识别和调整话术时,需要补充语料后重新训练。
第二代:SOP + LLM Agent
OpenAI 的 GPT-3 模型的问世标志着一个新纪元的开启,基于这一代技术,Mixdesk针对客服领域开发了一套可控、可调节的场景化 SOP,集成了大型语言模型 Agent 能力。自2024年4月起,产品形态从单一Agent 到多 Agent协同、Workflow 管理,再到现在的 Agent 组合工具+ SOP + Agent Workflow 集成解决方案。

在技术探索的旅程中,我们对多个主流大模型平台进行广泛的调研测试,包括 Dify、Coze、阿里云百炼、火山云方舟、FastGPT、Flowise、RagFlow,希望从中找到最适合的客服场景落地的 To B 解决方案。当前Mixdesk已与行业内领先厂商建立了深度合作关系,包括Azure OpenAI、通义千问、豆包、Claude、DeepSeek、Llama 等。技术更新的速度比我们预想的还要快,在9月份30天时间里,我们连续推出了3个版本的 RAG 知识库方案。在 2.0 版本尚未完全开发完成时,我们发现了更先进的方案,于是果断决定放弃 2.0 版本,直接转向 3.0 版本的开发,以实现技术的快速演进。
截止目前,Mixdesk全产品线 AI 功能均向新老客户开放试用了,Mixdesk AI Agent 能力已经在部分客户一线业务场景中发挥作用,老用户可以原地升级到最新 AI 版本,新用户可以免费体验我们新版本 AI 客服功能,感受技术革新带来的便捷与效率。
AI Agent 的未来
在 Open AI 的构画中,Agent 是AI系统发展的一个阶段:

它随着AI技术的发展而进化,未来可见的是 AI Agent 将通过融合自然语言处理、计算机视觉和语音识别等技术,在多模态交互上实现突破,提供更自然高效的互动,关于 AI Agent 的演化路线,我们引用一副图表来展示:
暂时无法在Lark文档外展示此内容
在 Agent 未来更高的发展阶段中,它是能够自我组织,自我决策、自我调度来完成复杂的任务,这一层级能力将最直接地反映在客户服务场景中。
总结
传统人工客服中的技能组:售前咨询、产品推荐、成交促进、订单处理、售后服务、投诉管理、技术支持、反馈收集等等对应着不同的 Agent 能力,所有这一切环节,AI能够7*24小时自我组织不同技能的 Agent 来完成接待工作,这应该是所有客户理想中的智能客服的状态,这也是Mixdesk前进的方向,“我们不确定这样的未来还有多远,我们只知道每往前一步,就离这个未来更近。”
或许你想看
-
盘点2024最受欢迎的8款AI Agent智能客服系统推荐
为帮助企业迅速找到适合自己的AI Agent智能客服解决方案,本文参考了Gartne、G2、Capterra、…