当前位置:首页>资讯>为什么公司内部聊天机器人会失败以及如何在企业中使用生成式人工智能产生影响

为什么公司内部聊天机器人会失败以及如何在企业中使用生成式人工智能产生影响

2024-12-02

从问题开始,而不是从解决方案开始

背景由 elements.envato.com 授权,由 Marcel Müller 编辑 2024

许多组织最常见的幻灭如下:他们对 ChatGPT 或 Microsoft Co-Pilot 的生成式 AI 感到兴奋,阅读一些有关 AI 如何“以某种方式让您的业务变得更好”的文章,然后尝试寻找其他用例他们可以使用聊天机器人,但最终当结果不太令人满意时会感到失望。然后,论证阶段就到来了。我经常听到诸如“模型不够好”或“我们需要提高人们的技能以编写更好的提示”之类的话。

在 90% 的情况下,这些都不是正确的结论,而是来自我们在聊天机器人中思考的问题。我已经为三人组织到拥有超过三十万名员工的跨国企业开发了三打生成式人工智能应用程序,而且这种模式随处可见。

有成千上万的公司告诉您,您需要“某种聊天机器人解决方案”,因为每个人都这样做。 OpenAI 与 ChatGPT、Microsoft Copilot、Google 与 Gemini 以及所有其他向您销售聊天机器人的公司都在打破创建聊天机器人的初始障碍方面做得很好。但让我告诉你:你可以用生成式人工智能解决的真正痛苦的问题中,75% 并不能从成为聊天机器人中受益。

我经常看到经理、项目主管或其他决策者从这样的想法开始: “我们这里有一些人工智能产品,可以让我们构建聊天机器人——让我们找到尽可能多的地方来实现它。 “根据我的经验,这是错误的方法,因为你是从解决方案开始,并试图将现有的问题融入其中。正确的方法是研究问题、分析问题并找到合适的人工智能解决方案。对于某些用例来说,聊天机器人可能是一个很好的界面,但将每个问题都强行交给聊天机器人是有问题的。

强行解决问题与从问题开始并寻找解决方案。 © 马塞尔·穆勒 2024

在本文中,我将分享我通过构建无数应用程序的实践经验开发的见解和方法。这些应用程序现已投入生产并为成千上万的用户提供服务,它们塑造了我关于构建有影响力的生成式人工智能解决方案的想法——而不是盲目追随趋势,如果不起作用就感到失望。

我告诉你不要从聊天机器人开始思考,那么你应该从哪里开始呢?答案很简单:业务流程。

公司内部发生的一切都是一个业务流程。业务流程是连接到工作流中的不同活动(“工作单元”)、事件(例如错误)和网关(例如决策)的组合[1]。有一些以众所周知的图表形式对业务流程进行建模的工具 [2],以及以分析和改进业务流程为中心的整个研究学科 [3][4][5]。业务流程管理是一个很好的工具,因为它不是理论性的,而是在公司中随处使用——尽管他们不知道该怎么称呼它。

让我举个例子。想象一下,您是一家为银行进行房地产估值的公司。在银行发放抵押贷款之前,他们会要求房地产估价师估算该物品的价值,以便他们知道,如果无法偿还抵押贷款,他们可以掌握实际价格。

创建房地产评估报告是一个大型业务流程,我们可以将其分解为多个子流程。通常,估价师会开车前往房子,拍照,然后坐在那里写一份 20-30 页的报告来描述他们的估价。让我们暂时不要陷入“呃,一份 20-30 页的报告,让我坐在 ChatGPT 前面,我可能会更快”的习惯。请记住:首先是流程,然后是解决方案。

我们可以将这个过程分解为更小的子过程,例如开车到房子,拍照,然后编写报告的不同部分:房子的位置描述,描述不同房间的条件和大小。当我们深入研究单个流程时,我们将看到所涉及的任务、网关和事件。例如,为了编写位置描述,房地产估价师坐在办公桌前,进行一些研究,在 Google 地图上查看周围有哪些商店,并查看城市的交通地图,以确定房屋的连接程度以及街道的样子。这些都是个案工作者必须做的活动(或任务)。如果房屋是一个偏僻的农场,那么公共交通选择可能无关紧要,因为此类房屋的买家通常都依赖汽车。关于流程中走哪条路径的决定称为网关。

BPMN 2.0 中建模的示例的流程也是如此。 © 马塞尔·穆勒 2024

我们在这里应用的这种流程驱动的思维方式首先是在引入任何人工智能之前评估当前流程。

通过对我们的流程和目标的分析,我们现在可以开始研究人工智能流程应该是什么样子。考虑我们需要采取的各个步骤很重要。如果我们只关注创建描述的子流程,可能如下所示:

分析房子周围的位置和商店 描述内部状况 除非位置非常偏远:查找最近的公共交通站点 为报告写一页文字

是的,您可以通过与聊天机器人交互的方式来做到这一点,您可以与“人工智能陪练伙伴”一起工作,直到获得输出。但这给公司带来了三个主要问题:

可重复性:每个人的提示都不同。这会导致不同的输出,具体取决于提示用户的技能和经验水平。作为一家公司,我们希望我们的产出尽可能可重复。 质量参差不齐:您可能与 ChatGPT 进行过交互,您需要多次改写提示,直到达到您想要的质量。有时你会得到完全错误的答案。在这个例子中,我们还没有找到一个法学硕士能够在不产生幻觉的情况下高质量地描述周围的商店。 数据和现有系统集成:每个公司都有可能希望在这些交互中使用的内部知识。是的,您可以使用聊天机器人进行一些检索增强生成(RAG),但这并不是在每种情况下都能产生良好结果的最简单和最通用的方法。

这些问题来自于聊天机器人背后的法学硕士所拥有的核心基础。

聊天机器人交互(左)与预定义可重现流程的编排(右)。 © 马塞尔·穆勒 2024

企业应用程序不应依赖于“即时响应”交互周期,而应设计为一系列精心策划的、(部分)人工智能驱动的流程步骤,每个步骤都针对一个特定目标。例如,用户可以触发一个多步骤流程,集成各种模型和潜在的多模式输入,以提供更有效的结果,并将这些步骤与不使用人工智能检索数据的小脚本结合起来。通过合并检索增强生成 (RAG) 并最大限度地减少人为干预,可以创建更强大的自动化工作流程。

与通过交互式界面进行手动编排相比,这种编排方法可显着提高效率。此外,并非该过程中的每一步都应该完全依赖人工智能模型来完成。在上面的例子中,我们实际上发现使用 Google Maps API 获取附近的车站和公交站在质量方面远远优于询问像 GPT-4o 这样的优秀法学硕士,甚至像 Perplexity 这样的网络搜索 RAG 引擎。

让我们想一下没有人工智能的时代。手动流程可能会花费大量时间。假设一项任务需要手动完成一小时,并且该过程重复四次,总共需要四个小时。使用由生成式 AI 提供支持的聊天机器人解决方案可以节省 50%(或任何百分比)的时间。然而,剩下的时间都花在制定提示、等待响应以及通过修正和调整来确保输出质量上。就这么好了吗?

比较手动和基于聊天机器人的自动化可节省时间。 © 马塞尔·穆勒 2024

对于重复性任务,尽管节省了时间,但在多个员工执行相同流程的组织中,需要制定提示、等待和调整输出以实现一致性,这可能会出现问题。为了解决这个问题,利用流程模板变得至关重要。

通过模板,流程被通用化和参数化以可重用。创建高质量流程模板的工作只需进行一次,而个别案例的执行效率则显着提高。用于快速创建、质量保证和输出调整的时间大大减少。将基于聊天机器人的解决方案与使用模板的人工智能支持的流程编排进行比较时,这是核心区别。而这种核心差异对质量和再现性有着巨大的影响。

真正节省流程模板。 © 马塞尔·穆勒 2024

此外,我们现在有一个狭窄的领域可以测试和验证我们的解决方案。在用户可以插入任何内容的聊天机器人中,以可量化的方式测试和寻找信心是很困难的。我们定义和限制用户可以插入的可能参数和文件越多,我们就越能定量地验证解决方案。

人工智能支持的流程中使用模板反映了传统流程管理中业务流程引擎的原则。当出现新案例时,这些引擎利用模板存储库并选择相应的模板进行编排。对于编排,然后填充输入参数。

在我们的房地产评估过程示例中,我们的模板具有三个输入:对象类型(单户住宅)、内部图片集合和地址。

流程模板如下所示:

使用 Google Places API 和给定地址查找周围的商店。 使用OpenAI视觉API来描述内部条件。 使用 Google Places API 查找最近的交通选项。 获取 1. 和 3. 中的输出 JSON 对象以及交通选项的描述,并使用 GPT-4o 创建一个具有以下结构的文本页面:对象、商店和交通的描述,然后是内部描述和结论给每个人打分。

在我们的示例用例中,我们使用带有内置无代码构建器的 entAIngine 平台实现了应用程序。

请注意,在此过程中,4 个步骤中只有 1 个使用大型语言模型。那是件好事!因为 Google 地图 API 永远不会产生幻觉。是的,它可能有过时的数据,但它永远不会“只是编造一些听起来可能是现实的东西”。其次,我们对循环中的人员具有可验证性,因为现在我们拥有可以分析和签署的真实信息源。

在传统的流程​​管理中,模板减少了流程的可变性,确保了可重复性,并提高了效率和质量(如六西格码等方法论中所示)。这也是我们在这里必须采用的心态。

现在,我们已经开始使用法学硕士的流程,但也解决了很多令人头痛的问题。但用户如何与其交互呢?

这种流程的实现可以通过手动编码所有内容或使用无代码 AI 流程引擎(如 entAIngine [6])来实现。

当使用模板对业务流程进行建模时,可以通过多种方式进行交互。根据我过去 2 年的经验,对于 90% 的生成式 AI 用例,以下接口是相关的:

• 知识检索界面:功能类似于搜索引擎,可以引用和引用资源。

• 文档编辑器界面:将文本处理与对模板、模型和编排的访问相结合。

• 聊天界面:用于迭代、交互式参与。

• 无需专用接口(RPA) 的嵌入式编排:通过API 集成到现有接口中。

最终的问题是,最有效的交互方式是什么?是的,对于一些创造性的用例或非重复性任务,聊天界面可以成为首选工具。但通常情况并非如此。通常,用户的核心目标是创建某种文档。然后,在编辑器界面中提供这些模板是一种非常有效的交互方式。但有时,如果您想通过 AI 增强现有应用程序,则无需创建另一个独立的界面。这里的挑战仅仅是执行正确的流程,在现有应用程序中获取输入数据,并在应用程序界面中的某处显示输出。

这里提到的这些接口构成了我迄今为止遇到的大多数生成式人工智能用例的基础,同时支持可扩展地集成到企业环境中。

让他们的注意力远离“我如何才能在任何地方使用人工智能聊天机器人?”到“哪些流程执行哪些步骤以及如何在这些步骤中利用生成式人工智能?”企业为真正的人工智能影响奠定了基础。将人工智能与现有系统相结合,然后只研究您需要的用户界面类型。通过这种方式,您可以释放那些无法超越聊天机器人思考的企业做梦也想不到的效率。

 

2024-12-23

淘金手册 | 潜在稳定币存款空投哪家强? 淘金手册 | 潜在稳定币存款空投哪家强?

而存款类项目 TGE 后的财富效应也较为显著,例如近期火热的 Usual 存款为用户带来了约 50% 存款量的收益,此前 Ethena 也为首期用户带来了 70% 的收益率,且几个项目均是在短短几个月的存款周期内便为用户带来了可观的回报,由此,很多存款项目正在吸引越来越多的链上流动性入局押注。

2025-01-24

BNB Chain举办新年红包嘉年华,分发价值逾30万美元的代币奖励迎接新年 BNB Chain举办新年红包嘉年华,分发价值逾30万美元的代币奖励迎接新年

PANews1月23日消息,BNBChain宣布将开展红包嘉年华活动,派发超30万美元的奖励红包,希望这些象征着好运与繁荣的红包可以为社区用户带去美好的祝福,享受节日的狂欢。此次红包嘉年华为期三周,从...

2025-01-22

PumpFun向Kraken转移约2800万美元的SOL PumpFun向Kraken转移约2800万美元的SOL

PANews1月21日消息,据OnchainLens监测,PumpFun刚向Kraken转移116,054.56枚SOL,价值约2800万美元。2025年以来,其累计已向Kraken转移692,877...

2025-01-22

Crypto.com在美国推出机构级交易服务 Crypto.com在美国推出机构级交易服务

PANews1月22日消息,据TheBlock报道,总部位于新加坡的数字资产交易所Crypto.com已在美国新平台Crypto.comExchange下推出机构级交易服务。根据该公司发布的消息,Cr...

2024-11-24

Gate.io推出SOL生态交易活动,奖池高达10,000美元 Gate.io推出SOL生态交易活动,奖池高达10,000美元

PANews11月23日消息,据官方公告,Gate.io将于2024年11月23日00:00至12月3日23:59(UTC)启动SOL生态合约交易活动,参与热门币种交易即可分享$10,000奖池,活动...

2024-11-24

某个与RookieXBT关联的地址过去48小时内买入273万枚FARTCOIN 某个与RookieXBT关联的地址过去48小时内买入273万枚FARTCOIN

PANews11月23日消息,据OnchainLens监测,在过去的48小时内,一个与RookieXBT关联的地址用3900枚SOL(100万美元)买入273万枚FARTCOIN,之后将其转移到主钱包...