【聊天机器人】为什么你不能信任聊天机器人——现在比以往任何时候都更重要即使在语言模型扩大之后,它们在简单的任务上也被证明是不可靠的
ChatGPT等人工智能聊天机器人和其他由大型语言模型驱动的应用程序已经得到了广泛的应用,但它们的可靠性却臭名昭著。一个常见的假设是,扩大驱动这些应用程序的模型将提高其可靠性,例如,通过增加它们训练的数据量或用于处理信息的参数数量。然而,根据一项新的研究,这些语言模型的更新和更大版本实际上变得更加不可靠,而不是更少。
大型语言模型(LLM)本质上是智能手机用来预测一个人正在键入的单词其余部分的自动补全功能的超级版本。ChatGPT,也许是最著名的LLM驱动的聊天机器人,已经通过了法学院和商学院的考试,成功回答了软件编码工作的面试问题,撰写了房地产清单,并开发了广告内容。
但法学硕士经常犯错误。例如,6月份的一项研究发现,ChatGPT在生成函数式代码方面取得了极其广泛的成功,成功率从微不足道的0.66%到89%不等,具体取决于任务的难度、编程语言和其他因素。
研究团队已经探索了一系列策略,使LLM更可靠。这些包括增加模型的训练数据量或计算能力,以及使用人类反馈来微调模型并提高其输出。随着时间的推移,LLM的性能总体上有所提高。例如,早期的LLM在简单的加法(如“20+183”)上失败了。现在LLM成功地执行了涉及50位以上数字的加法。
【 AI Bot Service 】设计用户体验
您可以创建具有各种功能的机器人,如文本、按钮、图像、以旋转木马或列表格式显示的富卡等。然而,每个渠道,如脸书、Slack等,最终都控制着其消息客户端呈现功能的方式。即使多个通道支持一个功能,每个通道也可能以略微不同的方式渲染该功能。如果消息包含通道本机不支持的功能,通道可能会尝试将消息内容向下呈现为文本或静态图像,这可能会显著影响消息在客户端上的外观。在某些情况下,频道可能根本不支持特定功能。例如,GroupMe客户端无法显示键入指示符。
丰富的用户控制
富用户控件是常见的UI控件,如按钮、图像、旋转木马和菜单,机器人向用户展示这些控件,用户通过这些控件来传达选择和意图。机器人可以使用一组UI控件来模仿应用程序,甚至可以在应用程序中嵌入运行。当机器人嵌入到应用程序或网站中时,它可以使用托管它的应用程序的功能来表示几乎任何UI控件。
应用程序和网站开发人员依靠UI控件使用户能够与他们的应用程序进行交互。这些相同的UI控件在机器人中也很有效。例如,按钮是向用户呈现简单选择的好方法。允许用户通过选择标记为“酒店”的按钮来传达“酒店”比强迫用户键入“酒店”更容易、更快。例如,在移动设备上,选择通常比键入更可取。
【Azure Bot Framework 】SimpleBotToBot Echo 技能
此机器人是使用bot Framework创建的,它展示了如何创建一个简单的技能消费者(SimpleRootBot),该技能消费者将消息活动发送给技能(EchoSkillBot),技能会将其回复。
此示例是一个Spring Boot应用程序,使用Azure CLI和Azure webapp Maven插件部署到Azure。