上一篇文章《利用AI阅读和分析文本:使用COZE建设游记文本知识库》,我们使用马蜂窝游记文本数据,在coze扣子平台上创建一个bot和本地知识库。 本地知识库创建后,在向bot提问时,bot会优先从本地知识库寻找答案。通过上一篇的实验,我们验证了本地知识库是有效的。Bot后面的大模型能帮我们理解文本的语义,减轻我们逐字逐句阅读文本的负担,那么对我们使用者的要求就是:怎样更有效地提问题,让问题深钻下去,充分发掘bot的“智力“。 通过这一实验,我们进一步体验了AI工具的强大及怎样使用各种途径(包括本地word和excel文档,网址等,以及利用GooSeeker网络爬虫软件收集网络上的文字)来丰富和扩充本地知识库。 今天我们继续AI阅读和分析文本方面的尝试。我们原先打算:是否能发现一个功能,把探索bot的过程记录下来,一遍后期进行总结和进一步分析处理。 但是原先的目标还没有实现,只发现一个手段可以记录知识库目前欠缺的知识。我们总结成今天这篇文章。 1. 概要 上一篇介绍基于AI平台COZE,使用我们的游记文本创建个人知识库,在此基础上,我们在COZE扣子上启用数据库来记录在交互过程中用户的反馈,也就是如果某个问题在知识库里找不到答案,那么就告诉用户“无法回答这个问题”,同时告诉用户可以输入“反馈”,bot会把这个问题记录到数据库中,以供后续优化。 2. 实验步骤 2.1 创建bot 并通过读取本地游记文本excel添加本地知识库。采用的原始数据跟上一篇文章相同:《利用AI阅读和分析文本:使用COZE建设游记文本知识库》。创建bot的过程也一样,在这里在列一遍。 2.1.1 登录coze 2.1.2 创建Bot 点击“知识”下的“文本”右侧的“+”号,添加一个知识库 选择本地文件上传后,表格的结构和字段会显示出来。选择包含游记文本的“正文”字段,这个字段会被分析作为后续用户提问回答的内容来源: 点击“下一步”,会看到预览数据: 数据处理完成后,点击右上角的“添加到bot”: 返回到bot编排,看到知识库下面已经有了我们添加的本地表格: 2.2 创建“数据库” 点击“编排”下的“数据库”右边的“+”号,创建一个新的数据库: 填写数据库名字,字段和类型,然后点击“保存”: 这时我们在“编排”下的数据库部分可以看到刚刚添加的数据库: 2.3 编排bot的“人设与回复逻辑” 通过这种方式告诉bot扮演什么角色,具有什么技能。 下面的这段文字是我们人工准备输入的“人设与回复逻辑”: 你是游记文本分析的客服bot,你的任务是基于我所提供的信息、知识和要求,完成客服的工作:帮用户寻找资料、回答用户的问题,为用户带来友好、有帮助的服务体验。
我们把上面这段文字输入“人设和回复逻辑”输入框内,然后点击“优化”,平台会自动优化成下面这段文字,我们直接点击“使用”:
到这一步,我们这个实验用的bot就创建好了,下面我们启动调试,看看运行效果 2.4 启动“调试”和发布 点击右边的“调试”按钮,下面我们就可以开始提问,看看本地知识库和本地数据库是否起作用 3. 提问和回答 问题一:武汉有哪些小吃? 回答:武汉的小吃有热干面、三鲜豆皮、辣鸭脖、鲜鱼糊汤粉。 注:上面这个问题,bot可以基于本地知识库回答,所有没有“反馈”的提示信息 问题二:黄鹤楼的门票价格是多少 回答:很抱歉,目前知识库中没有您问题的答案。您可以说 “反馈”,我会将您的问题和当前时间写入到 feedback1 数据库中,以便未来优化。 问题三:武大是免费参观吗 回答:武大赏樱无需门票,但需提前两天在武大官网实名预约,在预约观赏时段凭身份证刷证进入(每日分上午场和下午场,限人数)。仅根据现有内容不能确定武汉大学整体是否免费参观。 问题四:武汉大学校园内有肯德基麦当劳吗 回答:很抱歉,目前知识库中没有您问题的答案。您可以说 “反馈”,我会将您的问题和当前时间写入到 feedback1 数据库中,以便未来优化。 4. 数据库内容 上面的问题二和问题四,bot无法基于本地知识库回答,所以提示用户可以输入“反馈”,bot会将您的问题和当前时间写入到 feedback1 数据库中,以便未来优化。 我们看看输入了反馈的情况下,数据库里的记录情况: 如上图所示,我们看到问题二和问题四的内容和提问时间已经被记录到了数据库。 这个信息可以做为后期优化的一个依据。 5. 发布 调试觉得达到了效果,要发布出去和人分享,或者自己调用,可以点击页面右上角的”发布”按钮 6. 总结 今天我们使用马蜂窝游记文本数据,在coze扣子平台上创建bot和本地知识库,继续创建数据库用于记录用户的问题,输入“人设和回复逻辑”,用于bot的角色和行为定义。 实验结果,本地知识库创建后,在向bot提问时,bot会优先从本地知识库寻找答案。对于本地知识库没有答案的问题,会提示用户输入“反馈”后记录到数据库。 通过上面的实验,我们验证了本地知识库和数据库是有效的。 使用工作流可以更灵活的定义bot的逻辑,后面我们会做相关实验。 我们会继续探索在进行阅读、数据采集、数据挖掘、数据分析时怎样使用AI来提升我们的效率。 |