受启发,我一口气捏了仨智能体,记录一下手搓的过程并展示成果。
欢迎体验!
一、需求场景
每周末我都会发一期数据合规的实务Q&A,大家的困惑其实都比较类似。
比如以下问题,最近都被重复问及:
如何认定具备社会舆论属性?
委托处理需要告知吗?
哈希处理过的个人信息匿名化了吗?
尽管我有一个梳理的比较好且可以关键词检索的知识库,详见:。
但提问前,进入飞书知识库页面,登录再检索还是比较繁琐。
只有我(整理过每一个问题的人)可以清晰地记得,哪些问题讨论过,然后直接把链接丢出来。
我很早就想过,如果能有一个“数据何规”公众号的AI客服,仔细读过每一篇我的原创文章,然后替我回答读者的问题就好了。
二、制作过程
(一)工具选择
制作智能体的AI工具市面上已经有一些了,文心千帆操作感觉有点麻烦,通义千问需要上传的语料都是PDF且没有微信小程序,豆包似乎不能上传语料。
最后我使用了智谱清言,支持上传多种格式,而且操作也非常友好,把语料传进去就行。
(二)语料准备
因为上传文件有100个的限制,遂决定仅摘录我公众号中的原创作品(不含翻译作品)。
整个过程非常枯燥,就是机械地复制粘贴,期待某一天腾讯可以为公众号运营者提供官方的AI问答机器人,自动遍历所有发布过的文章并学习。
唯一的收获是,我统计出来了115期煮酒言规已经有36.55万字了。
(三)些许遗憾
1、无法识别图片。导致很多推送中的截图都用不上,感觉OCR技术这么成熟了,后期应该可以有突破,现在可能是算力和服务器有压力?
2、无法给语料赋予权重。比如同一个观点,我两年前的文章和现在的文章,观点肯定不同,相关法律法规也有进展,但我无法告诉客服,这两篇语料应该更倾斜于哪一个语料。在输入法规库后,很多原本准确的回答,反而不准了。
3、无法通过管理员账户纠正回答。有些问题可能AI理解语料不对,或者没找到正确的观点。我无法通过创建智能体的账户不断的纠正,进而影响后续的答案。有时候无奈之下,我只能把有错误观点的语料给删了。
三、首次尝试
输入本公众号所有原创文章以及数百万字数据合规法规,并打开联网功能后,有些问题智能体已经答得不错了,展示如下:
一、如何认定具备社会舆论属性?
二、委托处理需要告知吗?
三、哈希处理过的个人信息匿名化了吗?
四、API和SDK的区别是什么?
五、单独同意可以被豁免吗?
当然,也有很多问题,他回答的不是特别正确,比如单独同意是否可以豁免这一问题,在输入法规汇编前,他答题还是很聪明的,但法规库输入后,反而答不出下面的答案了。
欢迎体验这个版本(点击下方链接可跳转):
四、再次尝试
大功告成的喜悦并没有持续多久,很快我就陷入沉思,前面这些问题,通用大模型似乎也能答,堆砌数百万字数据合规法规后,我自己的原创内容也就被湮没了。
制作这个智能体的目的,并非回答一切读者的数据合规问题,而是能够帮助读者快速检索本公众号的相关观点。
于是,我制作了第二个智能体,关闭了联网功能,也只上传了我自己的原创内容作为知识库,没有上传任何法规,修改了需求。
又重复问了前述问题。
一、如何认定具备社会舆论属性?
二、委托处理需要告知吗?
三、哈希处理过的个人信息匿名化了吗?
四、API和SDK的区别是什么?
五、单独同意可以被豁免吗?
这个版本,似乎会答得更像我公众号的内容一些。
欢迎体验这个版本(点击下方链接可跳转):
五、APP合规大师
想起史博士建议,最好找一个小的切口,不要追求大而全。
于是我想到,煮酒言规知识库里,提问最多的就是APP合规相关的内容,而且我对APP合规的法规梳理也比较完全。
遂决定再捏一个APP合规大师,没有联网,提供了足够的问答和规则。
有些问题的表现感觉还可以,很多公开渠道找不到答案的问题,都能根据知识库内容来总结输出。
一、如何确保未成年人使用青少年模式
二、官网分发自家APP会被认定为分发平台吗
四、手电筒为什么需要相机权限
五、APP游客模式是必需的吗
欢迎体验(点击下方链接可跳转):
六、总结
确实还没有达到预期中智能,但感觉表现也还算不错。
相信很快可以代替甚至超越我的数据何规AI客服就会出现了。
也欢迎你在评论区分享更好的工具。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...