数据何规AI助手上线！

受启发，我一口气捏了仨智能体，记录一下手搓的过程并展示成果。

欢迎体验！

一、需求场景

每周末我都会发一期数据合规的实务Q&A，大家的困惑其实都比较类似。

比如以下问题，最近都被重复问及：

如何认定具备社会舆论属性？

委托处理需要告知吗？

哈希处理过的个人信息匿名化了吗？

尽管我有一个梳理的比较好且可以关键词检索的知识库，详见：。

但提问前，进入飞书知识库页面，登录再检索还是比较繁琐。

只有我（整理过每一个问题的人）可以清晰地记得，哪些问题讨论过，然后直接把链接丢出来。

我很早就想过，如果能有一个“数据何规”公众号的AI客服，仔细读过每一篇我的原创文章，然后替我回答读者的问题就好了。

二、制作过程

（一）工具选择

制作智能体的AI工具市面上已经有一些了，文心千帆操作感觉有点麻烦，通义千问需要上传的语料都是PDF且没有微信小程序，豆包似乎不能上传语料。

最后我使用了智谱清言，支持上传多种格式，而且操作也非常友好，把语料传进去就行。

（二）语料准备

因为上传文件有100个的限制，遂决定仅摘录我公众号中的原创作品（不含翻译作品）。

整个过程非常枯燥，就是机械地复制粘贴，期待某一天腾讯可以为公众号运营者提供官方的AI问答机器人，自动遍历所有发布过的文章并学习。

唯一的收获是，我统计出来了115期煮酒言规已经有36.55万字了。

（三）些许遗憾

1、无法识别图片。导致很多推送中的截图都用不上，感觉OCR技术这么成熟了，后期应该可以有突破，现在可能是算力和服务器有压力？

2、无法给语料赋予权重。比如同一个观点，我两年前的文章和现在的文章，观点肯定不同，相关法律法规也有进展，但我无法告诉客服，这两篇语料应该更倾斜于哪一个语料。在输入法规库后，很多原本准确的回答，反而不准了。

3、无法通过管理员账户纠正回答。有些问题可能AI理解语料不对，或者没找到正确的观点。我无法通过创建智能体的账户不断的纠正，进而影响后续的答案。有时候无奈之下，我只能把有错误观点的语料给删了。

三、首次尝试

输入本公众号所有原创文章以及数百万字数据合规法规，并打开联网功能后，有些问题智能体已经答得不错了，展示如下：

一、如何认定具备社会舆论属性？

二、委托处理需要告知吗？

三、哈希处理过的个人信息匿名化了吗？

四、API和SDK的区别是什么？

五、单独同意可以被豁免吗？

当然，也有很多问题，他回答的不是特别正确，比如单独同意是否可以豁免这一问题，在输入法规汇编前，他答题还是很聪明的，但法规库输入后，反而答不出下面的答案了。

欢迎体验这个版本（点击下方链接可跳转）：

四、再次尝试

大功告成的喜悦并没有持续多久，很快我就陷入沉思，前面这些问题，通用大模型似乎也能答，堆砌数百万字数据合规法规后，我自己的原创内容也就被湮没了。

制作这个智能体的目的，并非回答一切读者的数据合规问题，而是能够帮助读者快速检索本公众号的相关观点。

于是，我制作了第二个智能体，关闭了联网功能，也只上传了我自己的原创内容作为知识库，没有上传任何法规，修改了需求。

又重复问了前述问题。

一、如何认定具备社会舆论属性？

二、委托处理需要告知吗？

三、哈希处理过的个人信息匿名化了吗？

四、API和SDK的区别是什么？

五、单独同意可以被豁免吗？

这个版本，似乎会答得更像我公众号的内容一些。

欢迎体验这个版本（点击下方链接可跳转）：

五、APP合规大师

想起史博士建议，最好找一个小的切口，不要追求大而全。

于是我想到，煮酒言规知识库里，提问最多的就是APP合规相关的内容，而且我对APP合规的法规梳理也比较完全。

遂决定再捏一个APP合规大师，没有联网，提供了足够的问答和规则。

有些问题的表现感觉还可以，很多公开渠道找不到答案的问题，都能根据知识库内容来总结输出。

一、如何确保未成年人使用青少年模式

二、官网分发自家APP会被认定为分发平台吗

四、手电筒为什么需要相机权限

五、APP游客模式是必需的吗

欢迎体验（点击下方链接可跳转）：

六、总结

确实还没有达到预期中智能，但感觉表现也还算不错。

相信很快可以代替甚至超越我的数据何规AI客服就会出现了。

也欢迎你在评论区分享更好的工具。

推荐站内搜索：最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……

宙飒天下网-ZhouSa.com

正文

数据何规AI助手上线！

相关阅读

微语 1.0.2 发布，开源智能工单

深度复盘：我如何用 YouMind 搭建了一套自动生长的个人知识库

AI 越智能，数据越危险？

本地实现RAG知识库其实很简单（实践）

发表评论取消回复

还没有评论，来说两句吧...

目录[+]