点击蓝字 关注我们
免责声明
本文发布的工具和脚本,仅用作测试和学习研究,禁止用于商业用途,不能保证其合法性,准确性,完整性和有效性,请根据情况自行判断。
如果任何单位或个人认为该项目的脚本可能涉嫌侵犯其权利,则应及时通知并提供身份证明,所有权证明,我们将在收到认证文件后删除相关内容。
文中所涉及的技术、思路及工具等相关知识仅供安全为目的的学习使用,任何人不得将其应用于非法用途及盈利等目的,间接使用文章中的任何工具、思路及技术,我方对于由此引起的法律后果概不负责。
🌟简介
基于微信的群二维码分享功能,微信用户在网络上分享微信群聊二维码,他人即可在有效期内通过此二维码扫码加群。火浣可通过爬取特定网页页面,解析图片内容进行判断,识别、筛选、获取到尚在有效期内的微信群聊二维码并集中展示。
火浣通过加载插件的方式,将添加到其中的各个爬取源统一管理调度。插件相对独立,又可以很方便快速的加入新的插件。如用户发现比较好的数据来源,可在HuoHuan.Plugins工程中分别继承IPlugin、ISpider(BaseSpider)两个接口,仅需要实现获取图片链接的相关的方法后,即可在编译后直接使用。
示例
获取群聊步骤
根据插件设置爬取源获取图片链接
识别图片是否为二维码
判断图片是否为微信群二维码
OCR识别文字内容,判断群二维码是否尚在有效期内
现有功能
识别、获取有效微信群聊
通过添加插件的方式快捷增加爬取源
已识别Url过滤
保存信息到本地数据库
下载相关群二维码图片至本地
浏览查看爬取结果
插件增删、重新排序
根据特有配置执行插件(尚不能软件内自定义)
检测最新版本,下载安装包并自动启动安装
爬取完成音效提醒
浏览过程中删除已失效内容
TODO
尝试其他方案,提升OCR识别准确率
支持Arm(当前PaddleOcr仅支持Amd64下使用)
增加像素灰度均值判断护眼模式,取反解析内容,增加识别范围
增加配置代理、支持多线程爬取
支持爬取结果一键导出文件压缩包
支持插件卡片空间内修改插件配置
扩充插件库数量
使用注意
二维码图片来自网络,所以并不能保证准确率达到100%。爬取结果中可能会存在以下几种失效情况:
群二维码来源网站对二维码做了二次转换,不包含失效信息(此时以上传时间为开始时间,计算出失效时间),转换时间不准确,群二维码已失效。
群二维码分享后,被分享群已解散、分享人退群、入群规则修改、被投诉异常等原因,导致无法加群。
分享群时间不在当年,但日期恰好重合(2022年10月1日爬取到2019年10月3日失效群)。
OCR识别解析时间错误。
对于已经失效的群聊,可以鼠标悬停至浏览区顶部点击删除按钮进行剔除。后续会增加按日期筛选机制,筛选失效时间距离当前更久的群(失效概率相对较小)。
免责声明
本项目开发初衷仅为学习及技术交流,切勿将本其用于任何非法用途,否则一切后果自负,与本项目及作者无关。
项目地址
https://github.com/laosanyuan/HuoHuan
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...