前言:
最近和很多群里大佬一块挖edu,企业,学到了很多东西,,单刷信息泄露刷到了月榜前10,,说下edu信息泄露挖掘。。
上图,
0x00.思路:
信息泄露主要是挖个人敏感信息泄露,,比如,,age,sfz,,name,phone这些东西,,edu-src会收录这些漏洞。
0x01.格局打开
在我看来,最有效的方式就是刷SFZ,,好了不说那些废话,,反正现在edu挖SFZ信息泄露大概率都重复,,在这个这么卷的时间,,应该怎么去避免重复?
正常思路会怎么挖:?
以下内容,SRC均已修复 以下内容,SRC均已修复 以下内容,SRC均已修复
报告类的
site:edu.cn "审计报告" "SFZH(简写)" filetype:pdf
site:edu.cn"财务报告" "SFZH(简写)" filetype:pdf
奖金类的:
site:edu.cn "科技奖" "SFZH(简写)" filetype:pdf
site:edu.cn "专利发明" "SFZH(简写)" filetype:pdf
证书类的:
site:edu.cn "营业执照" "SFZH(简写)" filetype:pdf
site:edu.cn "职称证" "SFZH(简写)" filetype:pdf
出来的大多数都是重复,,不通过,
然后我发现换种语法能更好的收集到别人没收集到的资产,,只要别人没挖过,,挖一个就有一个。。
以下内容,如有敏感内容,联系作者,第一时间删除。以上内容,SRC均已修复!以上内容,SRC均已修复!
先看这张图,,
这里有个很明显的"特此证明",然后我在想,通过"特此证明"这个指纹批量挖掘含有这个字段的文档。。然后就这可以这样构造
业务词 ,
site:edu.cn "无犯罪记录证明" "SFZH" filetype:pdf
site:edu.cn "情况属实,特此证明" "身份证号" filetype:pdf
site:edu.cn "特发此证" "身份证号" filetype:pdf
site:edu.cn "法定代表人" filetype:pdf
足足可以刷上3-4页,,但是这些远远不够,,,只是说明我们的资产匹配做的比较全面,但不够深入。。
然后,,我花了一两天研究了下谷歌语法,,发现通配符"*"和 "+" "-" 加上 in指令 "intitle" 可以匹配到模糊匹配到更多的资产。。
比如说 site:xhu.edu.cn "SFZ" filetype:pdf 和 site:xhu.edu.cn "SF*" filetype:pdf返回的结果是有很大差别的,在个人信息表里面会存在的字段"汉" "男" "女" "年月" ,所以我想到一个很骚的思路来FUZZ
site:edu.cn "年月.5*" "SFZH" filetype:pdf -学号 -准考证 (-过滤掉无关的内容)于是乎
又刷了好几页,,这个时候,,思路和眼界都扩展开了,比如说
个人类
site:edu.cn "年月.*" "聘任时间" "SFZH" filetype:pdf -学号 -准考证
site:edu.cn "破格*" "SFZH" filetype:pdf -学号 -准考证
site:edu.cn "汉*" "SFZH" filetype:pdf -学号 -准考证
合同类:
site:edu.cn "同意推荐其参评*" filetype:pdf +SFZH -学号 -准考证
site:edu.cn "*出版合同" filetype:pdf +SFZH -学号 -准考证
site:edu.cn "甲方代表*" filetype:pdf +SFZH -学号 -准考证
site:edu.cn "甲方代表人" filetype:pdf +SFZH -学号 -准考证
site:edu.cn "甲方聘请乙方" filetype:pdf +SFZH -学号 -准考证
site:edu.cn "甲方的权利和义务" filetype:pdf +SFZH -学号 -准考证
然后,已经很强了,还发现可以通过inurl匹配一些通用的文档,,爬取类似的xxxx书,
site:edu.cn inurl:"xxx/xxxx" filetype:pdf +SFZH -学号 -准考证
在短短时间内刷了差不多70rank,,以上内容,SRC均已修复,,纯属学习,,,如有敏感内容,联系作者,第一时间删除。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...