职位描述
岗位职责:
1、负责爬取外网图文、视听等资源的持续爬取工作;
2、负责反爬虫策略研究,代理IP、验证码识别等采集支撑服务建设;
3、负责大规模文本、图像数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作;
4、负责公司爬虫的技术调研以及策略优化;
任职要求:
1、一年以上大规模爬虫/反爬经验,熟悉HTTP协议/浏览器原理/前端JS/APP抓取;
2、熟悉至少Python、Java、JavaScript中的一种语言;
3、有解决复杂的反爬限制实践经验, 能解决如图片验证码/滑块/账号限制/ip限制等问题,熟悉反爬虫、签名破解、验证码识别技术者优先;
4、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先;
5、熟悉app端数据抓取(有逆向、脱壳等经验),掌握Apktool、dex2jar、JD-GUI、frida、ida等工具,能独立完成主流电商平台和主流app软件大量级的数据抓取优先;
公司:唯品会
地点:广州
薪资范围:20K-40K
招聘名额:7
学历:大专及以上
支持年前面试, 年后入职
有意愿的大佬可以+v发简历or详细沟通
冲冲冲
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...