岗位:全职
年龄:不限
职位详情
岗位职责:
1、根据公司业务需要,对指定信息源进行数据抓取;
2、研究和应对反爬策略,爬取的稳定性;
3、维护现有爬虫相关工作
4、负责信息抽取、数据清洗等研发和优化工作;
5、负责抓取数据的解析入库,爬虫系统的监控和异常警报。
6、使用flask框架编写上传接口,提供给终端系统上传数据.
任职资格:
1、三年以上的爬虫经验,两年后台开发
2、熟悉Scrapy、Beautifulsoup、Selenium等爬虫框架或工具包
3、熟悉MYSQL,Redis ,Mongodb等数据库
4、熟悉网页结构分析,包括HTML、XPath、正则表达式、AJAX、HTTP协议等
5、熟悉爬虫抓取原理,了解反爬策略
6、熟悉操作系统Windows平台、代码管理(git)等
7、有较强的数据分析与处理能力尤佳
8、熟悉Java优先.
加分项:
1.对接过广东省或其他省的基本公共卫生管理系统者优先.
查看全部
工作地点
广州天河区富力盈力大厦北塔广州市天河区富力盈力大厦北塔509联安健康