职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1. 负责平台分布式网络爬虫系统的设计与研发工作、进行多平台网页、APP等数据的爬取和分析工作,如果有电商数据抓取经验更佳;
2. 负责核心数据抓取及存储系统的架构设计、优化;
3. 设计爬虫策略和防屏蔽规则,提升网页和APP的抓取效率和质量。
任职要求:
1、 本科及以上学历,计算机等相关专业;
2、有3年以上Python爬虫相关经验,精通常用的爬虫网络框架,了解其工作原理及重要组件;
3、有丰富的解决复杂的反爬限制经验,能解决如图片验证码/滑块/账号限制/IP限制等问题;
4、 熟悉掌握 Scrapy或 Spider 框架的机制和现实、数据存储架构设计;
5、 熟练使用 Python request 模块、xpath、Selenium,BeautifulSoup,正则等;
6、熟悉mysql数据库、熟悉mysql的各种存储引擎,熟悉索引工作原理;熟悉java语言、有机器学习相关经验者优先。
7、拥有良好的沟通、交流能力;做事严谨,注重细节。
1. 负责平台分布式网络爬虫系统的设计与研发工作、进行多平台网页、APP等数据的爬取和分析工作,如果有电商数据抓取经验更佳;
2. 负责核心数据抓取及存储系统的架构设计、优化;
3. 设计爬虫策略和防屏蔽规则,提升网页和APP的抓取效率和质量。
任职要求:
1、 本科及以上学历,计算机等相关专业;
2、有3年以上Python爬虫相关经验,精通常用的爬虫网络框架,了解其工作原理及重要组件;
3、有丰富的解决复杂的反爬限制经验,能解决如图片验证码/滑块/账号限制/IP限制等问题;
4、 熟悉掌握 Scrapy或 Spider 框架的机制和现实、数据存储架构设计;
5、 熟练使用 Python request 模块、xpath、Selenium,BeautifulSoup,正则等;
6、熟悉mysql数据库、熟悉mysql的各种存储引擎,熟悉索引工作原理;熟悉java语言、有机器学习相关经验者优先。
7、拥有良好的沟通、交流能力;做事严谨,注重细节。
工作地点
地址:杭州西湖区华星路99号创业大厦5楼/6楼
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
陈HR
浙江甲骨文超级码科技股份有限公司
- 计算机软件
- 200-499人
- 私营·民营企业
- 西湖区华星路99号创业大厦A509
相似职位
-
商务拓展(杭州) 17000-27000元应届毕业生 本科北京小桔科技有限公司
-
蚂蚁集团-业务管理专家-数字商业 30000-50000元应届毕业生 本科蚂蚁科技集团股份有限公司
-
阿里云智能-dashscope模型服务灵积 产品经理-杭州 10000-20000元应届毕业生 硕士阿里巴巴(中国)有限公司
-
物流部-物流系统流程规划专家-仓储流程系统规划 10000-20000元应届毕业生 本科阿里巴巴(中国)有限公司
-
招聘专员 8000-10000元应届毕业生 本科浙江荣盛控股集团有限公司
-
短剧工作室负责人 25000-40000元应届毕业生 不限网易(杭州)网络有限公司