

全职 · 1000/日 · 21750/月信用正常
工作时间: 周末2:00-5:00工作地点:
远程
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********



个人介绍
2、熟悉html、js、 ajax、firedebug
3、网页去重、找到网站特点
4、分布式
5、多线程
6、一种关系型数据库mysql/oraclelserver/mybatis
7、正则表达式、css selector、 xpath
8、DNS cache
9、TCP/IP/Http协议tp2.010、web登录协议
10、 SSO、OAuth原理
11、反爬策略
12、熟悉httpClient、okhttp3...
13、 熟悉一些提取工具、jsoup、selenim WebDriver...
14、搜索技术。熟悉Lucene/Nutch/Heritrix/solr/elastic-search/
15、熟悉XML、JSON、SOAP协议;
16、mongodb、 redis、 hbase、 hadoop
17、文本分析、机器学习、数据挖掘、自然语言处理[NLP]
18、完成网页、***、论坛等数据信息的精
3、网页去重、找到网站特点
4、分布式
5、多线程
6、一种关系型数据库mysql/oraclelserver/mybatis
7、正则表达式、css selector、 xpath
8、DNS cache
9、TCP/IP/Http协议tp2.010、web登录协议
10、 SSO、OAuth原理
11、反爬策略
12、熟悉httpClient、okhttp3...
13、 熟悉一些提取工具、jsoup、selenim WebDriver...
14、搜索技术。熟悉Lucene/Nutch/Heritrix/solr/elastic-search/
15、熟悉XML、JSON、SOAP协议;
16、mongodb、 redis、 hbase、 hadoop
17、文本分析、机器学习、数据挖掘、自然语言处理[NLP]
18、完成网页、***、论坛等数据信息的精
工作经历
2021-04-01 -2023-05-01東軟python 开发
Ø 负责设计开发分布式网络爬虫,进行多平台信息抓取分析工作; Ø 根据业务需求,实现文本、图片数据抓取、清洗、存储工作; Ø 根据业务需求通过抓包技术Wireshark,包括代理、selenium、验证码处理等; Ø 根据业务需求获取各大平台cookies实现模拟登录和模拟请求接口获取数据。
教育经历
2011-01-01 - 2014-01-01中山大学計算機本科
本科毕业,读中山大学计算机糸, 熟练掌握Python、JavaScript、MySQL等编程语言。 精通Selenium等框架
技能
0
1
2
3
4
5