微信用户1417229062
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日20:00-02:00、周末10:00-24:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

Hi, 我的技术主攻方向为爬虫数据采集,平时也有在研究各类的加密算法。

较多的进行页面的采集与清洗梳理入库。

如果,有需要可以联系我。

不为别的,为了热爱!!!

工作经历

  • 2023-05-15 -至今北京信工博特智能科技有限公司数据采集工程师

    AI项目,大数据识别以及AI文本处理。 为AI模型提供日常训练的数据,以及各类小型项目所需的数据支持。

  • 2022-10-26 -2023-04-30北京中科闻歌科技有限公司数据采集工程师

    为甲方提供所需数据,以及公司主推的数据库,大数据库。 采集国内外新闻,twitter等。采集分配的门户网站采集任务。

  • 2021-06-15 -2022-10-18中华网数据采集工程师

    新闻门户网站,提供新闻数据来源。为中华网国内外门户网站提供数据。为编辑提供日常稿件。

教育经历

  • 2017-09-01 - 2021-06-30天津天狮学院计算机科学与技术本科

技能

Flask
Mongo
Qt嵌入式
ElasticSearch
RabbitMQ
加密解密
爬虫
0
1
2
3
4
5
0
1
2
3
4
5
作品
采集各类网站

采集各类所需网站。 国内外静态页面、小红书、抖音(视频、评论、直播流、直播实时评论)。twitter账户的推文以及历史。

0
2024-04-17 17:55
采集wx公众号的文章

针对wx公众号的文章采集。 关联到*端自动滑动查看历史文章。 包括该账号下的所有文章、历史文章。 针对文章里的文本内容,图片,以及视频的发布。 关联文章的采集。

0
2024-04-17 17:50
设计静态页面新闻的采集框架

参与设计新闻类静态页面的采集框架, 针对不同来源的新闻网站,只需配出其针对的xpath以及正则即可。 其中,大框架可以提取主要内容,针对文本、图片、以及视频的下载与保存。

0
2024-04-17 17:44
更新于: 04-17 浏览: 74