穿靴子的鱼
27天前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日19:00-22:00、周末09:00-22:00工作地点: 远程
服务企业: 1家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

核心技术栈:

▌爬虫框架:Scrapy基础开发,熟悉Item Pipeline基础配置  

▌数据解析:熟练使用XPath与BeautifulSoup提取页面元素  

▌反反爬基础:掌握UserAgent轮换,使用免费代理池  

▌数据存储:MySQL数据入库,CSV文件导出  

▌调试工具:浏览器开发者工具基础使用  


若您需要可靠的基础数据采集支持,欢迎随时联系!  

工作经历

  • 2024-09-03 -2025-02-27学校实验室数据采集

    采用requests、selenium、xpath等库编写数据采集代码,抓取目前各大OJ平台的前端数据,整理成算法题库数据集。帮助为AI采集所需的训练数据并整理整理成可用而数据集供模型使用。

教育经历

  • 2023-09-01 - 天津工业大学计算机科学与技术本科

技能

0
1
2
3
4
5
作品
哔哩哔哩数据采集助手

可以帮助抓取B站的视频、音频、弹幕、字幕等,是一个数据采集的辅助工具。 核心功能实现: - 视频元数据抓取:通过B站API接口获取视频标题、播放量、弹幕量等基础信息 - 弹幕采集:解析CID参数获取XML格式弹幕数据,日均采集5,000条 - 字幕提取:自动下载CC字幕文件并转为SRT标准格式 - 音频分离:使用FFmpeg从MP4文件中提取ACC音频流

0
2025-03-20 09:14
下载次数:0
¥50
更新于: 03-20 浏览: 14