穿靴子的鱼Python-程序员客栈

27天前在线

D级

数据采集

天津

全职 · 300/日 · 6525/月信用一般

工作时间: 工作日19:00-22:00、周末09:00-22:00工作地点: 远程

服务企业: 1家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

核心技术栈：

▌爬虫框架：Scrapy基础开发，熟悉Item Pipeline基础配置

▌数据解析：熟练使用XPath与BeautifulSoup提取页面元素

▌反反爬基础：掌握UserAgent轮换，使用免费代理池

▌数据存储：MySQL数据入库，CSV文件导出

▌调试工具：浏览器开发者工具基础使用

若您需要可靠的基础数据采集支持，欢迎随时联系！

2024-09-03 -2025-02-27学校实验室数据采集
采用requests、selenium、xpath等库编写数据采集代码，抓取目前各大OJ平台的前端数据，整理成算法题库数据集。帮助为AI采集所需的训练数据并整理整理成可用而数据集供模型使用。

2023-09-01 - 天津工业大学计算机科学与技术本科

Python

作品

哔哩哔哩数据采集助手

可以帮助抓取B站的视频、音频、弹幕、字幕等，是一个数据采集的辅助工具。核心功能实现： - 视频元数据抓取：通过B站API接口获取视频标题、播放量、弹幕量等基础信息 - 弹幕采集：解析CID参数获取XML格式弹幕数据，日均采集5,000条 - 字幕提取：自动下载CC字幕文件并转为SRT标准格式 - 音频分离：使用FFmpeg从MP4文件中提取ACC音频流

2025-03-20 09:14

下载次数：0

￥50

更新于: 03-20 浏览: 14

个人介绍

工作经历

教育经历

技能

Ta的轻识空间作品（0）

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐