guixuqi
5天前在线
全职 · 500/日  ·  10875/月
工作时间: 工作日09:00-23:00、周末09:00-24:00工作地点: 远程
服务企业: 125家累计提交: 17工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

芯片行业, 电商行业, 金融服务行业信息数据采集

分布式爬虫项目架构设计与开发

大型团队项目开发与管理

大规模爬虫部署与管理后台搭建

大规模亿量级数据采集、过滤清洗、存储、分析

各种反爬虫的技术应对与解决策略

jQuery/Vue前端框架, Flask/Django后端框架, Node.js 等全栈技能

数据情感分析、分词、词频统计、可视化等自然语言处理

工作经历 和TA聊聊

APP扫码和程序员直接沟通

  • 该用户选择隐藏工作经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看

教育经历 和TA聊聊

APP扫码和程序员直接沟通

  • 该用户选择隐藏教育经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看

技能

爬虫
数据处理与分析
MySQL
MongoDB
0
1
2
3
4
5
0
1
2
3
4
5
作品
电子元件数据(2024 New)

1、Digikey(得捷):https://www.digikey.com/ 2、Mouser(贸泽):https://www.mouser.com/ 3、Avnet(安富利):https://www.avnet.com/ 4、Arrow(艾睿):https://www.mouser.com/ 5、Kynix(凯利讯):https://www.kynix.com/ 6、Newark:https://www.newark.com/ 7、rsonline(欧时):https://us.rs-online.com/ 8、datasheet5:https://www.datasheet5.com/ 9、bom2buy:https://www.bom2buy.com/ 10、Findic(采芯网):https://www.findic.us/

0
2024-11-01 19:55
下载次数:0
¥1
ICrawler电子元器件数据爬虫器

一、 项目架构设计 简介: 基于Python3的scrapy_redis + crawlab框架拓展开发, 适用于芯片行业数据采集的分布式爬虫器 主要模块: settings、 middlewares、 pipelines、 items、 spiders、 tools(共用配置与方法封装器)、 special(特殊处理封装器)、 fileStores(文件储存器) 二、 项目功能与特点 拓展功能: 集合了对接mysql/mongo数据库、 redis缓存与队列、 阿里云OSS文件存储、 代理和识别验证码第三方平台接口等功能 爬虫池: 聚集了芯片行业主要的电商平台和知名品牌官网的爬虫 特点: 1、提供了芯片行业主流网站(Digikey、Mouser、Kynix、Arrow等)数据接口 2、封装了HTML中各种table样式标签的通用方法 3、链接了解决各种验证码的第三方平台接口 4、提供了爬虫脚本通用temp, 可更简洁、快速、清晰开发新spider 三、 crawlab爬虫管理后台搭建 1、集部署、任务调度、任务监控、结果展示等模块于一体的爬虫项目管理系统 2、阿里云centos7 + docker + mongodb、redis

1
2024-11-01 19:55
下载次数:0
¥1000
电子元器件通用爬虫器Icrawler源代码链接

集合了对接 mysql/mongodb数据库、 redis缓存与任务队列、 Amazon S3/阿里云OSS文件存储、 代理和识别验证码第三方平台接口等功能 聚集了芯片行业主要的电商平台和知名品牌官网的爬虫 1、提供了芯片行业主流网站(Digikey/Mouser/Arrow/Kynix/datasheet5等)数据采集脚本 2、封装了提取HTML中各种样式table标签数据的通用方法 3、链接了解决各种验证码的第三方平台接口及各种反爬解决案例 4、提供了爬虫脚本通用temp, 可更简洁、快速、清晰开发新spider wechat:rc92217991

1
2024-10-30 16:44

3 人评论
用户评价

用户644245
proginn1533411252
可以
用户787800
proginn1149437185
关闭
用户438929
zhsword
认真负责
更新于: 02-21 浏览: 1119