个人介绍
芯片行业, 电商行业, 金融服务行业信息数据采集
分布式爬虫项目架构设计与开发
大型团队项目开发与管理
大规模爬虫部署与管理后台搭建
大规模亿量级数据采集、过滤清洗、存储、分析
各种反爬虫的技术应对与解决策略
jQuery/Vue前端框架, Flask/Django后端框架, Node.js 等全栈技能
数据情感分析、分词、词频统计、可视化等自然语言处理
工作经历
和TA聊聊APP扫码和程序员直接沟通
该用户选择隐藏工作经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看
教育经历
和TA聊聊APP扫码和程序员直接沟通
该用户选择隐藏教育经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看
资质认证
技能
1、Digikey(得捷):https://www.digikey.com/ 2、Mouser(贸泽):https://www.mouser.com/ 3、Avnet(安富利):https://www.avnet.com/ 4、Arrow(艾睿):https://www.mouser.com/ 5、Kynix(凯利讯):https://www.kynix.com/ 6、Newark:https://www.newark.com/ 7、rsonline(欧时):https://us.rs-online.com/ 8、datasheet5:https://www.datasheet5.com/ 9、bom2buy:https://www.bom2buy.com/ 10、Findic(采芯网):https://www.findic.us/
一、 项目架构设计 简介: 基于Python3的scrapy_redis + crawlab框架拓展开发, 适用于芯片行业数据采集的分布式爬虫器 主要模块: settings、 middlewares、 pipelines、 items、 spiders、 tools(共用配置与方法封装器)、 special(特殊处理封装器)、 fileStores(文件储存器) 二、 项目功能与特点 拓展功能: 集合了对接mysql/mongo数据库、 redis缓存与队列、 阿里云OSS文件存储、 代理和识别验证码第三方平台接口等功能 爬虫池: 聚集了芯片行业主要的电商平台和知名品牌官网的爬虫 特点: 1、提供了芯片行业主流网站(Digikey、Mouser、Kynix、Arrow等)数据接口 2、封装了HTML中各种table样式标签的通用方法 3、链接了解决各种验证码的第三方平台接口 4、提供了爬虫脚本通用temp, 可更简洁、快速、清晰开发新spider 三、 crawlab爬虫管理后台搭建 1、集部署、任务调度、任务监控、结果展示等模块于一体的爬虫项目管理系统 2、阿里云centos7 + docker + mongodb、redis
用户评价
相似推荐 换一批
python后端
600元/天
深圳前海中智人工智能投资有限公司
技能:Python,python django,python(爬虫),Linux,MySQL
技术leader
1000元/天
达而观信息科技(上海)有限公司
技能:Python,HTML、CSS、JavaScript、Jquery、Vue,Linux,git,mysql、mongodb、redis,Flask、Django,Nginx、uWSGI 、Gunicorn,celery,ElasticSearch,Scrapy、Scrapy-Redis,Matplotlib、Numpy、Pandas、Scikit-Learn,Docker
高级云计算运维开发工程师
600元/天
网宿科技
技能:ansible-playbook,Python,Shell,Docker,jenkins
Python后端工程师
1000元/天
深圳呗佬智能有限公司
技能:Java,JavaScript,Python