个人介绍
熟练使用scrapy爬虫框架, 有过舆情监测相关工作经验
熟练操作linux系统, 熟悉各种命令
熟练使用django开发框架
熟练使用xpath, re等数据提取工具
熟悉js逆向, 微博登录cookie破解, 小红书数美风控api破解, 抖音关键词搜索x-bogus/_signature加密参数生成, 今日头条ttwid生成
工作经历
2021-03-26 -至今河北启天Python爬虫
公司主要负责舆情监测, 安全监测项目 负责定向账号/关键词监测项目开发, 爬虫包括(微博,头条, 贴吧, 百度, 小红书, twitter, facebook)等 负责舆情监测通用爬虫框架开发, 爬虫包括各种舆情网站, 政府机构新闻信息, 监测2w网站 负责热搜监测爬虫开发, 包括微博, 知乎, 腾讯, 头条, 抖音, 贴吧, B***60, 搜狗, 搜狐等等 负责短视频监测平台爬虫开发, 包括B站, 抖音, 微博, 小红书, 好看, 微视, 皮皮虾, 梨视频, 度小视, 西瓜等
2019-03-01 -2021-03-31河北九度pyhton爬虫/开发
公司主要防线: 小程序, 软件制作 负责内容, 公司小程序数据对接,爬虫采集相关数据
教育经历
2018-09-16 - 2022-12-06河北科大计算机科学与技术本科
大四北京益友会科技有限公司实习
技能
微博账号登录cookie破解 采集现有微博账号发文, 微博账号数量1.6亿, 7天内活跃账号1500w, 30天内活跃账号3000w, 非活跃账号1.1亿, 各种原因失效(被封, 注销)账号500w 分布式爬虫采集, 每日数据量3000w左右, 采集微博账号发文 通过爬虫采集文章判断当前账号是否活跃, 若账号活跃则提高账号采集频率