zsjyyds-重庆前端-程序员客栈

1月前来过

D级

数据工程师

重庆

全职 · 300/日 · 6525/月信用正常

工作时间: 工作日8:30-22:00、周末09:00-23:00工作地点: 远程

服务企业: 1家累计提交: 0工时

联系方式:

********

立即雇佣

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

本人乐观开朗，做事认真负责，上进心强，有较强的组织、管理能力，勇于承担任务与责任，能够快速接受新知识和快速适应新环境，具有良好的团队合作精神以较好的个人亲和力。良好的综合素质，具备复合型人才的条件，具有较高的交流和沟通能力，做事有条理，有较强的协调能力，争取做到在其职尽其责等

2020-11-24 -2021-02-01深圳市九学王科技有限公司数据工程师
技术信息的收集、整理，写出一些能够沿着网爬的”蜘蛛“程序，保存下来获得的信息，运用python爬取词语等信息，写入excel后分类

2018-09-01 - 2021-06-30重庆房地产职业学院互联网金融（大数据应用与分析）专科
主修课程：JavaScript，HTML前端设计，数据库，python语言，Linux操作系统，WORD、EXCEL，SPSS，电子商务数据分析与应用等

MySQL掌握

作品

爬取成语

import requests import parsel import pandas as pd class Spider: def __init__(self): self.df = pd.DataFrame() self.title = ["意思", '成语接龙','成语故事','造句示例'] self.title2 = ['暂无'] self.base_url = 'https://m.autostr.org.cn/ciyu/chengyu/list-{}.html' self.headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'} def start1(self): # 爬取词语url列表，保存为txt for i in range(1, 1372): # 页数 url = self.base_url.format(i) data = requests.get(url=url, headers=self.headers).text selector = parsel.Selector(data) result_list = selector.xpath('//*[@id="list_page"]/li/a/@href').getall() url_text = "" for j in result_list: url_text = url_text + j + "\n" f = open("url.txt", 'a') f.write(url_text) f.close()

2021-05-23 17:15

爬取词语

import parsel url = 'http://chenyu.00cha.com/cy/oa9sfr.html' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'} data = requests.get(url=url, headers=headers) html = data.encoding = 'gbk' html1 = data.text selector = parsel.Selector(html1) list1 = selector.xpath('//span[@class="cyh"]/text()').extract() # print(list1) # print(type(list1)) pinying1 = selector.xpath('//span[@class="cyp"]/text()').getall() # print(pinying1) detailed = selector.xpath('//div[@class="cynr"]/text()').getall() make = selector.xpath('//div[@class="cynr"]/text()[9]').extract() make1 = selector.xpath('//div[@class="cynr"]/strong/text()').extract() make2 = selector.xpath('//div[@class="cynr"]/text()[10]').extract() test = make + make1 + make2 test=''.join(test) print(test) print(type(test)) experiment = selector.xpath('//div[@class="cynr"]/text()[1]').getall() print(experiment)

2021-05-23 17:12

爬虫2

import requests import parsel headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'} f = open('chengyu2_url.txt','r') lines = [line.strip('\n') for line in f.readlines()] f.close() a=0 for url in lines: a+=1 if '.asp'in url: url = 'o' print(a,url) with open('chengyu4.xlsx', 'a', encoding='utf-8')as f: f.write(url + '\n') f.close()

2021-05-23 17:10

更新于: 2021-05-23 浏览: 360

个人介绍

工作经历

教育经历

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐