金融科技实习生西安
全职 · 300/日 · 6525/月信用正常
工作时间: 周末09:00-08:00工作地点:
远程
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********
查看联系方式
聊一聊工作经历
2022-07-13 -2022-08-13兴业银行金融科技实习生
客户分层就是基于资源有限性和需求异质性的前提下,对银行的客户群根据不同维度进行细分的过程,从而为客户提供精细化、精准化的服务。
教育经历
2020-09-01 - 2024-07-28西安交通大学人工智能本科
技能
C++
0
1
2
3
4
5
作品
weixin.sogou.com 是一个反爬极其严厉的站点。 在不登录的情况下只能浏览前十页。 在登录的情况下只能爬取前一百页。 搜狗* 的反爬措施是封 IP 和封 Cookie。 如果每五秒翻一页,大概翻二十页你会触发反爬
0
2023-04-22 23:25
找到特定电影的评论在其移动门户中的url,然后按页面爬取且随机生成页码 每休眠2s后再进行爬取,以免过于频繁 还有就是需要注意将网络数据写入本地时需指明编码方式为utf-8否则会出现编码错误的问题
0
2023-04-22 23:27
我们需要爬取的是懂球帝新闻中英超,西甲,意甲,德甲的新闻,由于这是四个结构一样的板块,所以解析一个就可以了,以英超为例。进入英超新闻第一页列表页,需要先获取到当前页所有的新闻链接等内容,再对链接进行筛选,然后将筛选通过的链接存入设置了唯一索引的数据表,如果存入成功,说明以前没有爬取过这条新闻,然后就通过成功存入的链接获取到新闻详情页,解析新闻详情页,获取到我们需要爬取的内容,然后存入数据库。解析完第一页列表页后,获取下一页列表页的链接,然后获取下一页页面,就像第一页这样爬取,这样不断循环,就可以爬取很多页了。最后再将其余三个板块的新闻都加进去,这样就差不多了。嗯,大概逻辑就是这样。。。当然还有很多细节,需要在代码中体现。
0
2023-04-22 23:30