0
1
2
3
4
5
0
1
2
3
4
5
2024-05-07 -2024-07-17园林无
我熟练使用 Python 的 Scrapy 框架和 BeautifulSoup 库,成功爬取了多个知名网站的大量数据,包括电商平台的产品信息、新闻网站的文章内容以及社交媒体上的用户评论等。在爬取过程中,我能够有效地处理各种反爬虫机制,如设置合理的请求头 运用 Python 的 Pandas 库对爬取到的数据进行了深入的处理。包括去除重复数据、处理缺失值、纠正数据格式错误以及进行数据标准化等操作。通过精心的清洗工作,为后续的数据分析和建模提供了高质量、准确且一致的数据基础。
2021-06-09 - 2024-07-20广州大学华软软件学院数据科学与大数据技术本科