1. **面向用户 & 解决问题**(30%)
- 面向**设计师、自媒体创作者、壁纸爱好者**,提供**高质量、自动化**的壁纸采集方案。
- 解决**手动下载效率低、图片源分散、版权不清晰**等问题。
2. **核心优势**(50%)
- **智能去重**:基于**哈希/相似度算法**,避免重复爬取。
- **自动分类**:按分辨率、风格(如4K、动漫、风景)自动归档。
- **反反爬策略**:动态IP池 + 请求头轮换,稳定采集主流壁纸网站(如Wallhaven、Unsplash)。
- **轻量API支持**(可选):通过Flask提供RESTful接口,方便集成到其他应用。
3. **技术选型**(20%)
- **爬虫框架**:Scrapy(分布式)或Requests+BS4(轻量级)。
- **存储方案**:MongoDB(非结构化图片元数据) + 本地/云存储(图片文件)。
- **可视化**(可选):用PyQt/Dash搭建管理后台,查看爬取统计。