数据采集平台

我要开发同款
proginn07015315952024年03月30日
46阅读
开发技术docker、elasticsearch、flask、pythonjava
所属分类数据采集、爬虫

作品详情

主要模块
爬虫服务:采集微博、头条、最右等站点文章
审核服务:对采集语料进行人工审核,选择优质的语料发布到PGC平台
定时任务服务:界面化管理后台定期任务
技术栈:
Java、Python、Vue、Uniapp、MySQL
难点:
分布式爬虫调度
Elasticsearch内容搜索
自动发布内容任务
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论