Spider Admin Pro Scrapy 可视化管理和定时调度开源项目

我要开发同款
匿名用户2021年02月03日
113阅读
开发技术PythonHTML/CSS
所属分类网络爬虫、应用工具
授权协议GPL

作品详情

SpiderAdminProGithub: https://github.com/mouday/spider-admin-pro

Gitee: https://gitee.com/mouday/spider-admin-pro

Pypi: https://pypi.org/project/spider-admin-pro

简介SpiderAdminPro是SpiderAdmin的升级版

简化了一些功能;优化了前端界面,基于Vue的组件化开发;优化了后端接口,对后端项目进行了目录划分;整体代码利于升级维护。

安装启动方式一:

$pip3installspider-admin-pro$python3-mspider_admin_pro.run方式二:

$gitclonehttps://github.com/mouday/spider-admin-pro.git$python3spider_admin_pro/run.py或者$gunicornspider_admin_pro.run:app配置参数在运行目录新建 .env 环境变量文件,默认参数如下

注意:为了与其他环境变量区分,使用SPIDER_ADMIN_PRO_作为变量前缀

#flask服务配置SPIDER_ADMIN_PRO_PORT=5002SPIDER_ADMIN_PRO_HOST='127.0.0.1'#登录账号密码SPIDER_ADMIN_PRO_USERNAME=adminSPIDER_ADMIN_PRO_PASSWORD="123456"SPIDER_ADMIN_PRO_JWT_KEY=FU0qnuV4t8rr1pvg93NZL3DLn6sHrR1sCQqRzachbo0=#token过期时间,单位天SPIDER_ADMIN_PRO_EXPIRES=7#scrapyd地址,结尾不要加斜杆SPIDER_ADMIN_PRO_SCRAPYD_SERVER='https://127.0.0.1:6800'#调度器调度历史存储设置#mysqlorsqliteandother,anydatabaseforpeeweesupportSPIDER_ADMIN_PRO_SCHEDULE_HISTORY_DATABASE_URL='sqlite:///dbs/schedule_history.db'#调度器定时任务存储地址SPIDER_ADMIN_PRO_JOB_STORES_DATABASE_URL='sqlite:///dbs/apscheduler.db'使用python3-m 运行,需要将变量加入到环境变量中,运行目录下新建文件env.bash

注意,此时等号后面不可以用空格

#flask服务配置exportSPIDER_ADMIN_PRO_PORT=5002exportSPIDER_ADMIN_PRO_HOST='127.0.0.1'#登录账号密码exportSPIDER_ADMIN_PRO_USERNAME='admin'exportSPIDER_ADMIN_PRO_PASSWORD='123456'exportSPIDER_ADMIN_PRO_JWT_KEY='FU0qnuV4t8rr1pvg93NZL3DLn6sHrR1sCQqRzachbo0='增加环境变量后运行

$sourceenv.bash$python3-mspider_admin_pro.run生成jwtkey

$python-c'importbase64;importos;print(base64.b64encode(os.urandom(32)).decode())'使用扩展收集运行日志:scrapy-util 可以帮助你手机到程序运行的统计数据

技术栈:1、前端技术:

功能第三方库及文档基本框架vue仪表盘图表echarts网络请求axios2、后端技术

功能第三方库及文档接口服务Flask任务调度apschedulerscrapyd接口scrapyd-api网络请求session-requestORMpeeweejwtjwt系统信息psutil项目结构【公开仓库】基于Flask的后端项目spider-admin-pro: https://github.com/mouday/spider-admin-pro

【私有仓库】基于Vue的前端项目spider-admin-pro-web: https://github.com/mouday/spider-admin-pro-web

spider-admin-pro项目结构:

.├──__init__.py├──run.py├──main.py├──config.py├──version.py├──flask_app.py├──logger.py├──api_result.py├──api│  ├──__init__.py│  ├──auth_api.py│  ├──schedule_api.py│  ├──scrapyd_api.py│  └──system_info_api.py├──service│  ├──__init__.py│  ├──auth_service.py│  ├──schedule_service.py│  ├──scrapyd_service.py│  └──system_data_service.py├──model│  ├──__init__.py│  ├──base.py│  └──history.py├──exceptions│  ├──__init__.py│  ├──api_exception.py│  └──constant.py├──utils│  ├──__init__.py│  ├──jwt_util.py│  ├──scheduler_util.py│  ├──sqlite_util.py│  └──system_info_util.py└──web├──__init__.py├──main.py└──public├──index.html└──static项目截图

TODO1.补全开发文档

2.支持命令行安装可用

3.优化代码布局,提取公共库

4.日志自动刷新

5.scrapy项目数据收集

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论