全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

网络爬虫

├── auth 用户验证模块 │ ├── admin.py │ ├── apps.py │ ├── migrations │ ├── models.py 用户信息-数据模型 │ ├── urls.py 登录注册相关视图-路由地址配置 │ └── views.py 登录注册相关视图 ├── bs-frontend-template 前端vue目录 │ ├── LICENSE │ ├── encrypt.js │ ├── index.html │ ├── jest.config.js │ ├── mock │ ├── package-lock.json │ ├── package.json │ ├── public │ ├── src │ ├── tailwind.config.js │ ├── test │ ├── tsconfig.json │ └──

1750python网络爬虫

爬虫

一些简单的爬虫，进行爬取视频，图片，文本等。用了requests或selenium自动化，也会一小些简单的反爬策略，可以教学

1220python网络爬虫

数据分析处理/图像处理/自动化

可以根据需求定制完成以下内容 1、数据分析处理，python，包含数据预处理、可视化、爬虫、常见模型分析等； 2、办公自动化：excel VBA自动化、python 办公自动化 3、Axure原型设计； 4、看板搭建、数据大屏搭建

1260python自然语言处理

文本情绪分析

通过前端输入词汇，进行相应的判断，如果为网址输入，则使用爬虫爬出相应的评论包中的评论，目前该功能仅适配b站评论，分析网络包，否则分析语句情感。

1440python网络爬虫

金融数据搜集系统

1、搜集A股市场的所有历史行情数据 2、搜集A股市场的所有股票板块信息 3、自动化计算板块指数等 4、自动化部署python脚本 5、数据监控报警

1330爬虫python

[个人学习项目]图片验证码的识别与反识别研究

研究不同的策略和模型对验证码的识别影响研究参考的目标网站是条形码查询网（http://tiaoma.cnaidc.com/），可以查询条形码所对应的商品信息。

780python网络爬虫

全国破产重整案件网

1、全国建筑市场企业资质公示信息按地市采集 337/337 数据量100万+，持续增加 2. 全国破产重整案件网公开案件按月采集数据量60万+，持续增加

6330python网络爬虫

网站开发后端

1、采集后端django + 前端vue + mysql 实现了网站。 2、django+admin 实现了公司的后端管理 3、主要是代理ip的推广静态网页，和后端用户的管理平台。

1030pythonWeb框架

python爬虫，自动化工具。

项目有根据提供的会员ID自动查询手机号码，并且实现自动保存到XLSX里面。可以根据用户需求更改POST请求内容可以定制内附有CPU识别算法加密，

2370python数据查询

数据采集

采集过的网站： Bilibili, 百度百科, Boss 直聘, 豆瓣读书, 抖音, 京东, 京东商品+评论, 链家, 天猫, 淘宝, 知乎, Taptap等技术介绍： HTTPX等网络工具，非常快速，有效地获取数据。模拟浏览器环境（如Selenium, Puppeteer, Headless Browsers等）来进行网页数据抓取的行为。模拟用户真实浏览器行为：模拟人的动作，比如点击按钮、滚动页面、填写表格等。处理动态网页：有些网站的内容不是一开始就全部显示出来的，而是你浏览的时候慢慢加载出来的。这些工具可以等待这些内容加载完，然后再收集信息。处理JavaScript生成的页面：浏览器抓取工具可以执行JavaScript，然后把这些动态生成的内容也收集起来。通过代理IP，解决IP访问限制，够模拟真实用户行为，绕过许多基于用户行为的反爬虫机制。

1070python

知乎问答及评论爬虫

1、使用api接口方法，实现知乎问答的问题及全部答案爬取 2、使用逆向解析接口实现评论区1000条以上评论全部爬取 3、使用多线程实现高效爬取数据

1080python网络爬虫

获取东方财富网资金流入信息

1、获取东方财富网站不同股票的资金流入信息 2、难点信息较多，爬取速度慢，解决方案：利用多线程加快爬取速度

1860python网络爬虫

抖音作者主页视频下载爬虫

1、抖音JS逆向破解并获取视频接口链接 2、获取主页视频并下载抖音无水印视频及封面 3、通过csv存储下载的视频信息

1360python网络爬虫

爬虫、chatgpt、剪切板开发工具

1.系统主要为个人练习使用，包括网络爬虫，通过表单配置进行保存和配置任务，将爬取的内容进行文件存储或者数据库保存；集成chatgpt通过代理进行AI的聊天，通过redis保存对话实现与AI对话的连续性和时效性；通过系统监听获取剪切板内容，通过跨端进行内容的一处复制，多处粘贴；使用uniapp进行移动端的开发；通过minio进行文件的上传管理；docker进行系统的容器化部署

2010Java网络爬虫

微信电影机器人

1、使用tkinter制作微信助手可视化UI，显示微信用户头像等基本信息 2、使用多线程技术处理消息和数据库查找 3、通过判断特定聊天词触发数据库搜索电影名返回电影链接 4、数据库分为精确查找和模糊查找区分搜索电影和电视剧，控制搜索结果返回数量

1150python网络爬虫

全国住建企业资质采集产品系统

1、全国建筑市场企业资质公示信息按地市采集，数据量100万+，持续增加中 2. 全国破产重整案件网公开案件按月采集，数据量60万+，持续增加中建筑市场企业资质公示信息的数据采集通常涉及以下步骤： 1. **确定数据来源**：确定您想要采集的建筑市场企业资质公示信息的来源，例如官方网站、数据库或其他渠道。 2. **制定数据采集计划**：制定详细的数据采集计划，包括需要采集的信息内容、采集频率、采集方式等。 3. **选择合适的工具**：根据数据来源和采集计划，选择适合的数据采集工具，比如网络爬虫、数据抓取软件等。 4. **编写数据采集脚本**：如果需要定制化的数据采集，您可能需要编写数据采集脚本来自动化数据采集过程。 5. **执行数据采集**：根据计划执行数据采集，确保数据的准确性和完整性。 6. **数据清洗和处理**：采集到的数据可能需要进行清洗和处理，确保数据质量和可用性。 7. **数据存储和分析**：将采集到的数据存储在适当的数据库或文件中，并进行分析和利用。

1390python网络爬虫参考价格2000.00元

A股爬虫 + 量化模型

本项目实现了高效的数据爬取脚本，自研量化模型，旨在为投资者提供全面、实时的A股市场分析与投资决策支持。项目通过自动化手段实现了对A股市场的全天候监控与量化分析，及时获取最明智的投资决策。 1. A股历史数据爬取：数据全面：覆盖所有A股上市公司的历史数据，确保数据的广泛性和完整性。高效采集：采用优化的爬虫技术，能够快速、准确地获取大规模数据。数据存储：使用高效的数据库系统存储历史数据，支持快速查询和分析。 2. 24小时自动化监测：实时监控：系统全天候运行，实时获取最新的市场数据，包括股价、成交量等关键信息。预警系统：配置智能预警机制，当市场出现异常波动时，系统能即时发出警报。自动更新：定时更新数据库，确保数据的时效性和准确性。 3. 量化模型分析：实时胜率计算：基于最新数据和历史数据，量化模型实时计算每只股票的胜率。多维度分析：综合考虑技术指标、基本面分析和市场情绪等多方面因素，提高分析的准确性。

1710python网络爬虫

征信网点信息爬取

1、程序分为两个模块，一个模块是获取不同的城市对应的网页地址，第二个是获取每个程序具体的网点信息 2、难点：城市网页里面的html格式不是每个都相同，解决方法：根绝网页格式做判断分为几类，最终爬取到相应信息

1040python网络爬虫

爬虫

1.使用scrapy框架实现某些网站数据的爬取； 2.为了实现高效的数据爬取，集成了redis分布式爬取插件； 3.某些网站还借助了selenium模拟浏览器，简单的实现复杂的登录行为

1040python网络爬虫

统一检索

项目技术:Redis,MySQL,MyBatis-Plus,es,SpringCloud,nacos,Flyway 项目描述：将多个数据源数据采集整合到一起，实现了各个数据源的统一管理。避免用户在多个专项数据库之间来回切换、多次检索，在用户需要快速、全面涉猎和研究多类知识资源时，提供一体化的检索体验。责任描述： 1.统计每分钟的登录在线人数入库，并提供查询接口。登录之后将key和读者id拼接存到redis，在拦截验证token类操作续期添加续期操作。通过EnableScheduling实现定时任务，Scheduled设置每分钟执行一次，StringRedisTemplate keys方法进行模糊查询存储key数量。 2.数据采集 java爬虫采集对方数据分为接口采集，页面采集，数据库采集。 3.蚌埠装甲兵学院蚌埠校区的数据采集。金盘的用户信息接口授权登录，通过读取nacos的配置区分interlib的和金盘的预约预借、续借等接口的。 4.个人中心模块的私人收藏、书单、书评、书评切面验证码功能等，封装词典接口返回信息存到header。 5.广东技术师范大学Springe

1520JavaNoSQL数据库

当前共221个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

物联网小程序网页组件 Object-c 物联网影视 ios Unity 开源3D打印机 VBScript

网络爬虫

重点城市程序员兼职推荐

重点岗位程序员兼职推荐