人工智能

智能制造管控智能体是一款面向制造企业计划排产员、生产主管等角色,结合了大语言模型(LLM)、模型上下文协议(MCP)以及工厂仿真与数字孪生(METAM)等先进技术和工具的智能制造管控助手。-基于LLM具备的泛化推理与自适应认知能力,打破传统管控集成局限性,实现对复杂计划调度、异常根因追溯等任务支撑。
4151HTML5人工智能
是基于JetsonNano的系统开发,收集了大量的数据集,使用YOLOv11的卷积神经网络进行目标检测的学习,能够在复杂场景下红绿灯,交通标志,行人和车辆等。
1590嵌入式人工智能
精准教育产品系统
功能包括,题库管理,知识点管理,智能化组卷,(自动化扫描,识别,客观题自动判卷,主观题自动识别分数,线上/线下判卷),学情分析,靶项卷推荐,学校端,可以批量添加老师,学生,组卷可以批量添加试题,可以自助上传试题,获取平台试题,获取菁优网,学科网试题
1730PHP在线教育
负责数据库设计、后端API开发及Android客户端开发(使用Java),并引入Redis优化系统性能。​数据库设计与优化​基于MySQL设计高可用的数据库结构,包括用户表、商品表、订单表等,遵循三范式减少冗余。通过索引优化、SQL查询优化,提升查询性能。​后端API开发(SpringBoot+My
1340C++人工智能
修改 PaddleOCR-V5 部署包的 JNI 层,将其移植到安卓系统,并做了 Autojs Pro 的适配,解决了一些子线程上下文与栈内存问题。 本项目成功将PaddleOCR-V5部署包的JNI层进行改造,实现了在Android系统上的完整移植,并针对AutoJS Pro环境进行了专门适配。重点解决了autojs子线程环境下的上下文管理问题和栈内存溢出等关键技术难题,使OCR功能能够在移动端高效稳定运行。 注:在 autojs 环境内可以使用 opencl 驱动 gpu,在原生环境下的解决方案欠研究,但使用四核cpu并行速度差不了太多
3380C/C++Android
千唔产品系统
千唔是一款技术驱动的AI互动叙事平台,其核心依托于自研微调的大型语言模型(LLM)来生成富有灵魂的角色对话与剧情,并整合了多模态技术(如情感化语音合成TTS、语音识别STT和文生图)来打造沉浸式的视听体验。在技术架构上,后端采用Supabase(基于PostgreSQL)提供了一站式的实时数据库与用户认证服务,确保了数据处理的效率与可靠性;前端则创新性地使用Kotlin Multiplatform(KMP)跨平台方案共享核心业务逻辑,并结合Jetpack Compose构建了Android端流畅现代的UI,实现了高效开发与双平台一致的高质量用户体验。
1130postgres角色扮演
互联网信息推荐算法安全评估平台(http://116.62.162.16/home)是一个面向算法治理与信息安全分析的专业工具。该平台支持从快手、微博、抖音、小红书等多类主流平台进行数据抓取与分析,实现对推荐算法行为的全面监测和量化评估。 平台核心功能包括宏观数据看板、账号群体画像分析、安全指标追踪等,能够精准识别如“诱导控制”和“干扰识别”等算法风险行为,并以可视化方式呈现其变化趋势。它已管理超600万账号、37类群体画像,支撑起对信息传播机制与算法影响的深入洞察。 该平台适用于监管机构、研究单位及平台企业,为其提供算法安全评估、舆论风险预警和治理策略制定方面的数据支持,最终推动推荐算法透明、可信、向善发展。
2230PythonUI组件库
rope 二开开源项目
Rope 二次开发项目:功能增强与性能优化方案 一、 项目概述 本项目旨在对开源项目 Rope-Ruby / Rope-Opal(或其他基于 Rope 核心的换脸工具)进行二次开发。核心目标是在原有实时视频换脸功能的基础上,引入突破性新功能、显著提升处理效率与输出质量,并改善用户交互体验,使其更适用于专业级和高效率的生产环境。 二、 原有基础功能回顾 原 Rope 项目通常具备以下核心功能: 实时视频换脸:基于深度学习模型,对视频流或视频文件进行人脸替换。 图形用户界面(GUI):提供参数调节面板,如人脸识别精度、融合程度、分辨率等。 模型管理:支持加载多种预训练的人脸交换模型。 基础输入/输出:支持摄像头捕捉、视频文件输入和处理结果输出。 三、 二次开发核心新功能说明 多脸同时识别与替换 功能描述:单次处理可自动检测并替换视频画面中出现的多张人脸,而非仅限于主目标人脸。 技术要点:改进人脸检测和跟踪算法,为每个检测到的人脸分配独立的处理线程和模型实例,并在UI上提供分别控制选项。 价值:极大扩展了应用场景,如合拍视频、会议录像、影视剧群像场景处理。 高级后处理与融合引擎 功能描述:新增一个综合后处理模块,专门优化换脸后的最终效果。 子功能: 颜色自适应:自动分析源脸和目标脸部的肤色、光照条件,并进行精准匹配,消除色差。 光影重打光:根据目标人脸的光照方向和环境,对源人脸进行虚拟“重打光”,使融合更加自然。 锐化与降噪:智能锐化输出画面,同时抑制处理过程中可能产生的噪点和伪影。 音频克隆与口型同步 功能描述:不仅换脸,还能将声音替换为源人物声音,并确保口型与新声音完美同步。 技术要点:集成如 OpenAI's Whisper(语音转文本)、Coqui TTS 或 Microsoft VALL-E(文本转语音克隆)以及 Wav2Lip(口型同步)等模型管道。 价值:实现真正的“深度伪造”,产出内容的可信度和沉浸感达到新高度。 批量处理与任务队列 功能描述:支持添加多个视频任务到一个处理队列中,无需人工干预即可顺序或并行处理。 技术要点:开发一个稳定的任务调度系统,支持断点续处理、优先级设置和资源分配管理。 价值:极大提升工作效率,满足影视后期等需要处理大量素材的场景。 四、 优化流程与性能提升 推理引擎优化 目标:提升帧率(FPS),降低延迟和资源占用。 措施: 模型量化:将模型从 FP32 转换为 FP16 或 INT8,在几乎不损失质量的前提下大幅提升速度并减少显存占用。 算子融合与图优化:使用 TensorRT、OpenVINO 或 ONNX Runtime 对模型图进行深度优化,合并冗余计算层。 硬件特定加速:全面优化对 NVIDIA GPU(CUDA/cuDNN)、Apple Silicon(MPS)和 Intel CPU(OpenVINO)的支持。 内存与管道优化 目标:避免内存泄漏,支持处理长视频和更高分辨率视频。 措施: 流水线并行:将视频读取、人脸检测、换脸推理、后处理、视频编码等步骤解耦成并行流水线,充分利用硬件资源。 显存管理:实现显存池化和动态加载机制,及时释放不再使用的中间张量。 分块处理:对于超高分辨率视频(如4K),采用分块处理再拼接的策略,避免显存溢出(OOM)。 算法与模型优化 目标:提升换脸质量、减少闪烁和抖动。 措施: 集成更优模型:替换或融合更高性能的 face detector(如 YOLOv8-face)、face parser 和 swapper 模型(如 SimSwap、InsightFace)。 时序一致性处理:引入时间序列滤波器(如光流引导、卡尔曼滤波),利用前后帧信息稳定人脸特征,减少视频闪烁。 超分辨率增强:在输出前集成人脸超分模型(如 GFPGAN、CodeFormer),对替换后的人脸进行修复和增强,使其清晰度与原始视频背景匹配。 五、 实施流程建议 阶段一:环境搭建与代码剖析 Fork 原项目仓库,建立开发分支。 深入阅读源码,理解其架构、数据流和核心模块(如 processing.py, core.py, models.py)。 搭建完整的开发、调试和测试环境。 阶段二:基础优化与加固 实施推理引擎优化(如转换为 TensorRT)。 修复已知的 Bug 和内存泄漏问题。 此阶段目标是得到一个更稳定、更快速的“基础增强版”。 阶段三:模块化开发与集成 以模块化方式开发新功能。例如: multi_face_processor.py (多脸处理模块) enhancement_module.py (后处理模块) audio_pipeline.py (音频克隆管道) 逐个功能进行集成和测试,确保与原有代码兼容。 阶段四:UI/UX 重构与测试 为所有新功能设计并开发直观的 GUI 控件。 进行大规模的功能测试、压力测试和用户体验测试。 收集反馈,进行迭代优化。 阶段五:发布与部署 编写详细的安装说明和使用文档。 打包发布(可提供 Docker 镜像简化部署)。 考虑持续集成/持续部署(CI/CD)流程,便于未来更新。 六、 预期成果 完成二次开发后,项目将蜕变为一个功能强大、性能卓越、体验专业的下一代深度合成工具,在视频创作、影视预演、虚拟人直播等领域具备极高的实用价值和竞争力。
5030PythonAPP
本方案基于OpenCV计算机视觉库,开发了一套实时视频人脸识别与特效处理系统。系统通过Haar级联分类器精准检测人脸特征点,实时定位眼睛和嘴巴区域,并运用先进的图像处理算法对特征区域进行特殊处理。针对眼睛部位采用强化的鱼眼畸变算法,通过非线性坐标映射实现眼球突出膨胀的视觉效果,使其呈现夸张的圆形凸出状态;对嘴巴区域则实施水平方向的适度拉伸变形。所有处理后的特征区域均经过羽化边缘处理,确保与黑色狗狗背景无缝融合,最终生成具有戏剧化效果的趣味换脸视频特效,可广泛应用于短视频制作、娱乐应用和实时视频互动场景。
1140openCV图像(Image)
奈斯AIGO产品系统
奈斯AI全新GO版本体系 采用Vue3+Gin全栈技术架构开发的新一代AI应用平台,相比传统版本实现了质的飞跃。前端基于Vue3 Composition API重构,配合Vite构建工具显著提升开发效率和用户体验。后端采用Go+Gin轻量级框架,充分发挥Go语言高并发特性,通过协程池和连接池优化,实现真正的毫秒级响应速度。 系统集成AI对话、AI绘画、文档处理等多维度AI能力,支持GPT、DALL-E、midjourney等主流模型。采用智能负载均衡和请求分发机制,单节点可处理万级并发请求。通过Redis缓存层和数据库连接池优化,响应时间稳定控制在100ms以内。新架构不仅提升了系统性能,还为后续功能扩展奠定了坚实基础,为用户提供更加流畅高效的AI体验。
1260GoAI
扩展后台:Java(提供MCP列表查询、用户安装/卸载接口、最大数量限制校验)智能体后台:Python+gRPC(接收扩展后台请求,调用用户已选MCP服务)数据库与缓存:PostgreSQL(存储mcp_server_list、audit_log、user_mcp_install表)、Redis(缓
1290Python人工智能
自助洗车项目支持商家入驻,小程序下单,开始设备计时结算,触发物联网系统,控制电源板开关状态。全套项目开发设计,包含软硬件,电路板设计,芯片组建的实现。自助洗车项目支持商家入驻,小程序下单,开始设备计时结算,触发物联网系统,控制电源板开关状态。全套项目开发设计,包含软硬件,电路板设计,芯片组建的实现。
270PHP人工智能
1、主要是一个面对用户和企业使用的一个后台管理系统2、主要开发功能有:员工管理、任务管理、通话记录、收藏客户、黑名单库、号码公海、今日统计、统计对比等3、实现一个一对多个企业使用4、任务管理导入文件不成功问题与解决方案6、定制导入是由第三方启客(北京)科技有限公司提供的一项增值业务,可通过设置部分条
1700JavaScript工业互联网
我司做过许多案例,如获取京东某个分类的所有商品信息、在众多个汽车平台获取详细信息并汇总成数据表格并进行对比。 我司以机器人为主,机器人可同时执行多个流程,简易、轻便、效率高。
1460人工智能
跨媒体政务知识引擎实现集成政务算法模型 、算法工具集以及算法识别等多个算法能力。 主要职责:负责算法能力前端展现,包括logo识别 、车型识别、算法工具集调用等前端展示, 以及实现可视化首页可拖拽布局配置功能。 技术栈:react16+ antdesign
1640人工智能
集成多个大语言模型的AI工具,包括gpt 3.5、gpt 4.0 和Google Bard等。它可以自定义AI机器人,并内置了许多实用的AI工具,如ChatCopilot、CodeCopilot、小红书种草文案、文章润色、文章撰写、日/周报助手等等。您可以直接使用这些功能,无需编写prompt,从而免去了繁琐的操作步骤。此外,AI Copilot还提供了高度定制化的服务,以满足不同用户的需求。无论您是需要撰写文章、制作报告还是进行其他工作,AI Copilot都能够为您提供强大的支持和帮助。
3910人工智能
1、支持大模型微调辅导(主流常用大模型) 2、支持大模型方面简历辅导 3、支持大模型微调训练以及提供代码 4、提供大模型方面的资料
3140人工智能
1、支持本地上传文件(包含pdf,word,excel等格式) 2、支持知识问答,知识检索,文章改写 3、支持链接分享,支持不同模型定制
2480人工智能
1、大模型部署微调(chatglm,qwen,baichuan等系列模型) 2、构建本地知识库(fastgpt,oneapi,向量模型等) 3、支持本地,私有云,公有云,windows等系统
4140人工智能
DouZero 是中国最流行的纸牌游戏斗地主的强化学习框架。这是一种脱牌游戏,玩家的目标是在其他玩家之前清空自己手上的所有牌。 基于 DouZero 进行的深度Ai游戏训练 技术:Python ,Torch,Opencv 等 困难:解决了训练慢,图像识别等问题
1890游戏
当前共1732个项目more
×
寻找源码
源码描述
联系方式
提交