人工智能

修改 PaddleOCR-V5 部署包的 JNI 层,将其移植到安卓系统,并做了 Autojs Pro 的适配,解决了一些子线程上下文与栈内存问题。 本项目成功将PaddleOCR-V5部署包的JNI层进行改造,实现了在Android系统上的完整移植,并针对AutoJS Pro环境进行了专门适配。重点解决了autojs子线程环境下的上下文管理问题和栈内存溢出等关键技术难题,使OCR功能能够在移动端高效稳定运行。 注:在 autojs 环境内可以使用 opencl 驱动 gpu,在原生环境下的解决方案欠研究,但使用四核cpu并行速度差不了太多
750C/C++Android200.00元
千唔产品系统
千唔是一款技术驱动的AI互动叙事平台,其核心依托于自研微调的大型语言模型(LLM)来生成富有灵魂的角色对话与剧情,并整合了多模态技术(如情感化语音合成TTS、语音识别STT和文生图)来打造沉浸式的视听体验。在技术架构上,后端采用Supabase(基于PostgreSQL)提供了一站式的实时数据库与用户认证服务,确保了数据处理的效率与可靠性;前端则创新性地使用Kotlin Multiplatform(KMP)跨平台方案共享核心业务逻辑,并结合Jetpack Compose构建了Android端流畅现代的UI,实现了高效开发与双平台一致的高质量用户体验。
560postgres角色扮演
互联网信息推荐算法安全评估平台(http://116.62.162.16/home)是一个面向算法治理与信息安全分析的专业工具。该平台支持从快手、微博、抖音、小红书等多类主流平台进行数据抓取与分析,实现对推荐算法行为的全面监测和量化评估。 平台核心功能包括宏观数据看板、账号群体画像分析、安全指标追踪等,能够精准识别如“诱导控制”和“干扰识别”等算法风险行为,并以可视化方式呈现其变化趋势。它已管理超600万账号、37类群体画像,支撑起对信息传播机制与算法影响的深入洞察。 该平台适用于监管机构、研究单位及平台企业,为其提供算法安全评估、舆论风险预警和治理策略制定方面的数据支持,最终推动推荐算法透明、可信、向善发展。
730PythonUI组件库
rope 二开开源项目
Rope 二次开发项目:功能增强与性能优化方案 一、 项目概述 本项目旨在对开源项目 Rope-Ruby / Rope-Opal(或其他基于 Rope 核心的换脸工具)进行二次开发。核心目标是在原有实时视频换脸功能的基础上,引入突破性新功能、显著提升处理效率与输出质量,并改善用户交互体验,使其更适用于专业级和高效率的生产环境。 二、 原有基础功能回顾 原 Rope 项目通常具备以下核心功能: 实时视频换脸:基于深度学习模型,对视频流或视频文件进行人脸替换。 图形用户界面(GUI):提供参数调节面板,如人脸识别精度、融合程度、分辨率等。 模型管理:支持加载多种预训练的人脸交换模型。 基础输入/输出:支持摄像头捕捉、视频文件输入和处理结果输出。 三、 二次开发核心新功能说明 多脸同时识别与替换 功能描述:单次处理可自动检测并替换视频画面中出现的多张人脸,而非仅限于主目标人脸。 技术要点:改进人脸检测和跟踪算法,为每个检测到的人脸分配独立的处理线程和模型实例,并在UI上提供分别控制选项。 价值:极大扩展了应用场景,如合拍视频、会议录像、影视剧群像场景处理。 高级后处理与融合引擎 功能描述:新增一个综合后处理模块,专门优化换脸后的最终效果。 子功能: 颜色自适应:自动分析源脸和目标脸部的肤色、光照条件,并进行精准匹配,消除色差。 光影重打光:根据目标人脸的光照方向和环境,对源人脸进行虚拟“重打光”,使融合更加自然。 锐化与降噪:智能锐化输出画面,同时抑制处理过程中可能产生的噪点和伪影。 音频克隆与口型同步 功能描述:不仅换脸,还能将声音替换为源人物声音,并确保口型与新声音完美同步。 技术要点:集成如 OpenAI's Whisper(语音转文本)、Coqui TTS 或 Microsoft VALL-E(文本转语音克隆)以及 Wav2Lip(口型同步)等模型管道。 价值:实现真正的“深度伪造”,产出内容的可信度和沉浸感达到新高度。 批量处理与任务队列 功能描述:支持添加多个视频任务到一个处理队列中,无需人工干预即可顺序或并行处理。 技术要点:开发一个稳定的任务调度系统,支持断点续处理、优先级设置和资源分配管理。 价值:极大提升工作效率,满足影视后期等需要处理大量素材的场景。 四、 优化流程与性能提升 推理引擎优化 目标:提升帧率(FPS),降低延迟和资源占用。 措施: 模型量化:将模型从 FP32 转换为 FP16 或 INT8,在几乎不损失质量的前提下大幅提升速度并减少显存占用。 算子融合与图优化:使用 TensorRT、OpenVINO 或 ONNX Runtime 对模型图进行深度优化,合并冗余计算层。 硬件特定加速:全面优化对 NVIDIA GPU(CUDA/cuDNN)、Apple Silicon(MPS)和 Intel CPU(OpenVINO)的支持。 内存与管道优化 目标:避免内存泄漏,支持处理长视频和更高分辨率视频。 措施: 流水线并行:将视频读取、人脸检测、换脸推理、后处理、视频编码等步骤解耦成并行流水线,充分利用硬件资源。 显存管理:实现显存池化和动态加载机制,及时释放不再使用的中间张量。 分块处理:对于超高分辨率视频(如4K),采用分块处理再拼接的策略,避免显存溢出(OOM)。 算法与模型优化 目标:提升换脸质量、减少闪烁和抖动。 措施: 集成更优模型:替换或融合更高性能的 face detector(如 YOLOv8-face)、face parser 和 swapper 模型(如 SimSwap、InsightFace)。 时序一致性处理:引入时间序列滤波器(如光流引导、卡尔曼滤波),利用前后帧信息稳定人脸特征,减少视频闪烁。 超分辨率增强:在输出前集成人脸超分模型(如 GFPGAN、CodeFormer),对替换后的人脸进行修复和增强,使其清晰度与原始视频背景匹配。 五、 实施流程建议 阶段一:环境搭建与代码剖析 Fork 原项目仓库,建立开发分支。 深入阅读源码,理解其架构、数据流和核心模块(如 processing.py, core.py, models.py)。 搭建完整的开发、调试和测试环境。 阶段二:基础优化与加固 实施推理引擎优化(如转换为 TensorRT)。 修复已知的 Bug 和内存泄漏问题。 此阶段目标是得到一个更稳定、更快速的“基础增强版”。 阶段三:模块化开发与集成 以模块化方式开发新功能。例如: multi_face_processor.py (多脸处理模块) enhancement_module.py (后处理模块) audio_pipeline.py (音频克隆管道) 逐个功能进行集成和测试,确保与原有代码兼容。 阶段四:UI/UX 重构与测试 为所有新功能设计并开发直观的 GUI 控件。 进行大规模的功能测试、压力测试和用户体验测试。 收集反馈,进行迭代优化。 阶段五:发布与部署 编写详细的安装说明和使用文档。 打包发布(可提供 Docker 镜像简化部署)。 考虑持续集成/持续部署(CI/CD)流程,便于未来更新。 六、 预期成果 完成二次开发后,项目将蜕变为一个功能强大、性能卓越、体验专业的下一代深度合成工具,在视频创作、影视预演、虚拟人直播等领域具备极高的实用价值和竞争力。
2830PythonAPP
本方案基于OpenCV计算机视觉库,开发了一套实时视频人脸识别与特效处理系统。系统通过Haar级联分类器精准检测人脸特征点,实时定位眼睛和嘴巴区域,并运用先进的图像处理算法对特征区域进行特殊处理。针对眼睛部位采用强化的鱼眼畸变算法,通过非线性坐标映射实现眼球突出膨胀的视觉效果,使其呈现夸张的圆形凸出状态;对嘴巴区域则实施水平方向的适度拉伸变形。所有处理后的特征区域均经过羽化边缘处理,确保与黑色狗狗背景无缝融合,最终生成具有戏剧化效果的趣味换脸视频特效,可广泛应用于短视频制作、娱乐应用和实时视频互动场景。
770openCV图像(Image)
奈斯AIGO产品系统
奈斯AI全新GO版本体系 采用Vue3+Gin全栈技术架构开发的新一代AI应用平台,相比传统版本实现了质的飞跃。前端基于Vue3 Composition API重构,配合Vite构建工具显著提升开发效率和用户体验。后端采用Go+Gin轻量级框架,充分发挥Go语言高并发特性,通过协程池和连接池优化,实现真正的毫秒级响应速度。 系统集成AI对话、AI绘画、文档处理等多维度AI能力,支持GPT、DALL-E、midjourney等主流模型。采用智能负载均衡和请求分发机制,单节点可处理万级并发请求。通过Redis缓存层和数据库连接池优化,响应时间稳定控制在100ms以内。新架构不仅提升了系统性能,还为后续功能扩展奠定了坚实基础,为用户提供更加流畅高效的AI体验。
640GoAI
我司做过许多案例,如获取京东某个分类的所有商品信息、在众多个汽车平台获取详细信息并汇总成数据表格并进行对比。 我司以机器人为主,机器人可同时执行多个流程,简易、轻便、效率高。
1300人工智能
跨媒体政务知识引擎实现集成政务算法模型 、算法工具集以及算法识别等多个算法能力。 主要职责:负责算法能力前端展现,包括logo识别 、车型识别、算法工具集调用等前端展示, 以及实现可视化首页可拖拽布局配置功能。 技术栈:react16+ antdesign
1430人工智能
集成多个大语言模型的AI工具,包括gpt 3.5、gpt 4.0 和Google Bard等。它可以自定义AI机器人,并内置了许多实用的AI工具,如ChatCopilot、CodeCopilot、小红书种草文案、文章润色、文章撰写、日/周报助手等等。您可以直接使用这些功能,无需编写prompt,从而免去了繁琐的操作步骤。此外,AI Copilot还提供了高度定制化的服务,以满足不同用户的需求。无论您是需要撰写文章、制作报告还是进行其他工作,AI Copilot都能够为您提供强大的支持和帮助。
3690人工智能
1、支持大模型微调辅导(主流常用大模型) 2、支持大模型方面简历辅导 3、支持大模型微调训练以及提供代码 4、提供大模型方面的资料
2930人工智能
1、支持本地上传文件(包含pdf,word,excel等格式) 2、支持知识问答,知识检索,文章改写 3、支持链接分享,支持不同模型定制
2270人工智能
1、大模型部署微调(chatglm,qwen,baichuan等系列模型) 2、构建本地知识库(fastgpt,oneapi,向量模型等) 3、支持本地,私有云,公有云,windows等系统
3830人工智能
DouZero 是中国最流行的纸牌游戏斗地主的强化学习框架。这是一种脱牌游戏,玩家的目标是在其他玩家之前清空自己手上的所有牌。 基于 DouZero 进行的深度Ai游戏训练 技术:Python ,Torch,Opencv 等 困难:解决了训练慢,图像识别等问题
1760游戏
(1)功能模块主要包括: 1.数据管理(数据源,数据集等,主要是为ai模型训练所需的数据进行管理,标注等 2.算法管理(交互式项目,jupyternbook,资源申请,运行计划与管理等) 3.角色功能(团队/个人/机构,项目负责人/管理员/开发人员等) 4.ai项目管理(项目申请/发布/进度等) (2)我主要负责数据管理与交互式项目算法流程的设计与各算法节点的功能设计。
1480人工智能
构建高考专项的ChatGPT智能模型,实现高考相关的问题解答与建议,小组项目,我负责模型训练的一部分,主要负责调试模型的学习能力等的超参数
1550人工智能
内容: TCL 商城是 TCL 集团T销客的附属版本,项目赶进度,6月份从T信团队抽调到 TCL 之家团队 协助开发的一款集团商城类产品,项目采用 flutter 框架开发 ●项目架构使用 MVVM 架构 ● 在架构的基础上负责 TCL 商城钱包模块功能的开发 ● 协助开发完成第一版本提测之后返回T信团队
2020文档原型图
项目名称:全方位幼儿美育教学平台 项目描述: 全方位幼儿美育教学平台是一款集教学、备课、家长查看、后台管理以及个人兴趣学习等多功能于一体的综合性教育平台。该平台致力于提供全方位的幼儿美育教学服务,旨在通过科技手段,提升幼儿美育的教学质量和效率,增强幼儿的艺术素养。 技术架构: 前端技术:该项目采用了Vue3作为主要的前端框架,利用其优秀的性能和灵活的设计,实现了高效的用户界面开发。同时,我们还使用了Piana、TS、Three.js和Echarts等技术,让数据的展示更直观、更美观。其中,Three.js用于实现3D数据可视化,Echarts则用于构建各种数据图表。 后端技术:项目后端采用Java作为主要开发语言,利用其稳定、高效的特性,实现了大数据的处理和分析。数据库方面,我们选择了MySQL,一个广泛使用的关系型数据库,它能够有效地存储和管理大量的数据。 功能特点: Web教学系统:为教师提供丰富的教学资源和工具,支持在线教学和课堂管理,提高教学效率。 微信小程序教师备课系统:为教师提供便捷的备课工具,支持在线备课和课程管理,提升备课效率。 微信小程序家长教学查看系统:让家长能够实时查看孩子的学习情况,增强家校沟通,提高教学质量。 全平台后台管理系统:提供全面的数据管理和分析工具,支持用户管理、数据分析、系统设置等功能,实现平台的高效运营。 个人兴趣学习APP:为学生提供个性化的学习资源和工具,支持在线学习和兴趣发展,提高学习兴趣和效果。 应用场景: 全方位幼儿美育教学平台将广泛应用于幼儿园、美育机构、家庭等,为他们提供全方位的美育教学服务,帮助幼儿提高艺术素养,增强创新能力,培养良好的审美情趣。 使用vue-cli搭建整个项目的结构,利用html5和css3进行页面设计,保证页面的视觉效果和用户体验。 利用axios进行接口封装,配置请求和响应拦截器,实现token的统一添加和错误的统一处理。 使用Vue3+TypeScript和uni-app进行项目的开发,提高项目的开发效率和质量。 使用Vant、unplugin和Element等前端框架和工具进行页面布局和组件设计,提高页面的渲染效果和用户体验。 引入高德地图API、echarts、canvas等工具进行数据可视化和动态效果的实现,提供用户友好的交互体验。 使用vuex、pinia等进行全局状态管理,实现数据的共享和持久化。 使用Vue-router进行页面跳转,利用其全局前置守卫进行权限控制。 使用uni-app的request API、uni官方支持的获取用户信息的方法、微信提供的API等进行数据请求和处理。 使用Vant的van-list和van-pull-refresh实现列表的上拉加载和下拉刷新,使用swiper实现轮播图功能。 使用watch、watchEffect等进行数据的监听和处理,实现数据的动态更新和响应式变化。 使用Vue-Quil-Editor、native-type等插件和属性进行富文本编辑和表单提交。 对开发的前端功能进行功能测试,找出并修复可能存在的问题,确保功能的正确性和可靠性。 收集和处理用户反馈,对产品进行持续改进,提高用户满意度。
2520文创
app内部仿高德地图实现(因为公司条款限制不能提供原图,但是具体实现是对比高德地图的) 主要功能:1.地图定位 2.地图自定义UI 3.自定义公交导航 4.自定义部分页面实现效果和对应逻辑
1420人工智能
1、制作数据分析可视化原型:使用axure做可视化数据分析原型设计(参考作品1,作品2) 2、制作数据分析运营报告:熟练使用sql、echarts图表工具(参考作品3),python学习中 注:作品1、作品2是同事制作,本人参与,本人亦可以独立设计
1740数据报告
1.项目目标: 根据已有的历史功率+天气数据和未来几天的天气预报数据,预测未来超短期/短期/中长期的功率曲 线,尽可能高的提高预测精度和稳定性。 2.我的职责 作为项目负责人和人工智能算法工程师,我负责整个预测功能模块的开发和部署。 其工作内容包括: a.根据业务需求,设计算法模块整体架构和策略,用数学描述业务优化目标; b.数据接口的分析和数据的获取; c.数据的分析/清洗/可视化/融合/特征工程(pandas), eg. 相关性分析,分布分析,空缺值/越限值/离群值的处理,负荷和天气数据的拼接,时间戳补全,时间离散化,特征筛选,新特征构造等等; d.数据集的划分和模型评估方法(十折交叉验证+mse+mape+std); e.多模型的训练/测试/调参/比对/部署(eg. 机器学习算法 xgboost+KNN+LR ,深度学习算法 LSTM+Transformer+CNN ,自动化调参使用 optuna ,通过 matplotlib 误差分布分析,通过 conda或 docker在 linux 服务器上进行部署); f.整体策略的回测、评估和优化 g.代码版本管控(本地服务器+git); 3.目标及达成情况: 母线负荷预测精度>97.5%,光伏出力预测精度>90%,风电出力预测精度>70%,当然具体取决于数据的质量和数量。 在浙江/江苏等多个城市的电力调度中心部署应用,运行情况良好。 南方电网新能源智慧平台全行业(国能、金风、远景等新能源厂家 pk )排行榜第1 4.技术适用范围 可以提供主流机器学习、深度学习算法框架完成任何行业有一定数量数据的分类和回归任务
2210python
当前共1487个项目
×
寻找源码
源码描述
联系方式
提交