图形/图像处理

1,把视频里面的柱子识别出来,用的yolo5,全自主开发,视频追踪和识别 2,自己标注数据,识别准确率是90%。 3,其他的算法方向也可以
750python图形/图像处理
1、主要模块有: 垃圾检测模块,在无人机巡检的视频中检测出相应的垃圾信息,并反馈给用户 2、我主要负责的工作: 整个程序全部由我负责完成 技术栈: 后端:Python 目标识别:yolov5 前端: Python的 tkinter模块 3 遇到的困难: 主要是垃圾的形状、颜色、大小、都不固定,这给识别目标带来了一定的困难。 解决:通过增加喂给AI模型更多数据、更细致的人工打标签,使得识别率达到了90%以上
1210pythonPython开发工具
基于easyx贪吃蛇源文件源码
1.面向在校大学生: 本系统的功能如下: (1)基本移动功能:蛇能够根据玩家输入的方向键指令移动; (2)自动增长功能:当蛇吃到食物时,其长度相应增加; (3)食物生成机制:游戏中应定期在随机位置生成新的食物; (4)碰撞检测功能:游戏需实时检测蛇头是否与自身或边界发生碰撞; (5)分数统计功能:记录并显示玩家的得分情况; (6)用户注册登录以及最高分数据保存功能 2.特点: 系统可以分为两个部分,前部分由用户使用,主要包括注册登录;1.登录注册子模块主要实现用户登录和注册功能。用户注册后能登录游戏,还有退出系统。浏览查询模块 可以通过find user查询所有已存在的user 后部分主要包括背景图,食物个性化,蛇移动,鼠标交互,最高分数据存储5个模块。 3.成品:简单贪吃蛇小游戏
1110C/C++单机游戏
利用midjourney画的龙年手机壁纸。 将传统元素与现代、俏皮的手法相结合,旨在捕捉观众的想象力并唤起一种奇妙和愉悦的感觉。
1380图形/图像处理
demosaic算法源文件源码
1. 插值计算G通道:估计raw图红色像素位置的色差G-R,蓝色像素位置的色差G-B,从而完成绿色像素插值。在估计色差时,使用东西方向的水平色差估计值和南北方向的垂直色差估计值,加权平均计算色差。权重与色差梯度成反比。 2. 插值计算R位置上B通道和B位置上的R通道:用上一步计算的色差估计raw图红色像素的色差G-B,蓝色像素的色差G-R。从而完成红色和蓝色像素位置的三通道插值。 3. 插值计算G位置上的R和B通道:使用双线性插值得到raw图G像素上的色差G-R和G-B,至此完成所有位置的RGB插值
660图形/图像处理
针对采集到的工业场景Lidar点云,使用ResPointNet++从中语义分割出管道点云,结合DBSCAN聚类+Efficient RANSAC进行圆柱体形状检测与建模,针对真实管道点云残缺及有噪声所导致的建模错误、建模断裂以及建模缺失问题,设计增量建模框架,建模精度相比于现有专利提高25%。
80C/C++图形/图像处理
识别数字 根据轨迹寻线送药 根据数字对应的房间 叫药瓶送至病房 激光循迹 另一个激光跟踪 双车巡线 后车跟随
1700图形/图像处理
1.面向行业和所解决问题 行业:面向安防场景,移动端检测场景,自动驾驶场景,门禁轧机,工厂生成线等。 解决问题:目标物体检测和跟踪,目标物体识别,人脸识别,缺陷检测等 2.功能模块和作用 图像处理:图像去噪,去畸变,梯形矫正 检测,分割:使用yolov8模型进行目标物体的检测和分割 识别:使用深度学习模型提取特征并与预存库进行对比识别 3.所选技术和原因 数字图像处理技术:处理各类相机在各类场景下拍摄到的画面,消除由于畸变,噪声等造成的干扰 深度学习技术:使用深度学习模型对特定目标进行训练,保证在个各个复杂常见中能有稳定地检测到,分割出目标物 在移动终端部署:使用各类基于硬件边缘计算厂商的推理框架进行部署(nvidia的TernserRt,rockchip的rknn,海思的nnie等)
3261C/C++计算机视觉库/人脸识别
通过伺服舵机和单线激光雷达的硬件搭配,可以生产完整的空间3D数据生成 相比于当前的多线激光雷达,该方案成本低,生成效果更好,检测角度范围更大
1210C/C++C/C++开发工具
为客户提供数字化客服系统。使用厂商提供的 API 及 SDK 构建交互式和可视化的用户界面。负责数字人厂商的后台管理系统,包括换肤、行为模式、摄像机位、事件业务
1591javascriptTTS/语音合成和处理
1.木材颜色筛选程序可以按模版将不同种类的木材进行分类识别。 2.本项目主要分为Qt界面模块、摄像头采集模块、算法识别模块。分别实现了界面交互、摄像头采集控制、算法识别木材种类。 3.项目使用C++作为主要开发语音,使用Qt进行界面设计加快开发速度,使用OpenCV进行算法开发确保程序的运行速度。
540C/C++Qt
语言翻译一共有三个模块: 1、文字翻译成目标语言 2、识别图片中的文字翻译成目标语言 3、实时扫描翻译目标语言 此项目由我一个人独立开发完成 技术难题: 实时扫描中扫描框大小对应扫描的范围问题有一点难度
910android图形/图像处理
大数据可视化平台系统可分为:数据采集模块,数据分析模块,数据展示模块,数据存储模块,权限管理模块、日志管理模块、前端配置工具等等模块; 该系统: 1、可以根据不同配置展示不同的人机交互界面; 2、根据不同的接入采集装置可以展示不同的信息模块; 3、各采集数据实时刷新,动态监测,最要数据会及时备份云端及后台; 4、支持部分权限人员线上修改相关参数; 5、根据类型不同存在不同日志中; 6、智能分析数据趋势,并提前告警
890C/C++终端/远程登录
视频转换gif格式源文件源码
内容创作者:包括博主、短视频制作者、社交媒体用户等,他们经常需要将视频片段转换为GIF以在平台上分享或嵌入文章。 开发者与程序员:需要集成视频转GIF功能的网站或应用开发者,可以利用本项目提供的API或源码进行快速集成。 教育工作者:在制作教学材料或演示文稿时,可能需要将视频中的关键帧转换为GIF来辅助说明。 市场营销人员:用于制作广告素材、产品演示等,GIF格式因其循环播放的特点,非常适合快速传达信息。 便捷性:用户无需下载多个软件或学习复杂的命令行操作,即可快速将视频转换为GIF。 效率:通过优化FFmpeg参数,大幅缩短了转换时间,同时保证了GIF的质量和大小。 定制化:提供丰富的参数设置,如分辨率、帧率、颜色深度等,满足不同场景下的转换需求。 跨平台:基于Node.js的后端服务确保了服务可以部署在多种操作系统上,前端Vue框架使得前端界面能够在各种设备上流畅运行。 高度集成与易用性:集成了FFmpeg的强大功能,同时通过Vue构建了直观易用的用户界面,降低了技术门槛。 高效处理:通过智能分析视频内容,自动选择最优的转换参数,确保转换效率与质量的平衡。 云端部署支持:支持云服务
50vueWeb框架
项目包含图像处理模块、图像加载模块、参数控制模块、训练验证模块、模型导出模块…… 使用迁移学习、Pytorch、sklearn、混淆矩阵
800计算机视觉库/人脸识别
此项目是一款由 Avue 框架开发的后台管理系统,主要服务于公司自身平台、客户公司以及经销商公司。该系统的主要 目标是简化公司对客户公司和经销商公司的管理工作,以及对机器的远程配置修改和遥控。通过使用本系统,可以大幅 度减少售后人员的出场频次,节省售后成本,并显著提高售后运维工作的效率。 未选择文件
1060javascript菜单 (Menu)
项目由图像采集、模型选择、模型训练、模型推理、结果显示5个部分组成。使用光学相机采集隧道螺栓图像,并对采集的图像进行旋转校正、平移放缩、对比度调整等规范为640*640大小的图像,构成数据集原始图像。采集的数据集以VOC的格式构建数据集,按照一定比例划分训练集、验证集。模型可选择不同主干网络构成的UNet模型,并加载相应预训练权重。将数据集输入到模型中进行训练,训练结束后将保留最优的权重文件。将待检测图片放入指定文件夹下,模型进行推理时将加载最优模型进行推理,模型的预测结果可以保存为背景为黑色,目标区域为白色的二值图像,也可以与原图进行融合,将预测结果在原图上显示。
630图形/图像处理
我们的驾驶员状态检测系统集成了多个YOLO-v5模型,部署在车载设备上,旨在实时监测和评估驾驶员的状态。系统利用摄像头捕捉驾驶员的图像,通过OpenCV进行处理后输入到YOLO-v5模型,从而检测出驾驶员的年龄、性别、驾驶状态(如是否集中)、是否疲劳等关键信息。这一系统能够有效提高行车安全,减少事故风险。 主要功能: 1. 驾驶员特征检测: 年龄识别:利用YOLO-v5模型分析驾驶员的面部特征,准确预测其年龄范围。 性别识别:基于面部特征和模型分析,实时识别驾驶员的性别。 驾驶状态监测: 2. 注意力检测:通过检测驾驶员的眼睛和头部姿态,判断其是否集中注意力。 疲劳检测:通过分析眼睛闭合状态、眨眼频率等指标,实时监测驾驶员是否疲劳。 图像处理与输入: OpenCV处理:使用OpenCV对摄像头捕捉的图像进行预处理,包括图像增强、裁剪和缩放等操作,以便更好地输入模型进行分析。 实时输入:系统能够实时处理和分析图像,确保监测信息的时效性和准确性。 项目优势: 多模型集成:系统结合多个YOLO-v5模型,提供全面的驾驶员状态检测,提升了识别的准确性和多样性。 高效图像处理:通过Open
1110C/C++图形/图像处理
项目描述:工务智能巡检机器人系统由部署在远端机房的数据综合分析系统,运行在轨道上 的巡检机器人组成,巡检机器人采用分体式平台化设计,分为自走行的载人与检测平台,检测平 台有线路检测模块、隧道检测模块等。检测道床异物,扣件、弹条和螺栓等的丢失、松动、错位、 断裂等
820C/C++图形/图像处理
功能模块: 主车: 负责获取道路信息(红绿灯、斑马线、行人等),控制自身行驶路线和速度,并通过蓝牙与从车通信。 从车: 负责接收主车信息,并通过激光雷达感知主车位置,控制自身行驶路线和速度,实现跟随主车的功能。 视觉模块 (K210): 负责识别道路信息,包括红绿灯和斑马线,并将识别结果发送给主车。 通信模块 (HC-05蓝牙模块): 负责主车和从车之间的数据传输。 使用者功能: 主车: 可以在指定路线上自主行驶,并识别红绿灯和斑马线,进行停车或减速操作。 从车: 可以跟随主车行驶,保持一定距离,并安全地避开障碍物。 我的任务: 负责整个小车跟随行驶系统的设计和实现,包括硬件选型、电路设计、软件编程、算法实现等。 使用了STM32单片机作为控制核心,结合编码电机、红外寻迹传感器、超声波传感器、激光雷达、K210视觉模块等硬件设备,实现了小车的自主行驶和跟随功能。 采用PID算法实现了小车的速度控制和转向控制,并通过激光雷达数据实现了从车对主车的跟随控制。 技术栈: 硬件: STM32单片机、编码电机、红外寻迹传感器、超声波传感器、激光雷达、K210视觉模块、HC-05蓝牙模块等
1280C/C++开发工具
当前共290个项目
×
寻找源码
源码描述
联系方式
提交