机器深度学习

机器学习,深度学习是人工智能的核心分支,致力于让计算机系统通过数据驱动的方式自动学习和改进性能,而无需显式编程。其核心是从数据中识别模式或规律,构建数学模型,使计算机能完成预测、分类、聚类等任务。主要类型包括监督学习、无监督学习和强化学习。机器学习广泛应用于自然语言处理、计算机视觉、推荐系统等领域,正重塑各行各业,是当前AI爆发的核心技术之一。
自动化涂胶机器人,可以自动识别不同型号,不同码数的鞋底,不受环境光的影响,对图像进行处理并利用强大的算法功能,准确提取出鞋底的信息。 采用3D视觉可以有效识别出鞋底需要涂胶部分的三维结构模型,重新设置喷涂运动轨迹,机械臂就可以操控喷涂工具实现自动喷涂。 步骤: 1. 3D视觉相机安装在传送带上方,拍摄传送带上的鞋底的三维点云图像,获取鞋底曲面原始三维点云数据。然后将这些数据进行各种处理之后,就可以获得鞋底涂胶运动曲线。 2. 涂胶机器臂放置传送带一侧,末端连接通讯好的机械手,并将胶枪安装在机械手上。智能机器人系统将结合内置算法计算可以获得涂胶轨迹曲线和涂胶位姿,引导机器臂进行精准涂胶。
5590机器学习图形和图像工具
该项目主要完成抽烟行为检测,在某些特定场合,例如易燃易爆的场所是严禁抽烟的。因此本项目主要是负责完成场景中人员抽烟行为的检测。检测算法采用的是Yolo V5算法,前期先通过收集整理并标注抽烟行为数据集,然后利用收集的数据集完成抽烟模型的训练。待模型达到检测精度要求后,利用该模型即可完成抽烟行为的实时检测,单帧检测时间大约150ms,检测精度>95%。
5060深度学习图像(Image)
本项目分成两个部分:模型训练和实时检测。 1)模型训练:主要是通过改进的Yolo V8算法,结合钢筋检测数据库,完成对应的钢筋检测模型的训练。目前收集整理的数据集有3000多张,测试检测准确率达到99%以上; 2) 模型推理:利用1训练得到的检测模型完成实时的钢筋检测,并给出对应的计数。单张图片检测时间达到毫秒级别,实时性高,可集成到app中。 本项目的额核心技术是目标检测技术,主要用到的算法是Yolo V8,该技术可以迁移到类似的项目上,例如竹签计数等。
5060深度学习图形/图像处理
本项目是一个基于图像检索技术实现的项链分拣助手工具,该软件工具帮助工作人员快速找到字母项链对应的订单信息。项目的主要工作原理是: 1)通过摄像头快速采集字母项链图片; 2)完成图像预处理,并快速提取字母项链的图像特征; 3)根据图像特征,从订单图像库中快速检索出对应的订单信息; 4)完成对应的订单信息显示和打印 这里的订单图像库采用倒排索引的方式来建库,支持百万量级的数据库秒级别的快速检索。图像特征采用一种自己设计的基于局部特征融合的全局特征,对图像的旋转和缩放具有一定的鲁棒性。 本项目的核心技术是:1)图像特征设计; 2)图像库索引设计; 3)海量图像库的快速检索;
5130机器学习图形/图像处理
作品模块:1.运行环境的搭建 2.手部模型的构建 3.手势识别的自定义动作模型 4.鼠标控制接口 可以实现:通过普通摄像头的手势识别来完成对鼠标的控制 其中的:2,3,4部分几乎全部由本人完成。
1920python计算机视觉库/人脸识别
作品模块:1.运行环境的搭建 2.手部模型的构建 3.手势识别的自定义动作模型 4.鼠标控制接口 可以实现:通过普通摄像头的手势识别来完成对鼠标的控制 其中的:2,3,4部分几乎全部由本人完成。
1630python计算机视觉库/人脸识别
项目背景:针对某医院智能问诊系统,开发智能问诊模块,对用户输入进行分析和判断,初步判断用户患病情况,并给出就医指南。 主要职责:负责对话引擎整体的算法设计,并进行相关大模型的微调和服务部署。其中涉及的子任务主要包括: (1). 针对用户输入信息的语义理解,抽取核心信息字段信息,主要包括病症名称词汇和病情描述信息。(2). 利用RAG技术实现对问诊流程的智能问答,包括看病流程,报销流程等等。(3). 针对用户的疾病信息进行问诊引导,包括去哪个科室,处理的流程和注意事项等等。(4).信息智能查询,通过语音查询检测结果信息等功能。 主要成果:完成整体系统的开发和大模型的微调,系统对话整体的准确率达到90%以上。
6850深度学习大模型
1. 利用keras深度学习框架实现CVPR论文中ghostnet模型的搭建。 2. 实现该模型的训练和测试,方便大家复现原论文结果。
3450深度学习机器学习/深度学习
医疗综合信息分析平台 项目背景: 以用户的病例信息作为输入,抽取疾病信息,所属领域类别信息,病状的描述信息,处方信息以及对应的禁忌事项信息等。将该信息抽取完成后存储至数据库。最后由专业人员对相关信息进行质检,完成医疗信息的知识落库。 项目分工: 本人主要负责对病例信息的领域分类,疾病名称识别,病状信息描述,处方信息抽取和禁忌事项的抽取业务。即通过大模型对病例信息的数据实现多个维度的信息抽取工作。 项目成果: 完成外科和耳鼻喉科领域下,数百种疾病信息的知识抽取,准确率达到90%以上。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
3430深度学习大模型
项目分为1,通过sparksql 读取多个csv文件。2,建立机器学习模型。3,实时从kafka接收数据,使用模型进行预测 整个项目是我自己开发
2150python机器学习
人类染色体核型智能分析系统,是一款基于人工智能技术,对人类染色体中期图像进行自动分割、识别、计数,并自动生成核型图的遗传实验室辅助工具。 功能包括:图像管理、一键识别、导出核型图、手动编辑(笔刷、多边形、缩放、旋转、移动等)、配置管理。 达到的性能:分割准确率>90%,核型准确率>75%,GPU识别速度12张/分钟,CPU识别速度4张/分钟,支持GPU、CPU、XPU、NPU、TRT环境,支持Win、Linux操作系统。 目前已被多家医院遗传实验室采用。
5521python机器学习/深度学习
现实中,有数百万人患有严重的身体残疾丧失了交流以及与环境互动的能力,然而其感觉和认知功能通常仍然完好无损。这为利用BCI技术以改善患者生活质量提供了可能。P300-Speller是基于EEG的BCI系统中最热门的应用之一。正被用来解析那些思维正常却行动不便的病人的真实意图和想法,P300-Speller允许用户使用图形用户界面(GUI)与环境进行通信,可以让患者在生活上更加独立,甚至在一定程度上恢复他们的社交生活。因此,研究P300脑机接口技术具有极高的实际应用价值。
2550python机器学习/深度学习
在运动想象范式下对正常被试的头皮脑电信号进行采集。 采用时频域变换方法,mixup数据增强策略,并结合深度学习框架对脑电信号做分类判别,以达到将脑电信号翻译成现实指令的目的。 为运动想象脑机接口的应用提供方法和思路上的参考。
1820python机器学习/深度学习
作品地址:http://www.latexai.com/ 分为渲染、识别、生成模块,均由本人完成 渲染模块功能为,帮助大家写latex表达式,并渲染出来,可导出png\svg\word格式的公式表示。 同时支持有限的AI公式识别转换为latex表达式,可选输出可视化的模型内部的attention部分
2970深度学习LaTeX排版系统
项目模块: 主要是针对text2SQL任务的全链路优化,增加了SQL数据可视化的推理过程,实现整体的数据可视化Agent. 项目分工: 负责对业务整体的建模,包括SQL生成任务的优化,图表关系的业务建模,和API参数的智能生成。 主要包括: SQL生成任务的拆解优化,针对图表分类和参数抽取的业务建模,COT优化,图表和API参数关系抽取,以及参数的对齐优化功能等等。 成果: 跑通了从文本到数据可视化的全流程,支持了5种复杂的数据可视化业务需求,达到业务交付标准。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
3980系统架构大模型
财务一体化智能票据识别系统是一个基于图像识别技术的项目,旨在实现对财务票据的自动识别和提取关键信息。通过该系统,可以有效减少手动处理票据的时间和工作量,提高财务处理的效率和准确性。 个人职责: 1. 图像预处理:使用OpenCV对图像进行预处理,包括裁剪、去噪、锐化等操作,以提高后续的采集准确性; 2. 文本识别:利用OCR技术和深度学习模型,对文本区域中的字符进行识别和转换为文本信息。 3.信息整合:从识别出的文本信息中提取关键的数据,进行整合和存储;针对无法正确识别或出现错误的票据,允许用户手动干预和修正,识别精度达到0.98。
1830深度学习文档智能识别
这是一个简单的图像识别处理,基于python的CIFAR10数据集进行多次训练,再通过输入图片来识别该图片的内容是属于CIFAR10训练集中的哪类图片。整个作品的代码均为我一人制作。使用了机器学习基础中的CNN卷积代码实现图像识别。实现了再在整体数据集上的正确率达65%
1990深度学习机器学习/深度学习
系统分为两个部分,分别是手术器材服务订单系统和医疗器械服务订单系统。手术器材部分包括了从手术医生下单到企业辅助技术员跟进,以及公司仓库配货并回收器材的整体业务流程。医疗器械部分则从生产车间开始,将医院需求和企业生产深度结合,围绕着医疗设备从安装、保养、维修、到迁移的一整套业务体系,极大的提升了企业管理水平和医院方的服务体验。
1420html5人工智能医疗
通过深度学习和机器学习算法实现问答机器人,配合问答库实现客户问题智能答复。 系统分为智能问答模块、后端应用服务模块和前端模块。 智能问答模块实现算法问答对匹配。
3330python开源问答系统
主要数据资源覆盖200多个全球贸易地区,进出口数据无缝对接,实时更新,实现客户交易数据全网化链接!采用自主产权的国际贸易标准化数据整理系统、大数据分布存储数据库等核心技术,实现海量数据精准分析
2080phpphp
当前共991个项目more
×
寻找源码
源码描述
联系方式
提交