机器学习/深度学习

当前越多越多的业务开始使用多模态大模型,尤其是视觉-语言预训练模型。在实际使用中,我们通常需要对预训练模型进行调优来适配实际的业务场景,而这需要大量的资源介入且费时费力,尤其是对视觉基座的调优在资源有限的情形下几乎是不可行的。本项目探索了在不调优视觉基座的前提下,仅通过对语言端进行调优并优化推理过程,实现语言增强的零样本多标签分类任务 (Zero-shot Multi-label Classification)。本项目为国际比赛获奖项目。
1080图像(Image)
人类染色体核型智能分析系统,是一款基于人工智能技术,对人类染色体中期图像进行自动分割、识别、计数,并自动生成核型图的遗传实验室辅助工具。 功能包括:图像管理、一键识别、导出核型图、手动编辑(笔刷、多边形、缩放、旋转、移动等)、配置管理。 达到的性能:分割准确率>90%,核型准确率>75%,GPU识别速度12张/分钟,CPU识别速度4张/分钟,支持GPU、CPU、XPU、NPU、TRT环境,支持Win、Linux操作系统。 目前已被多家医院遗传实验室采用。
2411python机器学习/深度学习
为了达到对低照度和高曝光图像的增强的目的,分别使用主观评价指标和客观评价指标对算法进行评价。基于pytorch设计网络结构输出参数对图像进行简单变换,网络使用VGG16的卷积结构并增加残差连接,使用输出层预测变换参数,设计了五种损失函数进行惩罚训练。并设计UI交互界面对比不同算法的实时增强情况。
1120机器学习/深度学习
自动完成发票查验,无需输入验证码,提供发票查验界面和webapi接口,方便于现有系统集成,查验速度2秒以内,可以免费体验,有任何需求和建议可以发给我。
1160机器学习/深度学习
python angular redis mysql nginx linux 作品分类(1-5个分类)(必填): 机器学习/深度学习 脚本编程语言 网络爬虫 日志分析和统计 项目构建 添加标签,按回车确认 HTML5开发相关文件管理器其他jQuery插件Chrome插件/扩展论坛系统BBS作业/任务调度网络爬虫日志分析和统计图形和图像工具Emoji 表情相关终端/远程登录搜索引擎项目构建REST/RESTful项目嵌入式操作系统
2660python机器学习/深度学习
我是一名专注于深度学习和人工智能领域的软件工程师,拥有丰富的实践经验和扎实的技术背景。我擅长使用 Python 进行编程,并在图像处理和自然语言处理领域有着深入的研究和实践。我曾成功应用深度学习模型于新闻文本分类、人体姿态识别项目以及图像分类检测等任务。 项目经验 新闻文本分类系统: 行业应用:媒体、出版、内容分析 功能实现:自动化新闻内容分类,个性化新闻推荐,内容审核 技术亮点:利用预训练模型 BERT 提升分类准确性,支持多类别文本分类 人体姿态识别系统: 行业应用:健康监测、运动分析、安全监控、人机交互 功能实现:运动训练分析,老年人跌倒检测,异常行为识别 技术亮点:实时数据处理,高准确性的姿态识别算法,易于集成的 API 设计
900python网络爬虫
负责(基于python语言,torch框架,开源yolov5的目标检测项目,标记图片数据来源—robotflow) 其他(非本人)(包装为安卓测试应用)
3020机器学习/深度学习
这是一个简单的图像识别处理,基于python的CIFAR10数据集进行多次训练,再通过输入图片来识别该图片的内容是属于CIFAR10训练集中的哪类图片。整个作品的代码均为我一人制作。使用了机器学习基础中的CNN卷积代码实现图像识别。实现了再在整体数据集上的正确率达65%
1150机器学习/深度学习
1. 利用keras深度学习框架实现CVPR论文中ghostnet模型的搭建。 2. 实现该模型的训练和测试,方便大家复现原论文结果。
1620机器学习/深度学习1
某企业AI智能客服项目旨在利用人工智能技术,为企业打造一个高效、智能的客户服务系统。该项目通过模拟人类客服的对话方式,与用户进行实时交流,解答用户的问题、提供帮助和建议,从而提升企业服务效率、降低运营成本,并增强用户的满意度和忠诚度。 一、模块组成 智能问答模块:基于自然语言处理、深度学习等技术,对用户的问题进行识别、分析和回答。该模块能够准确理解用户意图,提供精准的答案和解决方案。 用户交互模块:负责与用户进行实时对话,包括语音、文本等多种形式的交互。该模块通过语音识别、语音合成等技术,实现与用户的语音交互;同时,也支持文本输入和输出,方便用户进行文字交流。 知识库管理模块:存储和管理企业的各类知识、常见问题及解决方案。该模块支持知识的动态更新和维护,确保智能客服系统能够随时提供最新、最准确的信息。 数据分析模块:对用户行为、问题类型、服务效果等数据进行收集和分析,为企业提供有价值的业务洞察和改进建议。 二、使用到的技术 自然语言处理技术:用于将用户的语言转化为机器可理解的形式,从而能够准确理解用户的需求和问题。通过分词、词性标注、句法分析等处理,提取出用户问题中的关键
2281Java人工智能
现实中,有数百万人患有严重的身体残疾丧失了交流以及与环境互动的能力,然而其感觉和认知功能通常仍然完好无损。这为利用BCI技术以改善患者生活质量提供了可能。P300-Speller是基于EEG的BCI系统中最热门的应用之一。正被用来解析那些思维正常却行动不便的病人的真实意图和想法,P300-Speller允许用户使用图形用户界面(GUI)与环境进行通信,可以让患者在生活上更加独立,甚至在一定程度上恢复他们的社交生活。因此,研究P300脑机接口技术具有极高的实际应用价值。
1180python机器学习/深度学习
1. 学生端APP图书阅读打分、学习任务、课程功能、直播功能、发现功能、学习报告、积分商城、卡牌、评级测试、加入学校、消息推送等功能规划; 2、带领团队从0开始搭建各端功能,APP版本在三年多的时间里由1.0版本迭代到3.7.0,用户数量累计达到80万;
980PHP机器学习/深度学习
1、项目应用于无人车在行进过程中对道路进行正确的识别,便于有效避障 2、功能主要是提取图像信息中的有效特征,实现道路与周围环境的分割,并将道路与环境通过二值图标注出来 3、主要框架为图像增强、特征提取、特征分析、特征降维、贝叶斯多线索融合机制、图像降噪
480python计算机视觉库/人脸识别
基于LangChain + 开源 LLM构建个人知识库,用 LangChain 对文档进行向量化,然后检索内容,在调用 LLM 对得到的内容进行总结输出
2650python机器学习/深度学习
通过时间序列ARIMA、循环神经元LSTM等算法对大盘进行预测 通过大数据、统计等算法对股票进行预测 PHTHON C++ VS/VSCODE
1360脚本编程语言
⚫ 开发了一个用于地震后建筑物的损坏等级的预测系统。通过搭建自编码器(Autoencoder,ANN),对数据中地理坐标数据进 行特征工程,提取并加强了地理特征。 ⚫ 基于集成方法构建并训练了由随机森林,XGBoost 和 LightGBM 构成的模型来做预测, 取得了最高F1-score 75.32%,位 列前30名。
840机器学习/深度学习
基于人脸关键点框架获取到400+人脸3D关键点数据,并绘制到人脸上。 关键点数据覆盖:眼周、瞳孔、鼻子、额头、内外嘴唇…… MediaPipe
1090计算机视觉库/人脸识别
在采样过程中通过顶棚摄像头图像,识别出车辆的车厢位置及拉筋信息,为采样提供定位坐标,广泛应用于火电厂、冶金行业、焦化厂等。
1401计算机视觉库/人脸识别
对于重点交通路段的车辆信息进行监测和违法取证。 亮点分析: 1、使用后台线程处理视频帧: 创建了 VideoProcessor 线程类,用于处理视频帧和检测。 通过信号 frame_processed 将处理好的帧和入侵信息传递回主线程,避免主线程阻塞。 2、硬件加速: 确保在OpenCV中使用硬件加速解码(这部分需要确认OpenCV的安装支持硬件加速)。 3、非极大值抑制优化: 使用 cv2.dnn.NMSBoxes 函数进行非极大值抑制,提高检测框的准确性。 4、异步任务: 将繁重的计算任务放在后台线程中执行,提高主界面响应速度。
930python计算机视觉库/人脸识别
基于关键点提取框架获得人体30多个关键点坐标信息,选择向量夹角作为度量标准。提供10余种不良坐姿检测功能。 MediaPipe
900机器学习/深度学习
当前共533个项目
×
寻找源码
源码描述
联系方式
提交