人工智能

对产品说明书、操作文档、政策文件等文章类型数据,进行处理,最终实现效果为类似于chatPDF,用类似于chatGPT的大语言模型对文档内容作答,本地部署支持多种模型基座 涉及功能切片、摘要、向量化后存储向量搜索引擎等 下列图片为国家税务政策文件的问答,一张为根据问题搜索政策文件,第二张图片为由模型学习文件之后的作答
1130
项目一: 借贷还款的项目,测试贷款审核,贷款的还款数据校验。以上为部分测试报告 项目二: 对于功能文件夹以及单个文件加锁解锁,图为的设计case场景。
920APP
项目分为服务端和客户端,服务端为机器人大脑,信息处理中心,客户端为输入输出层(虚拟或物理) 使用rest,langchain,llama.cpp,视觉上使用yolov5,听觉使用whisper,slam使用简单的三点定位 难点1在于主要在于系统的输入输出异步性,使用原子化互斥操作来解决,另外2是视觉上的检测识别能力,通过家具环境进行模型微调。3是可拓展性,通过设置虚拟的“环境”交互对象来达成
810人工智能
使用深度学习进行糖尿病眼底病变检测。 实现DR、DME全阶段分级、黄斑位置、视盘位置检测 主要工作可以分成几部分: 1. 算法部分,对图片进行分析获得病变信息,生成报告需要的文字和数据,对内部提供http API 2. 软件部分,进行用户验证,提交图片,发送AI诊断的请求,获得结果并渲染成图表,记录结果并且返回前端显示 这个项目是产学研结合项目,我负责了几乎所有开发,包括后端,前端,AI模型训练和封装。 前端使用Vue框架做的single page app,主要通过发送http请求获得结果并显示,包含了用户管理,诊断记录,诊断回放等功能 后端使用FastAPI做server,使用requests发送算法服务请求,使用postgresql作为存储数据库,用peewee写的ORM来操作数据库。 算法部分使用Pytorch进行的模型开发,用ONNX方式部署,外面使用了flask做server,接受请求并返回结果。 整个项目算法部分和软件部分分别都用docker打包,方便云上部署。
990webapp
基于 Android 的垃圾识别和分类 APP 实现基于 Android 的计算机视觉识别分类软件。 Machine Learning 模型使用 Tensorflow、keras 框架训练、python 语言,分析比较不同算法以及参数对准确率的 影响。 Android 端使用 TFLite 进行与 android 端的推理连接,实现拍照以及实时检测功能。
1090APP
通信接口:串口,wifi 主要功能:传感器曲线显示,实时数据区域色块划分,电机控制,保存电机相关行程,速度等信息
750智能硬件
kaggle上的强化学习比赛 lux-ai-s2,使用ppo算法,使用多环境模拟和分布式训练提升学习速度,使用渐进式训练获得效果的稳定提升
900人工智能
文本检测: CTPN:核心思想是将图片按宽度为16像素分成很多个小格,检测每一个小格中是否包含文本,同时预测文本的高度和宽度。最后将多个检测结果融合,形成最终的文本框。CTPN缺点:对于倾斜和弯曲的文本检测效果很差,这个是因为模型自身的原理决定,很难通过训练解决。 CRAFT:可以识别任意角度的文本,而且可以给出图片中每一个像素为文本的置信分。在深度学习的OCR文本检测中,有一个很大的痛点就是在图片里有比较大的文本和比较小的文本的时候,小文本容易被漏检,这是因为采用了类似region proposal原理的算法(比如CTPN),很难通过调参或者数据集解决。而Craft由于是像素级别的预测,在这方面有天然的优势,不会漏检图片中的小文本。 Seglink:在CTPN基础上进行改进,利用开源项目测试了一些比较模糊的图片,发现效果不是很好,暂时没有深入研究,从论文的结果来看,在复杂场景下的识别效果要好于CTPN。 EAST:在Seglink基础上的改进算法,在识别倾斜和弯曲文本的效果上比较好 文本识别: CNN+RNN+CTC:其中CNN用于提取图像特征
1450
使用OpenMVS框架进行三维重建。OpenMVS是三维重建的一个成熟开源框架,综合重建效果和性能,该算法是目前MVS(Multi-View Stereo)相关的所有开源库中最好的一个
740
需求描述: 专家通过调查问卷和思维导图形式通过层次分析,SWOT分析,态势对在开会中使用 项目描述: 会议支持系统需要通过一些算法(例如:层次分析,SWOT分析,插值算法等对态势)对当前态势进行研判 责任描述:通过使用websocket开发会议中多人聊天系统和通过思维导图方式以层次分析算法进行 分析,对知识图谱环境进行搭建,进行训练,和对接口进行开发 项目技术:用springboot+mybatisplus+jwt+mysql+docker+websockcet+接口 实施结果: 已经上线投入使用,部署了5~6个地方
600人工智能
软件包括文字搜题、图片搜题、ChatGpt 问答等服务,包括 C 端和 B 端两种形式,在日本东京的服务器上 搭建了 WebSocket 代理程序,提供稳定的信息传输渠道,后续会接入其他大语言模型。
1080APP
根据openhd二次开发,实现实时地面端与天空的端的数据交互。地面端支持接入定向天线可使通信半径延长至30公里。可根据需求定制无人机的外挂装置。
6803C
负责甲方整理项目的调样,设计开发。了解甲方对人工智能分析的要求。解决甲方需要的痛点例如人员的相应速度,各个业务人员目前的处理的状态,对高速公路人员监控,对行驶车辆的监控等等
820IT
此项目提出了一种具备自动分类功能的视觉传感器,可通过注册图像方式进行自动类型识别。该视觉传感器主要包括图像采集模块,图像处理模块,分类功能模块,人机交互软件等。本人在此项目中主要负责开发图像处理模块和分类功能模块,在开发过程中主要使用了C/C++语言进行代码编写,使用了深度学习理论。经测试,所设计的视觉传感器,自动类型识别效果良好,分类正确率达99%以上。
930人工智能
运动目标控制与自动追踪系统在许多领域具有广泛的应用,如无人机监控、智能交通等。本作品基于全国大学生电子设计大赛的E题要求,采用open mv视觉模块,并使用python语言使用IDE对其直接进行编程,设计并实现了一种运动目标控制与自动追踪系统。该系统利用先进的图像处理和控制算法,实现对运动目标的实时追踪和控制。通过对目标的位置和运动状态进行分析,系统能够自动调整相机的角度,实现对目标的精确跟踪和拍摄。经过自行测试,该作品完全实现了题目所有要求
1660人工智能
使用Python开发网络爬虫,对新冠肺炎的疫情数据(包括当日的实时数据和历史数据)进行采集、数据挖掘,数据可视化
740人工智能
从基本的数据获取,数据采集抓取,数据加工计算,数据合规校验,数据容错处理,数据迭代遗弃,数据汇总统计,数据导出报表
850智能硬件
随着图像、视频分析技术的发展,人物、物体等的检测与跟踪等手段逐步被应用到了安防领域。本系统主要是通过检测视频画面中的人物和物体,判别是否有入侵(跨界、绊线)、徘徊、奔跑、物体遗漏等行为。最终将告警推送到监控平台。
1080人工智能
智能问答、智能起名、智能文案生成、智能客服小程序。使用大语言模型,类似ChatGPT,通过问答的方式实现智能文本生成。
970人工智能
通过lora模型微调等方法进行定制化图片生产;流行插件的功能组合使用;特殊需求的定制化插件开发;prompt的经验化调整
810人工智能
当前共1460个项目
×
寻找源码
源码描述
联系方式
提交