个人介绍
工作经历
2023-05-04 -2024-07-05石家庄云道科技有限公司AI算法工程师
1. SD webui comfyui,api接口与sql业务逻辑 2. ffmpeg视频制作 3. llama翻译与 4. 语音合成,语音识别 5. 图像超分
2020-11-10 -2023-05-03河北阿凯科技有限公司AI算法工程师
1. word文档 pdf自动化,手画表格自动排版输出 2. 公安局微型摄像头人脸识别 3. 高速二维码识别 4. 摄像头餐饮管理系统,AI算法,目标检测,工装,帽子,口罩,人员闯入、计数,火焰检测,等 5. 疫情防控系统 6. 高并发AI换脸 7. 人脸属性编辑器 8. 人脸多风格漫画 9. stable diffusion绘画
2019-10-10 -2020-09-10河北中科一路通全栈AI工程师
实时车牌识别,提取车牌信息,获取车牌位置,检测车的型号,软件通讯报警设备,车辆数据存储,细胞识别,箱体识别,红绿灯识别,大数据预测,机器人走规划的指定路线,等。
教育经历
2022-03-10 - 2024-06-30石家庄理工职业学院计算机网络技术专科
成考,期间在就职工作
技能
1. 使用stable-diffusion本地部署AI绘画,中文prompt自动翻译,自定义lora训练,图片识别prompt实现图像重绘,在此基础上api接口调用提供多种不同风格模型,PuLID明星艺术照生成。 2. 使用ffmpeg,视频片段混剪与拼接,添加文字、图片、视频、GIF贴纸,音频混音合并,转场特效,画面特效,音效,字幕,抽帧,随机片段变声,批量制作视频,自动剪辑,在抖音搬运领域可使用较为简单的操作方法,生成千万条视频,轻松过原创。 3. 使用GPT-sovits制作文本转语音,语音合成服务,应用于视频剪辑。 4. 使用LLama大语言模型进行翻译,根据小说内容生成SD图像prompt,在低端显卡下使用LLama-cpp运行7B模型。 5. 视频/音频,支持mp4/wav/mp3等格式,识别语音并转换成srt字幕文件,可用于再次配音。 6. 图像超分,将AI绘画的图片进行超分辨率,优点在于,由于直接画高分辨率图像显存消耗和时间消耗都较长,画较低分辨率图像整体画面无杂物的情况下,提高图像清晰度。