宋翱翔
17天前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日19:00-24:00、周末08:00-22:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

本人 精通大型算力服务器集群的部署与管理,能够使用 Ollama、SGLang、KTransformer、Unsloth 等推理框架部署 并微调前沿大模型,如 V3、R1 671B DeepSeek 满血版,具备利用 NCCL 进行多GPU服务器联动部署、维护和调 试的能力。 成功通过 Ollama-Factory 对 14B 以上大模型进行 Full、Freeze、LoRA 微调,拥有 SD、Flux、Wan2.1 等多种图 文生成及图生视频应用的部署经验,能够搭建 Dify、Coze、ComfyUI 等前沿 AI 工作流解决方案,推动大模型应用 落地并实现商业化价值。

掌握C/C++,在算法竞赛中多次获奖,leetcode等平台刷题量470+ 掌握python以及常见算法库,熟悉PyQt5的使用,可以进行UI开发 掌握OpenCV图像处理框架,熟悉sklearn机器学习框架及机器学习常用算法(KNN、随机森林等) 掌握PyTorch深度学习框架,能够搭建并训练模型,解决分类问题和回归拟合任务 掌握DeepSeek、ChatGLM、Qwen等国内开源大模型的部署与微调,熟悉RAG技术和LangChain,可用于构建 智能问答系统 掌握Pandas、Numpy、Scikit-learn进行数据清洗和时序预测 熟悉Text2SQL技术,支持自然语言与SQL的转换 掌握MySQL、Sqlsever进行数据存储与查询,可以根据需求构建数据库 熟练掌握docker容器技术、,了解模型量化、剪枝、蒸馏等优 化技术,了解TensorRT、ONNX进行高效推理部署。 Git技术、 有团队多人合作开发的经验,具备探索新技术的热情

 2023-05 蓝桥杯大学 B 组 C/C++ 二等奖 2024-05 团队程序设计天梯赛 三等奖(C/C++) 2024-05 河北省大学生程序设计竞赛(hbcpc) 三等奖(C/C++) 2024-08 中国大学生计算机博弈大赛 三等奖、优胜奖 (python) 2024-08 计算机设计大赛省级 二等奖、 (python) 2024-12 2024河北省“九天杯”人工智能命题打榜赛 三等奖(python)

接单金额超3W,接单次数超50次

工作经历

  • 2024-11-01 -至今浙江银盾云 (京津冀大数据处理中心深度学习算法工程师

     负责GPU算力集群部署DeepSeek 671B满血版,测试不同推理框架,对14B大模型并且进行了全量微调,进行负载均衡优化,在后端使用FlaskAPI给前端提供接口,搭建API开发平台。 构建comfyui工作流,测试并且训练各种文生图、图生图、文生视频、图生视频工作,上线炼丹侠官网。  负责“基于人工智能的多维度能源大数据质量提升与异常检查”项目 课题三“智能数据分析助手”的开发。

  • 2024-06-01 -2024-10-01联想集团 (北京联想全球总部)AIPC市场推广助理

    协助技术团队对联想小天AIPC产品进行演示和培训,帮助客户解决技术问题。在项目中使用了基于人工智能的文本生成技术(如GPT模型)进行产品推广文案的自动生成和优化 联想集团 (北京联想全球总部) — AIPC市场推广助理 2024-06 ~ 2024-09  ,与联想智能体开发者进行了交流学习,调研了智能体部署的市场需求和客户具体需求

  • 2023-03-01 -至今华航置云科技有限公司 (河北)前端开发

    负责公司官网前端开发,使用 Vue 和 Element UI 构建高复用组件,优化响应式设计与用户体验,并通过懒加载提升页面性能

教育经历

  • 2020-06-01 - 北华航天工业学院人工智能本科

语言

普通话
0
1
2
3
4
5
0
1
2
3
4
5

技能

CSS
HTML5
Torch
0
1
2
3
4
5
0
1
2
3
4
5
作品
炼丹侠

成功部署与优化超大参数模型: 在大型算力服务器集群上成功联动部署并优化了V3、R1 671B DeepSeek 满血版等超大参数模型,使用 Ollama、SGLang、KTransformer、Unsloth 等推理框架进行部署对比,提升了模型的推理性能和应用效率。 高效管理多GPU服务器集群: 使用 NCCL 技术完成多GPU服务器联动部署,解决了多机多卡之间的通信与负载均衡问题,成功实现了大规模分布式训练和推理 完成大模型微调: 利用 Ollama-Factory 对 14B 以上大模型进行 Full、Freeze、LoRA 微调,优化了模型精度和运行效率,提升了业务需求的适应性。 搭建前沿AI工作流解决方案: 完成 SD、Flux、Wan2.1 等图文生成、图生图、图生视频应用的部署,并成功搭建 Dify、Coze、ComfyUI 等 AI 工作流解决方案,成功实现大模型在商业应用中的实际落地。 开发大模型代理: 制作多个大模型代理,通过调用大模型工具为具体业务场景提供定制化解决方案,成功实现了商业化应用的落地,在开放API平台上参与Python后端路由开发工作

0
2025-04-02 15:29
更新于: 04-02 浏览: 13