

全职 · 300/日 · 6525/月信用一般
工作时间: 周末09:00-18:00工作地点:
远程
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********



工作经历
2022-07-01 -2024-11-01英特尔AI工程师已认证
开发onednn graph. **oneDNN Graph Compiler** 是英特尔推出的深度学习编译器,旨在优化神经网络模型在英特尔硬件(如CPU、GPU)上的计算性能。它通过分析计算图的结构,结合硬件特性进行自动优化,以提高模型推理和训练的效率。以下是其核心技术点: ### **核心技术** 1. **计算图优化** - **作用**:解析深度学习模型的计算图(如TensorFlow、PyTorch导出的图),进行结构优化。 - **技术**:包括节点合并、常量折叠、冗余操作消除等,减少计算量和内存占用。 2. **算子融合(Kernel Fusion)** - **作用**:将多个连续操作(如Conv + ReLU + BatchNorm)合并为单一内核(Kernel),减少数据搬运和内存访问延迟。 - **优势**:显著提升计算密集型任务的吞吐量。 3. **硬件感知的自动调优** - **动态代码生成**:根据目标硬件***2指令集、Intel GPU)自动生成优化后的内核代码。 - **自适
教育经历
2019-08-01 - 2022-06-01中南大学计算机科学与技术硕士已认证
国家奖学金 CCF B一作一篇。CCF A他作两篇。
语言
英语
普通话
0
1
2
3
4
5
0
1
2
3
4
5