xavierC++-程序员客栈

1月前来过

AI工程师

上海

全职 · 300/日 · 6525/月信用一般

工作时间: 周末09:00-18:00工作地点: 远程

服务企业: 0家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

我认真负责，写代码逻辑严谨，高效交付。

2022-07-01 -2024-11-01英特尔AI工程师已认证
开发onednn graph. **oneDNN Graph Compiler** 是英特尔推出的深度学习编译器，旨在优化神经网络模型在英特尔硬件（如CPU、GPU）上的计算性能。它通过分析计算图的结构，结合硬件特性进行自动优化，以提高模型推理和训练的效率。以下是其核心技术点： ### **核心技术** 1. **计算图优化** - **作用**：解析深度学习模型的计算图（如TensorFlow、PyTorch导出的图），进行结构优化。 - **技术**：包括节点合并、常量折叠、冗余操作消除等，减少计算量和内存占用。 2. **算子融合（Kernel Fusion）** - **作用**：将多个连续操作（如Conv + ReLU + BatchNorm）合并为单一内核（Kernel），减少数据搬运和内存访问延迟。 - **优势**：显著提升计算密集型任务的吞吐量。 3. **硬件感知的自动调优** - **动态代码生成**：根据目标硬件***2指令集、Intel GPU）自动生成优化后的内核代码。 - **自适

英语

普通话

更新于: 02-06 浏览: 43