nothin Blog

「index pages」

Python 中的广播机制 (Broadcasting)

广播 (Broadcasting) 是 NumPy 和 PyTorch 等科学计算库中的一种机制,允许不同形状的数组进行算术运算,而无需显式复制数据。

Python 中的广播机制 (Broadcasting) 什么是广播 广播 (Broadcasting) 是 NumPy 和 PyTorch 等科学计算库中的一种机制,允许不同形状的数组进行算术运算,而无需显式复制数据。 核心思想 广播通过虚拟扩展较小数组的形状来匹配较大数组,在计算时重复使用数据,而不实际占用额外内存。 优势: 内存高效:不创建数据副本 代码简...

翻译《The Deep Learning Compiler: A Comprehensive Survey》

"Hello World, Hello Blog"

翻译《The Deep Learning Compiler: A Comprehensive Survey》,我看了前面的部分主要是在介绍不同的ai编译器主要使用了什么技术,我对以下的内容更加关心,于是只翻译了这部分内容。 4 深度学习编译器的通用设计 4.1 设计概述 深度学习编译器的通用设计主要包含两个部分:编译器前端和编译器后端,如图2所示。中间表示(IR)横跨前端和后端...

记一个有趣的编译优化选项 `-enable-dfa-jump-thread`

"Hello World, Hello Blog"

记一个有趣的编译优化选项 前言是师姐在测试coremark时,发现gcc和icx的性能比llvm的性能要好。查看汇编代码发现,gcc和icx能将coremark中的一个状态机代码优化为使用goto串联起来状态转换过程,从而不需要使用跳转表来执行跳转流程。然后交给我任务来调研llvm中是否有相关的优化。 coremark源代码 coremark中的代码位于https://gith...

Hello blog

"Hello World, Hello Blog"

“Yeah It’s on. ” hello world first blog 模板来自https://huangxuan.me/