
Triton 编译流程及 Op lowering
简析 Triton 编译流程与 device_print Op lowering 路径

简析 Triton 编译流程与 device_print Op lowering 路径


从 Python DSL Lowering 和 Compiler flow 两个维度走读 TileLang 的编译流程

CUTLASS 4.2.0 ———— 深入浅出 CuTe DSL 与 CuTe C++

map, set, multimap, multiset, unordered_map, unordered_set…

现代 C++ 基石…

函数指针、重载;类构造、析构、友元、继承、访问权限;RAII(资源获取即初始化);

重温 C++ 之 const、static、constexpr、auto…

从 A 到 Z, 快速上手 MLIR-AIE。

对 MLIR-AIR 的 Passes 进行分析与总结。