快速开始
安装指南
架构设计与核心特性
Triton 算子开发指南
Triton 算子迁移指南
典型算子样例
算子调试与调优
Triton API 接口说明
Libdevice 开发者手册
环境变量和编译选项
常见问题
示例
简要说明
01_vector_add_example
简单加法示例
02_fused_softmax_example
Softmax 融合算子示例
03_layer_norm_example
Layer Normalization 示例
04_fused_attention_example
Flash Attention v2 融合注意力算法示例
05_matrix_multiplication_example
矩阵乘法高效实现示例
06_autotune_example
使用 Autotune 进行内核自动调优示例
07_accuracy_comparison_example
精度比对示例
08_max_autotune_example
使用 max_autotune 进行内核自动调优示例