1. 算法学习| C++基础

    本文针对初学者,包括 C++ 的基本使用、控制语句、标准库的常用数据结构等,以便快速上手。

    2025/03/18 Algorithm

  2. LLM Infra| 快速反量化运算

    快速反量化运算

    2024/09/03 LLM

  3. CUDA| 利用pybind11封装CUDA程序为python库

    利用pybind11封装CUDA程序为python库

    2024/08/26 CUDA

  4. CUDA| QQQ量化中GEMM算子的研究

    QQQ量化中GEMM算子的研究

    2024/08/19 CUDA

  5. PTX ISA| lop3.b32命令的含义研究

    lop3.b32命令的含义研究

    2024/08/16 PTX

  6. 机器学习| 决策树

    决策树是一类常见的机器学习方法,我们通过树状的结构进行分类最终得到决策。一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。

    2024/08/14 Machine Learning

  7. Triton| .cubin文件调用研究

    本文记录了.cubin文件的两种调用方式,适用于triton和cuda分别生成的.cubin文件

    2024/08/14 Triton