代表项目

这里整理了我在 CUDA 优化、多模态 AI、代码智能和系统工具方面的代表性工作。

独立研究者独立开发者核心研究者

项目概览

这些项目主要展示我如何从模型理解逐步延伸到系统优化与硬件执行层面的实现能力。

项目 01

CUDA GEMM 性能优化与体系结构分析

独立研究者 / 2026 年 3 月

围绕 GEMM 内核实现与系统化优化，研究内存层次结构与算术强度如何共同影响整体执行性能。

项目 02

独立开发者 / 2026 年 3 月

构建了一个结合 LLM 推理、AST 切块、向量检索与 CUDA 专项解析的仓库分析工具，用于结构化理解源码。

项目 03

核心研究者 / 2025 年 8 月 - 12 月

设计了一个将视频信息转化为结构化文本的多模态系统，同时关注其部署效率与系统行为。

项目 04

独立开发者 / 2025 年 7 月 - 8 月

从零构建小型生成式语言模型，以深入理解 tokenizer、attention、预训练与微调流程。

项目 05

独立开发者 / 2025 年 2 月 - 5 月

开发了一套对标 tshark 思路的全栈抓包与协议解析工具，以 C++ 负责底层解析，并强化本地化体验。