研究

研究方向

我当前的研究方向聚焦高效 AI 推理,尤其关注模型层选择如何与编译优化、运行时策略以及底层硬件现实相互耦合。

面向量化与运行时调度的硬件感知协同优化面向 embodied AI 与视觉代理的边缘高效推理缩小模型抽象与底层执行之间的语义鸿沟

方向概览

这里更集中地展示我在高效推理、系统优化和硬件执行层面的关注点,而不是做额外的身份说明。

主题

边缘推理中的 Memory Wall

我关注 Transformer 类感知模块在 Jetson 等边缘设备上的访存瓶颈、带宽限制与数据局部性问题。

主题

量化与算子融合

我希望不再把量化和融合视作彼此独立的步骤,而是把它们看作受到指令级和硬件级约束共同影响的联合搜索空间。

主题

运行时调度

我关注 CPU-GPU 协同和动态调度策略如何影响资源受限系统中的确定性推理行为。

主轴

当前研究主轴

  • 面向量化与运行时调度的硬件感知协同优化
  • 面向 embodied AI 与视觉代理的边缘高效推理
  • 缩小模型抽象与底层执行之间的语义鸿沟

产出

研究产出与材料

  • 一篇多模态视频描述方向论文正在准备中
  • 一份关于硬件感知 AI 系统优化的研究计划
  • 涵盖 CUDA、RAG 系统与多模态推理的项目组合