主题
边缘推理中的 Memory Wall
我关注 Transformer 类感知模块在 Jetson 等边缘设备上的访存瓶颈、带宽限制与数据局部性问题。
我当前的研究方向聚焦高效 AI 推理,尤其关注模型层选择如何与编译优化、运行时策略以及底层硬件现实相互耦合。
方向概览
这里更集中地展示我在高效推理、系统优化和硬件执行层面的关注点,而不是做额外的身份说明。
主题
我关注 Transformer 类感知模块在 Jetson 等边缘设备上的访存瓶颈、带宽限制与数据局部性问题。
主题
我希望不再把量化和融合视作彼此独立的步骤,而是把它们看作受到指令级和硬件级约束共同影响的联合搜索空间。
主题
我关注 CPU-GPU 协同和动态调度策略如何影响资源受限系统中的确定性推理行为。
主轴
产出