个性化配置
1KV Cache(二):从如何让GPU不摸鱼开始思考——MQA、GQA到MLA的计算拆解1/16更新于 2/272KV Cache(一):从KV Cache看懂Attention(MHA、MQA、GQA、MLA)的优化之路1/4更新于 2/273从vibe到spec:可维护性视角下探讨为什么很多人的AI编程依然是小玩具2025/12/264通过下游任务理解BERT和GPT的区别:不只是完形填空和词语接龙2025/12/19更新于 2/275为什么Embedding加上位置编码后不会破坏语义?2025/9/28更新于 2/276流形视角下的Embedding:从理论到RAG实践2025/8/197Add & Norm(二)从传统CV到Transformer里的Normalization详解2025/7/28更新于 2/278Add & Norm:对残差连接深入解析(一)2025/6/12更新于 2/27