LLM System: 基础知识速查 01 - MoE

Tue, 16 Jun 2026 00:00:00 +0800

moe f&b 计算流程

Router 计算每个 token 应该路由到哪些 expert。

Dispatch 根据 router 结果，把 token 分发到对应 expert 的输入 buffer。

每个 expert 内部执行自己的 FFN / MLP 计算。

Combine 把各 expert 的输出按路由权重聚合，并还原到 token 维度。

MoE做router的意义是什么？

MoE 做softmax的意义和一般softmax意义类似，都是让logits能被解释为概率。被解释为概率/加权的几个要求：正数，和为1，尺度一致，