<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>MoE on Echo的技术博客</title><link>https://cybersecurityerial.github.io/echo_blog/tags/moe/</link><description>Recent content in MoE on Echo的技术博客</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Tue, 16 Jun 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://cybersecurityerial.github.io/echo_blog/tags/moe/index.xml" rel="self" type="application/rss+xml"/><item><title>LLM System: 基础知识速查 01 - MoE</title><link>https://cybersecurityerial.github.io/echo_blog/posts/llm-system-basic-quick-reference-01-moe/</link><pubDate>Tue, 16 Jun 2026 00:00:00 +0800</pubDate><guid>https://cybersecurityerial.github.io/echo_blog/posts/llm-system-basic-quick-reference-01-moe/</guid><description>&lt;h2 id="moe-fb-计算流程"&gt;moe f&amp;amp;b 计算流程&lt;/h2&gt;
&lt;h3 id="router"&gt;Router&lt;/h3&gt;
&lt;p&gt;Router 计算每个 token 应该路由到哪些 expert。&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Router 计算 01" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/01-router-01.png"&gt;&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Router 计算 02" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/02-router-02.png"&gt;&lt;/p&gt;
&lt;h3 id="dispatch"&gt;Dispatch&lt;/h3&gt;
&lt;p&gt;Dispatch 根据 router 结果，把 token 分发到对应 expert 的输入 buffer。&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Dispatch 计算 01" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/03-dispatch-01.png"&gt;&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Dispatch 计算 02" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/04-dispatch-02.png"&gt;&lt;/p&gt;
&lt;h3 id="ffn"&gt;FFN&lt;/h3&gt;
&lt;p&gt;每个 expert 内部执行自己的 FFN / MLP 计算。&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE FFN 计算 01" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/05-ffn-01.png"&gt;&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE FFN 计算 02" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/06-ffn-02.png"&gt;&lt;/p&gt;
&lt;h3 id="combine"&gt;Combine&lt;/h3&gt;
&lt;p&gt;Combine 把各 expert 的输出按路由权重聚合，并还原到 token 维度。&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Combine 计算 01" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/07-combine-01.png"&gt;&lt;/p&gt;
&lt;p&gt;&lt;img alt="MoE Combine 计算 02" loading="lazy" src="https://cybersecurityerial.github.io/echo_blog/images/llm-system-basic-quick-reference-moe/08-combine-02.png"&gt;&lt;/p&gt;
&lt;h3 id="moe-softmax"&gt;MoE softmax&lt;/h3&gt;
&lt;p&gt;MoE做router的意义是什么？&lt;/p&gt;
&lt;p&gt;MoE 做softmax的意义和一般softmax意义类似，都是让logits能被解释为概率。
被解释为概率/加权的几个要求：正数，和为1，尺度一致，&lt;/p&gt;</description></item></channel></rss>