<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Initialization on 我的技术博客</title><link>https://cybersecurityerial.github.io/echo_blog/tags/initialization/</link><description>Recent content in Initialization on 我的技术博客</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 06 May 2026 13:09:10 +0800</lastBuildDate><atom:link href="https://cybersecurityerial.github.io/echo_blog/tags/initialization/index.xml" rel="self" type="application/rss+xml"/><item><title>LLM Theory 02: 第一性原理下的训练设定</title><link>https://cybersecurityerial.github.io/echo_blog/posts/llm-theory-02-initial-setup/</link><pubDate>Wed, 06 May 2026 13:09:10 +0800</pubDate><guid>https://cybersecurityerial.github.io/echo_blog/posts/llm-theory-02-initial-setup/</guid><description>&lt;blockquote&gt;
&lt;p&gt;本文从训练模型要考虑的第一性原理（稳定性和速度）出发，探讨了 LLM 预训练中的初始化设定问题。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id="参考文献"&gt;参考文献&lt;/h2&gt;
&lt;ol&gt;
&lt;li&gt;&lt;a href="https://spaces.ac.cn/archives/11340"&gt;MuP之上：1. 好模型的三个特征&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://spaces.ac.cn/archives/11605"&gt;https://spaces.ac.cn/archives/11605&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://spaces.ac.cn/archives/11647"&gt;https://spaces.ac.cn/archives/11647&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://spaces.ac.cn/archives/11729"&gt;https://spaces.ac.cn/archives/11729&lt;/a&gt;&lt;/li&gt;
&lt;/ol&gt;</description></item></channel></rss>