<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>LoveIt</title><link>https://koschei.top/</link><description>Hugo theme - LoveIt</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>nitianzero@gmail.com (Koschei)</managingEditor><webMaster>nitianzero@gmail.com (Koschei)</webMaster><copyright>This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.</copyright><lastBuildDate>Sat, 31 Jan 2026 00:49:00 +0800</lastBuildDate><atom:link href="https://koschei.top/index.xml" rel="self" type="application/rss+xml"/><item><title>[斯坦福CS336]作业二：系统与并行计算</title><link>https://koschei.top/cs336-assign2/</link><pubDate>Sat, 31 Jan 2026 00:49:00 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/cs336-assign2/</guid><description><![CDATA[<h2 id="1-作业概述">1 作业概述</h2>
<p>本次作业中，你将亲自动手实践提升单 GPU 训练速度和将训练扩展到多 GPU 的方法。</p>
<h3 id="需实现的内容">需实现的内容</h3>
<ol>
<li>基准测试与性能分析工具</li>
<li>FlashAttention-2 的 Triton 内核</li>
<li>分布式数据并行训练</li>
<li>优化器状态分片</li>
</ol>
<p>作业地址：
<a href="https://github.com/Kosthi/assignment2-systems" target="_blank" rel="noopener noreffer ">Assignment2-systems GitHub仓库</a></p>]]></description></item><item><title>[斯坦福CS336]作业五：对齐与推理强化学习</title><link>https://koschei.top/cs336-assign5/</link><pubDate>Tue, 13 Jan 2026 18:12:00 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/cs336-assign5/</guid><description><![CDATA[<h2 id="1-作业概述">1 作业概述</h2>
<p>本次作业中，你将获得训练语言模型解决数学问题时进行推理的实践经验。</p>
<h3 id="需实现的内容">需实现的内容</h3>
<ol>
<li>针对 Hendrycks 等人 [2021] 提出的竞赛数学问题数据集 MATH，实现零样本提示基线模型。</li>
<li>利用更强推理模型（DeepSeek R1，DeepSeekAI 等人，2025）的推理轨迹进行有监督微调（SFT）。</li>
<li>采用专家迭代（Expert Iteration）方法，通过验证奖励提升推理性能。</li>
<li>采用组相对策略优化（GRPO）方法，通过验证奖励提升推理性能。</li>
</ol>
<p>对于感兴趣的同学，我们将在未来几天发布可选作业部分：使语言模型与人类偏好对齐。</p>]]></description></item><item><title>[斯坦福CS336] 作业一：构建 Transformer 语言模型</title><link>https://koschei.top/cs336-assign1/</link><pubDate>Sat, 14 Jun 2025 17:43:58 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/cs336-assign1/</guid><description><![CDATA[<h2 id="为什么系统爱好者都应该学习大模型">为什么系统爱好者都应该学习大模型？</h2>
<p>在当今 AI 技术浪潮中，掌握大模型知识已成为系统开发者的必备技能。通过参与<strong>斯坦福 CS336 大模型系统课程</strong>，开始从零构建大模型的实践之旅。这门课程很可能在未来 3 年内成为系统领域的标杆课程（正如 CMU 15-445 数据库课程近年来的地位）。</p>]]></description></item><item><title>BPE 分词器高性能优化：从 10 分钟到 1 秒的实践</title><link>https://koschei.top/bpe-optimization/</link><pubDate>Sat, 14 Jun 2025 17:43:58 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/bpe-optimization/</guid><description><![CDATA[<blockquote>
<p>本文是 <a href="/posts/cs336-assign1/" rel="">CS336 作业一</a> 的延伸阅读，详细介绍 BPE 分词器的优化实现。</p>
</blockquote>
<h2 id="背景">背景</h2>
<p>文档中推荐使用的 cppyy 在 Mac 和 Linux 环境中有问题。为了追求高性能，我使用 Pybind11 来绑定 C++ 代码：预分词由 Python 处理，而 BPE 归并过程交给 C++。实际最大的瓶颈还是预分词，可以直接用已有的代码 <code>pretokenization_example.py</code> 做分块并行（8核 100s → 16核 30s）。</p>]]></description></item><item><title>通过开源项目申请 1Password OpenSource 以获得 Teams 订阅许可证</title><link>https://koschei.top/applying-1password-open-source-plan/</link><pubDate>Fri, 14 Mar 2025 23:18:00 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/applying-1password-open-source-plan/</guid><description>&lt;h2 id="写在开头">写在开头&lt;/h2>
&lt;p>当今，大部分平台已逐步从“一次性买断”过渡到“订阅制”，1Password 8 也是如此。公司为了维持经营、继续发展做出此番举动也并非不可理解。&lt;/p></description></item><item><title>Build Doris on MacBook M1</title><link>https://koschei.top/build-doris-on-macbook-m1/</link><pubDate>Sun, 09 Mar 2025 20:28:46 +0800</pubDate><author>Koschei</author><guid>https://koschei.top/build-doris-on-macbook-m1/</guid><description><![CDATA[<h2 id="安装环境依赖">安装环境依赖</h2>
<div class="code-block code-line-numbers open" style="counter-reset: code-block 0">
    <div class="code-header language-bash">
        <span class="code-title"><i class="arrow fas fa-chevron-right fa-fw" aria-hidden="true"></i></span>
        <span class="ellipses"><i class="fas fa-ellipsis-h fa-fw" aria-hidden="true"></i></span>
        <span class="copy" title="复制到剪贴板"><i class="far fa-copy fa-fw" aria-hidden="true"></i></span>
    </div><div class="highlight"><pre tabindex="0" class="chroma"><code class="language-shell" data-lang="shell"><span class="line"><span class="cl">brew install automake autoconf libtool pkg-config texinfo coreutils gnu-getopt <span class="se">\
</span></span></span><span class="line"><span class="cl">python@3 cmake ninja ccache bison byacc gettext wget pcre maven llvm@16 openjdk@17 npm</span></span></code></pre></div></div><p><em>Doris master 目前只支持 jdk17 版本</em></p>
<p>需要设置的环境变量</p>
<div class="code-block code-line-numbers open" style="counter-reset: code-block 0">
    <div class="code-header language-bash">
        <span class="code-title"><i class="arrow fas fa-chevron-right fa-fw" aria-hidden="true"></i></span>
        <span class="ellipses"><i class="fas fa-ellipsis-h fa-fw" aria-hidden="true"></i></span>
        <span class="copy" title="复制到剪贴板"><i class="far fa-copy fa-fw" aria-hidden="true"></i></span>
    </div><div class="highlight"><pre tabindex="0" class="chroma"><code class="language-shell" data-lang="shell"><span class="line"><span class="cl"><span class="nb">export</span> <span class="nv">JAVA_HOME</span><span class="o">=</span><span class="s2">&#34;/opt/homebrew/opt/openjdk@17/libexec/openjdk.jdk/Contents/Home&#34;</span>
</span></span><span class="line"><span class="cl"><span class="nb">export</span> <span class="nv">PATH</span><span class="o">=</span><span class="nv">$JAVA_HOME</span>/bin:<span class="nv">$PATH</span>
</span></span><span class="line"><span class="cl"><span class="nb">export</span> <span class="nv">PATH</span><span class="o">=</span><span class="s2">&#34;/opt/homebrew/opt/openjdk@17/bin:</span><span class="nv">$PATH</span><span class="s2">&#34;</span>
</span></span><span class="line"><span class="cl"><span class="nb">export</span> <span class="nv">PATH</span><span class="o">=</span><span class="s2">&#34;/opt/homebrew/opt/texinfo/bin:</span><span class="nv">$PATH</span><span class="s2">&#34;</span></span></span></code></pre></div></div><h2 id="拉取自己的代码">拉取自己的代码</h2>
<ol>
<li>
<p>拉取代码</p>]]></description></item></channel></rss>