张弛 🎸

张弛

Tech Lead

Google

*
FlaxGPT

FlaxGPT

FlaxGPT 是一个简洁的GPT模型的Flax实现. 支持加载LLaMA2的checkpoint并进行文本生成.

LLaMA代码分析

LLaMA代码分析

通过对官方LLaMA代码分析, 学习现代Transformer的工作原理

Stable Diffusion Deep Dive 系列

Stable Diffusion Deep Dive 系列

在Stable Diffusion上做的各种实验, 包括sampling, lora finetune等等

T5论文笔记

T5论文笔记

T5是一个Encoder-Decoder架构的transformer. 它的训练过程使用了multi-task learning. 通过研究T5论文我们可以知道transformer模型的预训练中许多有趣的细节.

NesGym

NesGym

NESGym 是我在被 AlphaGo 的开创性成果所吸引后开始的一个个人项目。 当时,强化学习(RL)在机器学习界备受关注。值得注意的是,OpenAI 引入了一个强化学习实验环境来促进强化学习实验。 作为一个任粉,我觉得为任天堂红白机模拟器创建一个强化学习环境也很有趣。