Project

FlaxGPT 是一个简洁的GPT模型的Flax实现. 支持加载LLaMA2的checkpoint并进行文本生成.

FlaxGPT

Stable Diffusion Deep Dive 系列

在Stable Diffusion上做的各种实验, 包括sampling, lora finetune等等

NESGym 是我在被 AlphaGo 的开创性成果所吸引后开始的一个个人项目。当时，强化学习（RL）在机器学习界备受关注。值得注意的是，OpenAI 引入了一个强化学习实验环境来促进强化学习实验。作为一个任粉，我觉得为任天堂红白机模拟器创建一个强化学习环境也很有趣。

NesGym