主页
关于
浅色
深色
自动
中文 (简体)
English
Project
FlaxGPT
FlaxGPT 是一个简洁的GPT模型的Flax实现. 支持加载LLaMA2的checkpoint并进行文本生成.
Stable Diffusion Deep Dive 系列
在Stable Diffusion上做的各种实验, 包括sampling, lora finetune等等
NesGym
NESGym 是我在被 AlphaGo 的开创性成果所吸引后开始的一个个人项目。 当时,强化学习(RL)在机器学习界备受关注。值得注意的是,OpenAI 引入了一个强化学习实验环境来促进强化学习实验。 作为一个任粉,我觉得为任天堂红白机模拟器创建一个强化学习环境也很有趣。