LLM-basic

Pytorch

core

Transformer

MoE

MoE on NPU
MoE from scratch

DeepSeek

R1

pre-train
- GRPO R1-zero like recurrent from scratch on Qwen
post-training
- SFT for R1
- Distill for R1[黑盒]

V3

DeepSeek-V3 MoE from scratch
MTP
- MTP on Qwen
MLA

Knowledge Distillation

[白盒]

RL

pipeline

PPO
GRPO
DPO

TRL

ppo
reward model

personal_chatgpt

llama 源码阅读
LoRA & PEFT
DL

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
DeepSeek		DeepSeek
KnowledgeDistillation		KnowledgeDistillation
MoE		MoE
Pytorch		Pytorch
RL		RL
Transformer/transformer		Transformer/transformer
personal_chatgpt		personal_chatgpt
.DS_Store		.DS_Store
.gitignore		.gitignore
gitCommitOnly.bat		gitCommitOnly.bat
gitCommitOnly.sh		gitCommitOnly.sh
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LLM-basic

Pytorch

Transformer

MoE

DeepSeek

R1

V3

Knowledge Distillation

RL

pipeline

TRL

personal_chatgpt

About

Uh oh!

Releases

Packages

Uh oh!

Languages

www6v/LLM-basic

Folders and files

Latest commit

History

Repository files navigation

LLM-basic

Pytorch

Transformer

MoE

DeepSeek

R1

V3

Knowledge Distillation

RL

pipeline

TRL

personal_chatgpt

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages