更新于：2025-01-29

第三章大语言模型资源

3.1 公开可用的模型检查点或API

3.1.1 公开可用的通用大语言模型检查点

LLaMA和LLaMA-2：7B，13B，34B，70B
ChatGLM：6B
Falcon：7B，40B，180B
Baichuan 和 Baichuan-2：7B，13B
InternLM 和InternLM-2：7B，20B
Qwen：从0.5B 到72B 的不同参数规模版本
Mistral：7B
DeepSeek LLM：7B，67B
Mixtral：MoE架构，46.7B，但处理时只会用到12.9B
Gemma：2B和7B
MiniCPM：2B
YuLan-Chat：13B，65B

3.1.2 LLaMA 变体系列