3.1 公开可用的模型检查点或API
3.1.1 公开可用的通用大语言模型检查点
- LLaMA和LLaMA-2:7B,13B,34B,70B
- ChatGLM:6B
- Falcon:7B,40B,180B
- Baichuan 和 Baichuan-2:7B,13B
- InternLM 和InternLM-2:7B,20B
- Qwen:从0.5B 到72B 的不同参数规模版本
- Mistral:7B
- DeepSeek LLM:7B,67B
- Mixtral:MoE架构,46.7B,但处理时只会用到12.9B
- Gemma:2B和7B
- MiniCPM:2B
- YuLan-Chat:13B,65B