3.1 公开可用的模型检查点或API

3.1.1 公开可用的通用大语言模型检查点

  • LLaMA和LLaMA-2:7B,13B,34B,70B
  • ChatGLM:6B
  • Falcon:7B,40B,180B
  • Baichuan 和 Baichuan-2:7B,13B
  • InternLM 和InternLM-2:7B,20B
  • Qwen:从0.5B 到72B 的不同参数规模版本
  • Mistral:7B
  • DeepSeek LLM:7B,67B
  • Mixtral:MoE架构,46.7B,但处理时只会用到12.9B
  • Gemma:2B和7B
  • MiniCPM:2B
  • YuLan-Chat:13B,65B

3.1.2 LLaMA 变体系列


本站由 @anonymity 使用 Stellar 主题创建。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。