Home

Awesome

开源开放基础大模型

旨在记录开源开发大模型发展情况,随时更新,欢迎在Issues中提供提供线索素材

使用数据请注明来源:微信公众号:走向未来仓库:https://github.com/wgwang/awesome-open-foundation-models

Awesome family related to LLMS includes:

大模型相关的Awesome系列包括:

微信扫码关注我的微信公众号:走向未来,分享有关大模型、AGI、知识图谱、深度学习、强化学习、计算机视觉、自然语言处理等等与人工智能有关的内容。

Star一下,举手之劳!

开源开放的基础大模型列表

序号名称参数规模数据规模发布时间说明
1LLaMA-27B,13B,34B,70B2T2023-07-18可商用
2Falcon7B,40B,180B3.5T2023-09-06数据集 RefinedWeb
3baichuan-27B,13B2.6T2023-09-06baichuan-1
4InternLM7B,20B2.3T开放,商用需授权
5BLOOM3B,7.1B,176B366B详细介绍
6GALACTICA6.7B,30B,120B106B开放的科学文本和数据
7LLaMA-17B,13B,30B,65B1.4T2023-02-24详细介绍
8MOSS-moon16B700B6.67x1022 FLOPs
9ChatGLM36B1.4T2023-10-25
10StableLM3B,7B800B
11RedPajama-INCITE3B,7B1T
12GPT-NeoX20B3.15M800GB的The Pile数据集
13OpenLLaMA3B,7B,13B1T
14MPT7B,30B1T
15Pythia2.8B,6.9B,12B300B
16XGen7B1.5T
17OPT6.7B,13B,30B,66B,175B180B
18Qwen-17B,14B,72B2.4T,3.0T,3.0T
19XVERSE13B,65B1.4T,2.6T
20Aquila27B,34B2T
21PrithviIBM+NASA,地理空间,100M(图片)
22Skywork13B3.2T2023-10-22昆仑万维·天工
23Deepseek Coder1.3B,6.7B,33B2T87% code and 13% 中英文文本
24Aquila7B2023-06-08悟道·天鹰
25Yi6B,34B3T2023-11-04零一万物
26Mistral7B欧洲
27Yuan-22B,51B,102B288B2023-12-21
28Mistral MoE46.7B2023-12-117BX8 MoE,12.9B/46.7B
29BlueLM7B2.6T2023-10-16https://github.com/vivo-ai-lab/BlueLM
30YAYI 230B2.65T2023-12-15https://github.com/wenge-research/YAYI2
31CodeShell7B0.5T2023-09-22https://github.com/WisdomShell/codeshell
32DeepSeek-V2236B8.1T2024-05-06MoE 21B/236B,160Experts,2Activate
33LLaMA-38B,70B15T2024-04-18
34QWen-1.50.5B,1.8B,4B,7B,14B,32B,72B2.4T,2.4T,2.4T,4T,4T,3T,3T2024-02-06
35QWen-1.5-110B110B2.2T2024-04-24
36DBRX132B12T2024-03-27MOE 36B/132B, 4/16experts
37Gemma-17B,2B6T2024-02-20终端设备
38Yi-1.56B,9B,34B3.5T2024-05-13零一万物,在Yi之上用了500B 语料增量训练得到
39Yi-VL6B,34B2024-01-18Clip ViT-H/14+Yi-6/34B-Chat,100M图文对
40Hunyuan-DiT1.5B2024-05-13腾讯混元文生图
41Command-R+104B4T2024-04-03Focus RAG
42Mistral-8X22B141B2024-4-178X22B MOE, 39B/141B
43Arctic480B3.5T2024-04-22Dense(10B)-MoE(128X3.66B), 17B/480B,3阶段训练,1T+1.5T+1T tokens
44Grok-1314B2024-03-17MoE 8 Expert
45InternLM27B,20B2.3T2023-09-18
46stableLM-212B2T2024-03-21
47Nemotron-4340B9T2024-06-14
48Qwen-20.5B,1.5B,7B,57B,72B7T2024-05-2357B是个MOE,64E选8的模型
49Skywork-MoE146B2024-06-0316EX13B,A:22B
50Gemma-29B,27B8T,13T2024-06-27
51Deepseek-Coder-V216B,236B10.2T2024-06-17MoE
52GLM-49B10T2024-06-05
53LLaMA-3.18B,70B,405B15T2024-07-23
54XVERSE-MoE255.4B2024-09-10
55Pixtral12B2024-09-10多模态

非基础大模型

模型架构

微信公众号:走向未来

欢迎扫码关注微信公众:走向未来,公众号专注于分享AGI、大模型、知识图谱、深度学习、强化学习等技术、系统架构、应用场景和案例等内容。

珠峰书

珠峰书《知识图谱:认知智能理论与实战》一书全面介绍了知识图谱的构建技术、存储技术和应用技术、Transformer、图神经网络等内容,欢迎购买。具体来说,包括: