Home

Awesome

Awesome Pretrained Chinese NLP ModelsAwesome

<div align="center"> <a href="https://arxiv.org/pdf/2303.18223.pdf">论文: A Survey of Large Language Models</a> </div>

在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新......

国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/

Expand Table of Contents

</details> </details> </details> </details>

备注

ND: Non-Causal Decoder or Prefix LM

CD: Causal Decoder

ED: Encoder-Decoder

Base-LLM

大规模基础模型:表格中只罗列出参数量大于7B以上模型。

模型大小时间语言领域下载项目地址机构/个人架构文献备注
XVERSE-MoE255B/A36B2024-09中英通用🤗HFXVERSE-MoE-A36Bxverse-aiMoE
Qwen-2.50.5/1.5/3/7/14/32/72B2024-09中英通用🤗HFQwen2.5QwenLMCDBlog
Tele-FLM52B/102B/1TB2024-07多语通用[🤗HF]/CofeAICDTele-FLM Technical Report
meta-llama-3.18/70/405B2024-07多语通用[🤗HF]llama3meta-llamaCD
internlm2.5-Base7B2024-07中英通用[🤗HF]InternLMStarInternLMCD📜Technical Report
MAP-NEO-Base2/7B2024-06中英通用🤗HFMAP-NEOmultimodal-art-projectionCDPaper
Nemotron-4-Base340B2024-06多语通用🤗HF/NVIDIACDtechnical report.
Index-Base1.9B2024-06中英通用🤗HFIndex-1.9BbilibiliCDReport
Qwen2-Base0.5/2/5/7/72B2024-06多语通用🤗HFQwen2QwenLMCDBlog
GLM-4-Base9B2024-06多语通用🤗HFGLM-4THUDM/
Yi-1.5-Base6/9/34B2024-05中英通用🤗HFYi-1.501-aiCDPaper
DeepSeek-V2-BaseA21B/236B2024-05中英通用🤗HFDeepSeek-V2deepseek-aiMOEPaper
Llama-3-Base8/70B2024-04多语通用🤗HFllama3Meta LlamaCD
Zhinao-Base7B2024-04中英通用🤗HF 🤖/奇虎科技CD
XVERSE-MoEA4.2B/25.8B2024-04中英通用🤗HFXVERSE-MoE-A4.2Bxverse-aiMoE
SoftTiger-Base13/70B2024-04中英通用🤗HFTigerBotTigerResearchCD
HammerLLM1.4b2024-04中英通用🤗HFHammerLLMDataHammer
Mengzi3-Base13B2024-04中英通用🤗HFMengzi3 StarLangboatCD
Breeze-Base7B2024-02中英通用🤗HF/MediaTek Research
TowerBase7/13B2024-02多语通用[🤗HF]/UnbabelCD
Qwen1.5-Base0.5/1.8/4<br>7/14/32/72/110B2024-02中英通用[🤗HF]Qwen1.5StarQwen/Blog
LongAlign-Base6/7/13B2024-02中英通用[🤗HF]LongAlignStarTHUDM/Paper
Chinese-Mixtral-Base8x7B2024-02中英通用[Baidu] [🤗HF]Chinese-MixtralStarYiming CuiMOE
iFlytekSpark-Base13B2024-01中英通用mindspore/科大讯飞CD
Orion-Base14B2024-01多语通用[🤗HF]OrionStarOrionStarAICDPaperRAG<br>Plugin
YaYi2-Base30B2023-12多语通用[🤗HF]YAYI2Starwenge-researchCDPaper
Aquila2-Base7/34/70B2023-12中英通用[🤗HF]Aquila2 StarFlagAICD
Alaya-Base7B2023-12中英通用[🤗HF]AlayaStarDataCanvasCD
Qwen-Base1.8/7<br/>14/72B2023-12中英通用[🤗HF]Qwen Star阿里云CDPaper Report Report2
DeepSeek-Base7/67B2023-11中英通用[🤗HF]DeepSeek-LLMStardeepseek-aiCD
Yuan-2.02/51<br/>102B2023-11中英通用baidu [🤗HF]Yuan-2.0StarIEIT-YuanCD
Alaya-Base7B2023-11中英通用[🤗HF]AlayaStarDataCanvasIOCD
Yi-Base6/9/34B2023-11中英通用[🤗HF]YiStar01.AICD
XVERSE-Base7/13<br/>65B2023-11多语通用[🤗HF]XVERSEStar元象科技CD
Nanbeige-Base16B2023-11中英通用[🤗HF]NanbeigeStarNanbeige LLM LabCD
LingoWhale8B2023-11中英通用[🤗HF]LingoWhale-8BStarDeepLang AICD
Skywork-base13B2023-10中文通用[🤗HF]Skywork StarSkyworkAICDPaper
BlueLM-Base7B2023-11中英通用[🤗HF]BlueLMStarvivo AI LabCD
Chatglm3-base6B2023-10中英通用[🤗HF]ChatGLM3StarTHUDMND
Ziya2-Base13B2023-10中英通用[🤗HF]Fengshenbang-LM StarIDEA研究院CD
OpenBA-LM15B2023-09中英通用[🤗HF]OpenBAStarOpenNLG GroupEDPaper
TigerBot-Base-70B80B2023-09多语通用[🤗HF]TigerBotStar虎博科技CDPaper
FLM101B2023-09中英通用[🤗HF]/CofeAICD
falcon7/40<br/>180B2023-09多语通用[🤗HF]/Technology Innovation InstituteCD
Baichuan27/13B2023-09中文通用[🤗HF]Baichuan2Star百川智能CD
Chinese-LLaMA-2-16K7/13B2023-08中英通用[🤗HF]Chinese-LLaMA-Alpaca-2 StarYiming CuiCD
YuLan-LLaMA-213B2023-08中英通用[🤗HF]YuLan-Chat Star中国人民大学CD
Aquila-Base-33B33B2023-08中英通用TODOAquilaStarFlagAICD
TigerBot-Base-13B13B2023-08多语通用[🤗HF]TigerBotStar虎博科技CD
Linly-Chinese-LLaMA-27/13B2023-07中英通用[🤗HF]Linly Star深圳大学计算机视觉研究所CD
Chinese-LLaMA-27B2023-07中英通用[🤗HF]Chinese-LLaMA-Alpaca-2StarYiming CuiCD
Jiang-base13B2023-07中文通用[🤗HF]/知未智能CD
bwx7/13B2023-07中文通用[🤗HF]/蓝鲸国数CD
Llama27/13<br/>70B2023-07多语通用[🤗HF]llamaStarMetaCDPaper
PolyLM13B2023-07多语通用[🤗HF]PolyLM达摩院CDPaper
Baichuan-13B13B2023-07中文通用[🤗HF]Baichuan-13BStar百川智能CD
TigerBot7B2023-07多语通用[🤗HF]TigerBotStar虎博科技CD
InternLM-base7/20B2023-07中文通用[🤗HF]InternLMStar上海人工智能实验室CDreport
MPT7/30B2023-06多语通用[🤗HF]llm-foundryStarMosaicMLCD
Baichuan7B2023-06中英通用[🤗HF]baichuan-7BStar百川智能CD
Chinese-Falcon7B2023-06中英通用[🤗HF]LinlyStar深圳大学计算机视觉研究所CDBlog
AtomGPT13B2023-06中英通用[🤗HF]/原子回声CD
Aquila7B2023-06中英通用[🤗HF]AquilaStarFlagAICD
Chinese-LLaMA33B2023-06中英通用[🤗HF]Chinese-LLaMA-AlpacaStarYiming CuiCD
TigerBot7B2023-06多语通用[🤗HF]TigerBotStar虎博科技CD
Panda-OpenLLaMA7B2023-05中英通用[🤗HF]pandallmStardandelionsllmCD
Panda7/13B2023-05中英通用[🤗HF]pandallmStardandelionsllmCD
OpenLLaMA13B2023-05中英通用[🤗HF]LinlyStar深圳大学计算机视觉研究所CD
BiLLa-LLM7B2023-05中英通用[🤗HF]BiLLaStarZhongli LiCD
Ziya-LLaMA-Reward7B2023-05中英通用[🤗HF]Fengshenbang-LMStarIDEA研究院CD
YuYan11B2023-04中文通用[🤗HF]/网易伏羲CDPaper
Chinese-LLaMA7/13/33B2023-04中文通用[🤗HF]LinlyStar深圳大学计算机视觉研究所CDBlog
OpenChineseLLaMA7B2023-04中英通用[🤗HF]OpenChineseLLaMAStarOpenLMLabCD
MOSS-00316B2023-04中英通用[🤗HF]MOSSStar复旦大学CD
BBT-2-Text13B2023-04中文通用申请BBT-FinCUGE-ApplicationsStar超对称CDPaper
BBT-2-Text12B2023-04中文通用申请BBT-FinCUGE-ApplicationsStar超对称CDPaper
Chinese-LLaMA13B2023-04中英通用[🤗HF]Chinese-LLaMA-AlpacaStarYiming CuiCD
flan-ul220B2023-03多语通用[🤗HF]ul2GoogleEDPaper
CPM-Bee10B2023-01中英通用[🤗HF]CPM-BeeStarOpenBMBCD
BLOOM176B2022-11多语通用[🤗HF]Megatron-DeepSpeed StarBigScienceCDPaper
BLOOMZ176B2022-11多语通用[🤗HF]Megatron-DeepSpeed StarBigScienceCDPaper
flan-t5-xxl11B2022-11多语通用[🤗HF]t5x StarGoogleEDpaper
CPM-Ant+10B2022-10中英通用BMBCPM-Live StarOpenBMBCDblog
GLM130B2022-10中英通用申请GLM-130BStar清华大学NDpaper
CPM-Ant10B2022-09中文通用[🤗HF]CPM-Live StarOpenBMBCDblog
GLM10B2022-09中文通用[🤗HF]GLM Star清华大学NDpaper
源1.0245B2021-09中文通用APIYian-1.0 Star浪潮CDpaper
CPM-210/11/<br/>200B2021-06中文通用申请CPMStar智源研究院EDpaper
PanGu-Alpha13/200B2021-05中文通用[🤗HF]PanGu-Alpha鹏城实验室CDpaper
PLUG27B2021-04中文通用申请AliceMind阿里巴巴ED
GPT-313/30B2021-04中文通用TODOGPT-3达摩院CD
<p align="right">[<a href="#top">Back to Top</a>]</p>

Domain-Base-LLM

各个垂直领域开源基础模型

模型大小时间语言领域下载项目地址机构/个人架构文献备注
Qwen-2.51.5/7B2024-09中英代码🤗HFQwen2.5QwenLMCDBlog
Qwen-2.51.5/7/72B2024-09中英数学🤗HFQwen2.5QwenLMCDBlog
Tongyi-Finance-Base14B2023-11中文金融ModelScope通义金融-14B通义金融大模型CD
ChiMed-GPT13B2023-10中文医疗[🤗HF]ChiMed-GPT中国科学技术大学CDPaper
CodeShell-base7B2023-10中英代码[🤗HF]codeshellStarWisdomShellCD
WiNGPT-base7B2023-09中文医学[🤗HF]WiNGPT2StarWinning Health AI ResearchCD
XuanYuan70B2023-09中文金融[🤗HF]XuanYuan Star度小满CDReport
CodeLLAma7/13/<br/>34B2023-08多语代码[🤗HF]codellamaStarMeta ResearchCDPaper
educhat-base-0027/13B2023-06中英教育[🤗HF]EduChatStar华东师范大学CD
AquilaCode-NV7B2023-06中英代码[🤗HF]AquilaStarFlagAICD
AquilaCode-TS7B2023-06中英代码[🤗HF]AquilaStarFlagAICD
LaWGPT7B2023-05中英法律[🤗HF]LawGPTStarPengxiao SongCD
CodeGeeX13B2022-06多语代码申请CodeGeeX清华大学CDblog
<p align="right">[<a href="#top">Back to Top</a>]</p>

ChatLLM

具备问答和对话等功能的大型语言模型。

模型大小时间语言领域下载项目地址机构/个人架构文献
Hunyuan-LargeA52/389B2024-11中英通用🤗HFTencent-Hunyuan-LargeTencentMoEPaper
Aya-Expanse8/32B2024-10多语通用🤗HF/Cohere For AICD
Granite 3.01/2/3/8B2024-10多语通用🤗HFgranite-3.0-language-modelsibm-graniteCDPaper
Granite 3.0-MoE1B/3B/A400M2024-10多语通用🤗HFgranite-3.0-language-modelsibm-graniteMoEPaper
TeleChat2115B2024-09中英通用🤖 ModelScopeTeleChat2Tele-AICD
Qwen-2.50.5/1.5/3/7/14/32/72B2024-09中英通用🤗HFQwen2.5QwenLMCDBlog
XVERSE-MoE255B/A36B2024-09中英通用🤗HFXVERSE-MoE-A36Bxverse-aiMoE
DeepSeek-V2.5236B/A21B2024-09中英通用🤗HFDeepSeek-V2deepseek-aiMOEPaper
MiniCPM34B2024-09中英通用🤗HFMiniCPMOpenBMBCDMiniCPM Paper
C4AI Command R+ 08-2024104B2024-08多语通用🤗HF/CohereForAICD
JIUTIAN-Chat39/A13B2024-07中英通用🤖MS/中国移动JiuTian-AIMOE
meta-llama-3.18/70/405B2024-07多语通用[🤗HF]llama3meta-llamaCD
internlm2.5-chat7B2024-07中英通用[🤗HF]InternLMStarInternLMCD📜Technical Report
Mistral-large-insruct-2407123B2024-07多语通用🤗HF/Mistral AIblog post
DeepSeek-V2-Chat-0628236B2024-07中英通用🤗HFDeepSeek-V2deepseek-aiMOEPaper
C4ai-command-r-plus104B2024-07多语通用🤗HF/CohereForAICD
Gemma-2-chat9/27B2024-06多语通用🤗HF/GoogleCD
MAP-NEO-Chat2/7B2024-06中英通用🤗HFMAP-NEOmultimodal-art-projectionCDPaper
GEB-Chat1.3B2024-06中英通用🤗HF/GEB-AGICDPaper
Nemotron-4-Chat340B2024-06多语通用🤗HF/NVIDIACDtechnical report.
Index-Chat1.9B2024-06中英通用🤗HFIndex-1.9BbilibiliCDReport
Qwen2-MoE57B/A14B2024-06多语通用🤗HFQwen2QwenLMMoEBlog
Qwen2-Chat0.5/2/5/7/72B2024-06多语通用🤗HFQwen2QwenLMCDBlog
GLM-4-Chat9B2024-06多语通用🤗HFGLM-4THUDM/
Skywork-MoE16/A22B/146B2024-06中英通用🤗HFSkywork-MoESkyworkAIMoETech Report
Yuan2.040/A3.7B2024-05中英通用🤗HFYuan2.0-M32IEIT-YuanMOEPaper
星辰-Chat52B2024-05中英通用🤗HFTeleChat-52BTele-AICD
LingLong317M2024-05中英通用🤗HFlinglongnkcs-iclabCD
Sailor14B2024-057语通用🤗HFsailor-llmsail-sgCDPaper
Nanbeige28/16B2024-05中英通用🤗HFNanbeigeNanbeigeCD
Yi-1.5-Chat6/9/34B2024-05中英通用🤗HFYi-1.501-aiCDPaper
DeepSeek-V2-ChatA21B/236B2024-05中英通用🤗HFDeepSeek-V2deepseek-aiMOEPaper
XVERSE-MoEA4.2B/25.8B2024-05中英通用🤗HFXVERSE-MoE-A4.2Bxverse-aiMOE
Llama3-zh8/70B2024-04中英通用🤗HF//CDllama3中文列表
Llama3-Chinese-Chat8B2024-04中英通用🤗HF/Shenzhi WangCD
Llama-3-Chat8/70B2024-04多语通用🤗HFllama3Meta LlamaCD
Zhinao-Chat7B2024-04中英通用🤗HF 🤖/奇虎科技CD
MiniCPM-MoE8x2B2024-04中英通用🤗HFMiniCPMOpenBMBMoE
Nanbeige2-Chat8B2024-04中英通用🤗HFNanbeigeNanbeige LLM LabCD
Sailor7B2024-04多语通用🤗HFsailor-llmSea AI LabCDPaper
Mengzi3-Chat13B2024-04中英通用🤗HFMengzi3 StarLangboatCD
Qwen-MoE2.7B2024-03中英通用🤗HFQwen1.5 StarQwenMoEBlog
Command-R35B2024-03多语通用🤗HF/CohereForAICD
Breeze-Instruct7B2024-02中英通用🤗HF/MediaTek Research
aya-10113B2024-02多语通用🤗HF/Cohere For AICDPaper
ChemLLM7B2024-02多语通用🤗HF/AI4ChemCDPaper
TowerInstruct7/13B2024-02多语通用[🤗HF]/UnbabelCD
Qwen1.5-Chat0.5/1.8/4/<br/>7/14/32/72/110B2024-02中英通用[🤗HF]Qwen1.5StarQwen/Blog
MiniCPM2B2024-02中英通用[🤗HF] ModelScopeMiniCPMStarOpenBMB/Report
LongAlign-Chat6/7/13B2024-02中英通用[🤗HF]LongAlignStarTHUDM/Paper
Chinese-Mixtral-Chat8x7B2024-02中英通用[Baidu] [🤗HF]Chinese-MixtralStarYiming CuiMOE
iFlytekSpark-Chat13B2024-01中英通用mindspore/科大讯飞CD
rwkv-5-world0.1/1/<br/>3/7B2023-01多语通用[🤗HF]RWKV-LMStarBlinkDLURL
Orion-Chat14B2024-01多语通用[🤗HF]OrionStarOrionStarAICDPaper
internlm2-chat7/20B2024-01中英通用[🤗HF]InternLMStarInternLMCDReport
Chinese-Mixtral8x7B2023-01中英通用[🤗HF]/HIT-SCIRCD-MOE
Telechat7/12B2024-01中英通用[🤗HF]Telechatx StarTele-AICDReport
kagentlms7/13B2024-01中英通用[🤗HF]KwaiAgentsStarKwaiKEG
YaYi2-Chat30B2023-12多语通用[🤗HF]YAYI2Starwenge-researchCDPaper
SUS-Chat34/72B2023-12中英通用[🤗HF]SUS-ChatStarSUSTech-IDEACD
Aquila2-Chat7/34/70B2023-12中英通用[🤗HF]Aquila2 StarFlagAICD
Alaya-Chat7B2023-12中英通用[🤗HF]AlayaStarDataCanvasCD
Qwen-Chat1.8/7/<br/>14/72B2023-12中英通用[🤗HF]Qwen Star阿里云CDPaper Report Report2
DeepSeek-Chat7/67B2023-11中英通用[🤗HF]DeepSeek-LLMStardeepseek-aiCD
Yi-Chat6/34B2023-11中英通用[🤗HF]Yi Star01.AICD
Alaya-Chat7B2023-11中英通用[🤗HF]AlayaStarDataCanvasIOCD
OrionStar-Yi-Chat34B2023-11中英通用[🤗HF]OrionStar-Yi-34B-ChatStarOrionStarAICD
Nanbeige-Chat16B2023-11中英通用[🤗HF]NanbeigeStarNanbeige LLM LabCD
OpenChat 3.57B2023-11中英通用[🤗HF]openchatOpenChatCDPaper
XVERSE-Chat7/13B2023-11多语通用[🤗HF]XVERSEStar元象科技CD
AndesGPT7B2023-11中文通用[🤗HF]AndesGPT-7BOPPO-Mente-LabCD
SeaLLM-Chat13B2023-11多语通用[🤗HF]SeaLLMsSeaLLMsCD
BlueLM7B2023-11中英通用[🤗HF]BlueLMStarvivo AI LabCD
Skywork-chat13B2023-10中文通用[🤗HF]SkyworkSkyworkAICDPaper
Zephyr7B2023-10多语通用[🤗HF]alignment-handbookStarHugging Face H4CDPaper
Mistral7B2023-10多语通用[🤗HF]mistral-srcStarMistral AICDPaper
chatglm36B2023-10中英通用[🤗HF]ChatGLM3StarTHUDMND
Zhiyin-chat7B2023-10中英通用[🤗HF]ZhiyinStar中科院声学所CD
Ziya2-Chat13B2023-10中英通用[🤗HF]Fengshenbang-LMIDEA研究院CD
Vulture40/180B2023-10多语通用[🤗HF]/VILM-AITODO
Vulture3/7/<br/>40/180B2023-09多语通用[🤗HF]/VILMCD
Colossal-LLaMA-27B2023-09中英通用[🤗HF]ColossalAIStarHPC-AI TechCDBlog
OpenBA-chat15B2023-09中英通用TODOOpenBAStarOpenNLG GroupEDPaper
WeMix-LLaMA27/70B2023-09中英通用[🤗HF]WeMix-LLMStarAlpha-VLLMCD
Stable Beluga7/13/70B2023-09中英通用[🤗HF]/Stability AICD
TigerBot-chat70B2023-09中英通用[🤗HF]TigerBot Star虎博科技CDPaper
Openbuddy_llama70B2023-09多语通用[🤗HF]OpenBuddyStarOpenBuddyCD
falcon-180B-chat180B2023-09多语通用[🤗HF]/Technology Innovation InstituteCD
Baichuan27/13B2023-09中文通用[🤗HF]Baichuan2Star百川智能CD
Chinese-Alpaca-2-16K7/13B2023-09中英通用[🤗HF]Chinese-LLaMA-Alpaca-2Yiming CuiCD
InternLM-Chat-8k7B2023-08中文通用[🤗HF]InternLMStar上海人工智能实验室CDreport
InternLM-Chat-v1.17B2023-08中文通用[🤗HF]InternLMStar上海人工智能实验室CDreport
YuLan-Chat-213B2023-08中英通用[🤗HF]YuLan-Chat中国人民大学CD
falcon7/40B2023-06多语通用[🤗HF][🤗HF]Technology Innovation InstituteCD
Toucan7B2023-08中英通用[🤗HF]Toucan-LLMStarKendryteCD
Zhuzhi6B2023-08中英通用[🤗HF]Zhuzhi-6BStar竹间智能ND
Atom7B2023-08中英通用[🤗HF]Llama2-ChineseStarFlagAlphaCD
openbuddy3/7/<br/>13/40B2023-08多语通用[🤗HF]OpenBuddyStarOpenBuddyCD
Aquila-Chat-33B33B2023-08中英通用TODOAquilaStarFlagAICD
vicuna-V1.5-16K7/13B2023-08多语通用[🤗HF]FastChatStarlm-sysCDPaper
vicuna-V1.57/13B2023-08多语通用[🤗HF]FastChatStarlm-sysCDPaper
Chinese-Alpaca-213B2023-08中英通用[🤗HF]Chinese-LLaMA-Alpaca-2Yiming CuiCD
WizardLM-V1.070B2023-08多语通用[🤗HF]WizardLMStaroperatorxCD
TigerBot-chat-13B13B2023-07中英通用[🤗HF]TigerBotStar虎博科技CD
huozi7B2023-08中英通用[🤗HF]huoziStar哈工大CD
Chinese-Alpaca-27B2023-07中英通用[🤗HF]Chinese-LLaMA-Alpaca-2StarYiming CuiCD
AntX7/13B2023-07中文通用[🤗HF]/AntX.aiCD
BatGPT15B2023-07中英通用[🤗HF]BatGPTStar上海交通大学NDPaper
WizardLM-V1.213B2023-07多语通用[🤗HF]WizardLMStaroperatorxCDPaper
llama2-Chinese-chat13B2023-07中英通用[🤗HF]llama2-Chinese-chatStarKe BaiCD
Jiang-chat13B2023-07中文通用[🤗HF]/知未智能CD
Llama2-chinese-chat7/13B2023-07中英通用[🤗HF]Llama2-ChineseStarFlagAlphaCD
LL7M7B2023-07多语通用[🤗HF]/Joseph CheungCD
Chinese-Llama-27B2023-07中英通用[🤗HF]Chinese-Llama-2-7bStarLinkSoul-AICD
Llama2-chat7/13/70B2023-07多语通用[🤗HF]llamaStarMetaCDPaper
PolyLM-chat13B2023-07多语通用[🤗HF]PolyLM达摩院CDPaper
Baichuan-13B-chat13B2023-07中文通用[🤗HF]Baichuan-13BStar百川智能CD
vicuna-V1.37/13/33B2023-07多语通用[🤗HF]FastChatStarlm-sysCDPaper
WizardLM-V1.07/13/30B2023-07多语通用[🤗HF]WizardLMStaroperatorxCDPaper
TigerBot-v2-sft7B2023-07多语通用[🤗HF]TigerBotStar虎博科技CD
InternLM-chat7/20B2023-07中文通用[🤗HF]InternLMStar上海人工智能实验室CDreport
vicuna汉化版33B2023-07中文通用baidu-hikschinese-StableVicunaStarziwang-comCD
CuteGPT13B2023-07中英通用[🤗HF]CuteGPTStar复旦大学知识工场CD
MPT-chat7/30B2023-06多语通用[🤗HF]llm-foundryStarMosaicMLCD
ChatGLM26B2023-06中英通用[🤗HF]ChatGLM2-6BStar清华大学ND
BayLing7/13B2023-06中英通用[🤗HF]BayLingStar中国科学院CD
ZhiXi-Diff13B2023-06中英通用[🤗HF]KnowLLMStar浙江大学CD
Anima33B2023-06中文通用[🤗HF]AnimaStarGavin LiCD
OpenLLaMA-Chinese3/7/13B2023-06中文通用[🤗HF]OpenLLaMA-ChineseStarFittenTechCD
openbuddy-falcon-7b-v1.57B2023-06多语通用[🤗HF]OpenBuddyStarOpenBuddyCD
AtomGPT_chat13B2023-06中英通用[🤗HF]AtomGPTStar原子回声CD
AquilaChat7B2023-06中英通用[🤗HF]AquilaStarFlagAICD
YuLan-Chat13/65B2023-06中英通用[🤗HF]YuLan-ChatStar中国人民大学CD
Chinese-Alpaca33B2023-06中文通用[🤗HF]Chinese-LLaMA-AlpacaStarYiming CuiCD
TigerBot-sft7/180B2023-06多语通用[🤗HF]TigerBotStar虎博科技CD
ChatYuan7B2023-06中英通用[🤗HF]ChatYuan-7BStarClueAICD
Panda-Instruct13B2023-05中英通用[🤗HF]pandallmStardandelionsllmCD
Panda-Instruct7B2023-05中英通用[🤗HF]pandallmStardandelionsllmCD
BiLLa-SFT7B2023-05中英通用[🤗HF]BiLLaStarZhongli LiCD
Ziya-LLaMA-v113B2023-05中英通用[🤗HF]Fengshenbang-LMStarIDEA研究院CDBlog
BLOOMChat V1.0176B2023-05多语通用[🤗HF]bloomchatSambaNova SystemsCDBlog
BiLLa7B2023-05中英通用[🤗HF]BiLLaStarZhongli LiCD
Bactrian-X7/13B2023-05多语通用[🤗HF]bactrian-xStarMBZUAICD
Bactrian-ZH7B2023-05中文通用[🤗HF]bactrian-xStarMBZUAICD
ChatFlow7/13B2023-05中英通用[🤗HF]LinlyStar深圳大学计算机视觉研究所CD
OpenBuddy7/13B2023-05多语通用[🤗HF]OpenBuddyStarOpenBuddyCD
YuYan-dialogue11B2023-04中文通用[🤗HF]/网易伏羲CDpaper
Moss-moon-003-sft-plugin16B2023-04中英通用[🤗HF]MOSSStar复旦大学CD
moss-moon-003-sft16B2023-04中英通用[🤗HF]MOSSStar复旦大学CD
RWKV-4-Raven3/7/14B2023-04中英通用[🤗HF]ChatRWKVStarBlinkDLRNNBlog
Phoenix-inst-chat7B2023-04中文通用[🤗HF]LLMZooStar香港中文大学CD
Phoenix-chat7B2023-04中文通用[🤗HF]LLMZooStar香港中文大学CD
ChatPLUG3.7B2023-04中文通用[🤗HF]ChatPLUGStar阿里巴巴EDPaper
Chinese-Alpaca13B2023-04中文通用[🤗HF]Chinese-LLaMA-AlpacaStarYiming CuiCD
BELLE-LLAMA13B2023-04中文通用[🤗HF]BELLEStar贝壳CD
LLaMA-tuned7/13/<br/>33/65B2023-04中文通用[🤗HF]LMFlowStar香港科技大学CD
Chinese-Vicuna7/13B2023-03中文通用[🤗HF]Chinese-VicunaStarFacicoCD
ChatYuan-V20.7B2023-03中英通用[🤗HF]ChatYuanStar元语智能ED
Chinese-Alpaca7B2023-03中文通用[🤗HF]Chinese-LLaMA-AlpacaStarYiming CuiCD
Luotuo7B2023-03中文通用[🤗HF]Chinese-alpaca-lora华中师范大学CD
BELLE-LLAMA7B2023-03中英通用[🤗HF]BELLEStar贝壳CD
ChatGLM6B2023-03中英通用[🤗HF]ChatGLM-6BStar清华大学ND
<p align="right">[<a href="#top">Back to Top</a>]</p>

Domain-ChatLLM

开源的垂直领域对话大模型

模型大小时间语言领域下载项目地址机构/个人架构文献
Qwen-coder-2.50.5/1.5/14/32B2024-11中英代码🤗HFQwen2.5-CoderQwenLMCDPaper
OpenCoder-Instruct1.5/8B2024-11中英代码🤗HFOpenCoder-llmOpenCoder-llmCDPaper
珠算2.7B2024-09中英代码🤗HFAbacusHIT-SCIRCD
Qwen-2.5-code1.5/7B2024-09中英代码🤗HFQwen2.5QwenLMCDBlog
Qwen-2.5-math1.5/7/72B2024-09中英数学🤗HFQwen2.5QwenLMCDBlog
Yi-Coder1.5/9B2024-09中英代码🤗 Hugging Face🤖 ModelScope🟣 wisemodelYi-Coder01-aiCDPaper Blog
CodeGeeX49B2024-07多语代码🤗HFCodeGeeX4THUDM
DeepSeek-Coder-V2A16B/236B2024-06中英代码🤗HFDeepSeek-V2deepseek-aiMoEPaper
AutoCoder6.7/33B2024-06/代码🤗HFAutoCoderBin LeiCDPaper
Codestral22B2024-05/代码🤗HF/mistralai/Blog
CodeQwen1.5-Chat7B2024-04中英代码🤗HFQwen1.5QwenCDBlog
codegemma2/7B2024-04多语代码🤗HF/Google
WaveCoder6.7B2024-04多语代码🤗HFWaveCodermicrosoftPaper
ChemDFM13B2024-03中英化学🤗HF/OpenDFMCDPaper
starcoder23/7/15B2024-02中英代码🤗HFstarcoder2bigcode-projectCDPaper
TuringMM-Chat34B2024-02中英教育🤗HuggingFace 🤖ModelScope/光年无限CD
deepseek-moe16B2024-01中英代码[🤗HF]DeepSeekMoEStarDeepSeekCD-MOE
Code Millenials1/3/<br/>13/34B2023-01多语代码[🤗HF]code-millenialsStarBudEcosystemCD
WizardCoder15/33B2024-01多语代码[🤗HF]WizardLMStaroperatorxCDPaper
DeepSeek-Coder1/7/33B2023-11中英代码[🤗HF]DeepSeek-CoderStardeepseek-aiBlog
Phind34B2023-10多语代码[🤗HF]/PhindCDBlog zh
Tongyi-Finance-Chat14B2023-11中文金融ModelScope通义金融-14B-Chat通义金融大模型CD
Skywork-math13B2023-10中文数学[🤗HF]SkyworkStarSkyworkAICDPaper
XuanYuan-Chat70B2023-10中英金融[🤗HF]XuanYuanStarDuxiaoman度小满CD
zhilu13B2023-10中英金融[🤗HF]/SYSU-MUCFC-FinTech-Research-CenterCD
TestGPT7B2023-10中文测试[🤗HF]Test-AgentStarcodefuse-aiCD
cross7/13B2023-10多语数学[🤗HF]/MathoctopusCD
CodeFuse13/14/<br/>15/34B2023-10中文代码[🤗HF]MFTCoderStarcodefuse-aiCD
Taiyi7B2023-10中英医学[🤗HF]Taiyi-LLMStarDUTIR-BioNLPCD
CodeShell-chat7B2023-10中英代码[🤗HF]codeshellStarWisdomShellCD
DISC-LawLLM13B2023-09中文法律[🤗HF]/ShengbinYueCDReport
WiNGPT-chat7B2023-09中文医学[🤗HF]WiNGPT2StarWinning Health AI ResearchCD
ziya-coding15/34B2023-09中英代码[🤗HF]Fengshenbang-LMIDEA研究院CD
AgriGPT6/13b2023-09中文农业[🤗HF]AgriGPTsStarAgriGPTs
XuanYuan-chat70B2023-09中文金融TODOXuanYuan度小满CDReport
夫子•明察6B2023-09中文司法[🤗HF]fuzi.mingchaStar山东大学ND
仲景13B2023-09中文医学[🤗HF]ZhongjingStarSonghua YangCDPaper
CodeFuse13/34B2023-09中英代码[🤗HF]MFTCoderStarcodefuse-aiCD
EcomGPT7B2023-09中英电商TODOEcomGPTStarAlibaba
DISC-MedLLM13B2023-08中文医疗[🤗HF]DISC-MedLLMStarFudanDISCCDPaper
K27B2023-08中英科学[🤗HF]k2StardavenCD
CodeLLAma7/13/34B2023-08多语代码[🤗HF]codellamaStarMeta ResearchCDPaper
sqlcoder15B2023-08中英代码[🤗HF]sqlcoderStarDefog.aiCD
智海-录问7B2023-08中文法律[🤗HF]wisdomInterrogatoryStarzhihaiLLMCD
WizardMath-V1.07/13/70B2023-08多语数学[🤗HF]WizardLMStaroperatorxCD
QiaoBan7B2023-08中文情感[🤗HF]QiaoBenStar哈尔滨工业大学
HuangDi13B2023-08中文中医[🤗HF]HuangDIStarZlasejdCD
ZhongJing2023-08中文中医TODOCMLM-ZhongJingStar复旦大学
TCMLLM6B2023-08中文中医[🤗HF]TCMLLMStar2020MEAIND
AutoAudit7B2023-07中文安全[🤗HF]AutoAuditStarJiaying LiCD
Lychee10B2023-07中文法律[🤗HF]lychee_lawStardavidpigND
IvyGPT6B2023-07中文医学[🤗HF]IvyGPTStarWangRongsheng
MING7B2023-07中文医学[🤗HF]MINGStar上海交通大学CD
Mozi7B2023-07中英科技[🤗HF]science-llmStarGMFTBYCD
StarGLM6B2023-07中文天文[🤗HF]StarGLMStarLI YUYANGND
TransGPT7B2023-07中英交通[🤗HF]TransGPTStar北京交通大学CD
CodeGeeX26B2023-07中英代码[🤗HF]CodeGeeX2Star清华大学ND
Yayi-llama27/13B2023-07中英舆情[🤗HF]YayiStar中科闻歌CD
Ziya-Writing13B2023-07中英写作[🤗HF]Fengshenbang-LMIDEA研究院CD
MindChat13B2023-07中文心理[🤗HF]MindChatStar华东理工大学CD
ShenNong-TCM-LLM7B2023-07中英医学[🤗HF]ShenNong-TCM-LLMStarmichael-wzhuCD
ailawyer13B2023-07中英法律[🤗HF]JurisLMsStaropenkgCD
educhat7B/13B2023-06中英教育[🤗HF]EduChatStar华东师范大学CD
Sunsimiao7B2023-06中英医学[🤗HF]SunsimiaoStar华东理工大学CD
Media LLaMA7B2023-06中文媒体baiduMedia-LLaMAStar智媒开源研究院CD
PULSE7/14B2023-06中文医学[🤗HF]PULSEStarOpenMEDLabCD
ChatLaw13/33B2023-06中文法律[🤗HF]ChatLawStar北京大学CD
BaoLuo6B2023-06中文法律[🤗HF]BaoLuo-LawAssisantStarLeiZiND
CoLLaMA7B2023-06中英代码[🤗HF]CoLLaMAStarDenilahCD
TechGPT7B2023-06中英教育[🤗HF]TechGPTStar东北大学CD
Yayi7B2023-06中英舆情[🤗HF]YayiStar中科闻歌CD
MeChat6B2023-06中文医学[🤗HF]smileStarqiuhuachuanND
ziya-medical13b2023-06中英医学[🤗HF]MedicalGPTStarMing XuCD
Taoli7B2023-06中英教育待开源taoliStar北京语言大学CD
Lawyer-llama13B2023-06中英法律[🤗HF]lawyer-llamaStarQuzhe HuangCD
QiZhen-CaMA13B2023-06中英医学[🤗HF]QiZhenGPTStar浙江大学CD
扁鹊-2.06B2023-06中文医学[🤗HF]BianQueStar华南理工大学ND
SoulChat6B2023-06中文心理[🤗HF]SoulChatStar华南理工大学ND
HanFei7B2023-05中文法律baidu-d6t5HanFeiStar中国科学院深圳先进院CD
QiZhen6B2023-05中英医学[baidu]QiZhenGPTStar浙江大学CD
ChatMed-Consult7B2023-05中英医学[🤗HF]ChatMedStarmichael-wzhuCD
LaWGPT-beta1.17B2023-05中英法律[🤗HF]LawGPTStarPengxiao SongCD
Cornucopia7B2023-05中英金融[🤗HF]Cornucopia-LLaMA-Fin-ChineseStaryuyangmuCD
HuatuoGPT7B2023-05中文医学[🤗HF]HuatuoGPT香港中文大学CDPaper
LexiLaw6B2023-05中文法律[🤗HF]LexiLawHaitao LiNDPaper
XuanYuan176B2023-05中文金融申请XuanYuanStar度小满CDPaper
LawGPT6B2023-05中文法律[🤗HF]LAW-GPTStarhongchengliuN
扁鹊-1.00.7B2023-04中文医学[🤗HF]BianQuescutcyrED
ChatGLM-Med6B2023-04中文医学[🤗HF]Med-ChatGLMStar哈尔滨工业大学ED
BenTsao7B2023-04中文医学[🤗HF]Huatuo-Llama-Med-ChineseStar哈尔滨工业大学CD
DoctorGLM6B2023-04中文医学TODODoctorGLMStarxionghonglinND
Firefly1/2/7B2023-04中文文化[🤗HF]FireflyStarYang JianXinCD
ChatRWKV7B2023-01中英小说[🤗HF]ChatRWKVStarBlinkDLRNNBlog
<p align="right">[<a href="#top">Back to Top</a>]</p>

MultiModal-ChatLLM

收集包含中文的多模态大模型,具备对话等功能。

模型大小时间语言模型非语言模型语言领域下载项目地址机构/个人文献
fish-agent3B2024-11Qwen-2.5/多语文音🤗 Huggingfacefish-speechfishaudio
GLM-4-Voice9B2024-10GLM-4-9BWhisper中英文音🤗 HuggingfaceGLM-4-VoiceTHUDM
Pangea7B2024-10Qwen2-7B-InstructLLaVA-NeXT多语图文🤗HFPangeaneulabPaper
GOT-OCR-2.0/2024-09Qwen/中英图文🤗HFGOT-OCR2.0StepFun-AIPaper
Ovis-1.69B2024-09Gemma2-9B-ItSiglip-400M中英图文🤗OvisAIDC-AIPaper
Qwen2-VL2/7/72B2024-08//多语图文视🤗 🤖Qwen2-VLQwenLM
CogVideoX2/5B2024-08//中英文视🤗 linkCogVideoTHUDM
MiniCPM-V 2.68B2024-08Qwen2-7BSigLip-400M中英文图视🤗 linkMiniCPM-VOpenBMB
InternVL21/2/4/8/26/40/76B2024-07Qwen2/internlm2/llama3InternViT中英文图🤗 link 🤖 linkInternVLOpenGVLabreport
Qwen2-Audio8.2B2024-07Qwen2Whisper-large-V3中英文音🤗HFQwen2-AudioQwenLMreport
Kolors/2024-07ChatGLM3-Base/中英文图🤗HFKolorsKwai-KolorsPaper
ChatTTS/2024-06//中英文音🤗HFChatTTS2noise/
GLM-4V9B2024-06GLM-4/多语文图🤗HFGLM-4THUDM/
HunyuanDiT1.5B2024-05multilingual T5 encoderCLIP中英文图🤗HunyuanDiTTencentPaper
CogVLM22024-05Meta-Llama-3-8B-Instruct/中英文图🤗CogVLMSkip to content
360VL8/70B2024-05LLama3CLIP-ViT中英文图🤗360VL360CVGroup
XVERSE-V13B2024-05XVERSE-13B-Chatclip-vit-large-patch14-224中英文图🤖XVERSE-V-13Bxverse-ai
MiniCPM-V 2.02.8B2024-04MiniCPM-2.4BSigLip-400M中英文图🤗 🤖MiniCPM-VOpenBMBBlog
Qwen-Audio7B2024-03Qwen-7BWhisper-large-v2中英文音🤗HFQwen-Audio StarQwenPaper
DeepSeek-VL1.3/7B2024-03DeepSeekSigLip/SAM中英图文🤗HFDeepSeek-VLStardeepseek-aiPaper
OmniLMM3/12B2024-02MiniCPMSigLip中英图文🤗HFOmniLMMStar[OpenBMB](https://github.com/01-ai)
MiniCPM-V3B2024-02MiniCPM-2.4BSigLip-400M中英图文🤗HFOmniLMMStar[OpenBMB](https://github.com/01-ai)
Yi-VL6/34B2024-01YiCLIP-VIT中英图文[🤗HF]YiStar01-ai
Lyrics14B2023-12//中英图文[🤗HF]Fengshenbang-LMIDEA研究院
Qwen-Audio7B2023-12Qwen-7BWhisper-large-v2中英文音[🤗HF]Qwen-AudioStarQwenPaper
SPHINX13B2023-10//中英图文[🤗HF]LLaMA2-AccessoryStarAlpha-VLLM
Skywork-MM13B2023-10//中英图文[🤗HF]SkyworkSkyworkAIPaper
CogVLM7/14B2023-10QwenViT中英图文[🤗HF]/CausalLM
fuyu8B2023-10//中英图文[🤗HF]/Adept AI LabsBlog
Ziya-Visual14B2023-10LLaMAInstructBLIP中英图文[🤗HF]Fengshenbang-LMStarIDEA研究院Paper
CogVLM17B2023-10EVA2-CLIP-EVicuna-v1.5中英图文TODOCogVLMStarTHUDMPaper
idefics9/80B2023-10LLaMACLIP-ViT中英图文[🤗HF]/HuggingFaceM4log
InternLM-XComposer7B2023-10InternLMEVA-CLIP中英图文[🤗HF]InternLM-XComposerStarInternLMReport
WeMix-LLM13B2023-09LLama2/中英图文[🤗HF]WeMix-LLMStarAlpha-VLLM
Vally7/13B2023-08BelleGroup/BELLE-LLaMA-EXTOFA-Sys/chinese-clip-vit-large-patch14中英图文[🤗HF] [🤗HF]ValleyStar罗瑞璞Paper
SALMONN/2023-08//中英语音TODOSALMONNStarBytedance
IDEFICS9/80B2023-08llamaCLIP-ViT中英图文-通用[🤗HF]m4-logsStarHuggingFaceM4Paper
Qwen-VL7B2023-08Qwen-7BOpenclip ViT-bigG中英通用[🤗HF]Qwen-VLStar阿里云
Qwen-VL-chat7B2023-08Qwen-7BOpenclip ViT-bigG中英通用[🤗HF]Qwen-VLStar阿里云
LLasM7B2023-07Chinese-Llama2whisper-large-v2中英语音[🤗HF]LLaSMStar北京灵琐
Chinese-LLaVA7B2023-07Chinese-Llama2Clip-vit中英视觉[🤗HF]Chinese-LLaVAStar北京灵琐
RemoteGLM6B2023-07VisualGLM-6BVisualGLM-6B中文遥感TODORemoteGLMStarlzw-lzw
VisualCLA7B2023-07Chinese-Alpaca-PlusCLIP-ViT-L/14中文视觉[🤗HF]Visual-Chinese-LLaMA-AlpacaStarZiqing Yang
yuren7B2023-07baichuan-7BCLIP中英视觉[🤗HF]yuren-baichuan-7bStarPleisto
VisCPM-Chat10B2023-06CPM-BeeQ-Former中英视觉[🤗HF]VisCPMStarOpenBMB
VisCPM-Paint10B2023-06CPM-BeeStable Diffusion 2.1中英视觉[🤗HF]VisCPMStarOpenBMB
XrayPULSE7B2023-06PULSEMedCLIP中文医学[🤗HF]XrayPULSEStarOpenMEDLab
SEEChat6B2023-06ChatGLMCLIP-ViT中文/[🤗HF]SEEChatStar360
Ziya-BLIP2-14B-Visual-v114B2023-06LLaMA-13BBLIP2中英通用[🤗HF]Fengshenbang-LMStarIDEA研究院
Video-LLaMA-BiLLA7B2023-05BiLLa-7BMiniGPT-4中英通用[🤗HF]Video-LLaMAStar达摩院多语言NLPPaper
Video-LLaMA-Ziya13B2023-05Ziya-13BMiniGPT-4中英通用[🤗HF]Video-LLaMAStar达摩院多语言NLPPaper
XrayGLM6B2023-05ChatGLM-6BBLIP2-Qformer中英医学[🤗HF]XrayGLMStar澳门理工大学
X-LLM2023-05ChatGLMViT-g中文/TODOX-LLMStar中科院自动化所Paper
VisualGLM6B2023-05ChatGLM-6BBLIP2-Qformer中英视觉[🤗HF]VisualGLM-6BStar清华大学
<p align="right">[<a href="#top">Back to Top</a>]</p>

中文指令数据集

收集包含中文的指令数据集,用于微调语言模型。

名称大小时间语言下载项目地址作者备注
FinCorpus50G2023-09中文datasetXuanYuan度小满金融领域
TransGPT-sft346k2023-07中文datasetTransGPT北京交通大学
TransGPT-pt58k2023-07中文datasetTransGPT北京交通大学
ShareGPT-Chinese-English90K2023-07中英datasetllama2-Chinese-chatStarKe Bai
educhat-sft-002-data-osm400w2023-06中英datasetEduChat华东师范大学教育
chatgpt-corpus3M2023-06中文datasetchatgpt-corpusplex
Simle350k2023-06中文datasetsmileqiuhuachuan心理健康
QiZhen20k2023-06中文datasetQiZhenGPT浙江大学医学
BayLing-80802023-06中英datasetBayLing中国科学院多轮指令
Tigerbot-dataset120k2023-06中英datasetTigerBot虎博科技
lawyer-llama/2023-05中文datasetlawyer-llamaQuzhe Huang法律
Bactrian-X67K2023-05多语datasetbactrian-xMBZUAI
CrimeKgAssitant52k2023-05中文datasetLAW-GPThongchengliu法律
moss-002-sft-data1.1M2023-04中英datasetMOSS复旦大学
moss-003-sft-data1.1M2023-04中英datasetMOSS复旦大学
moss-003-sft-plugin-data300K2023-04中英datasetMOSS复旦大学
Safety-Prompts100K2023-04中文datasetSafety-Prompts清华大学评测平台
OASST1/2023-04多语datasetOpen-AssistantOpenAssistant
ShareChat90K2023-04中英datasetShareChatczhko
GPT-4-LLM52K2023-04中文datasetGPT-4-LLMInstruction-Tuning-with-GPT-4paper
COIG200K2023-04中文datasetFlagInstructBAAIpaper
RedGPT50k2023-04中文datasetRedGPTMiniGPT
shareGPT_cn20k2023-04中文datasetshareGPT_cnshareAI
generated_chat_0.4M0.4M2023-04中文datasetBELLEKe Technologies角色对话
multiturn_chat_0.8M0.8M2023-04中文datasetBELLEKe Technologies多轮任务
school_math_0.25M0.25M2023-04中文datasetBELLEKe Technologies数学题
Zhihu-KOL/2023-03中文 datasetZhihu-KOLRui Wang
InstructionWild104k2023-03中英datasetInstructionWildXue Fuzhao
Alpaca-CoT/.2023-03中英datasetAlpaca-CoTQingyi Si
GuanacoDataset/2023-03多语datasetguanaco-modelGuanaco
Traditional-Chinese-alpaca52K2023-03中文datasetTraditional-Chinese AlpacaNTU NLP Labgpt翻译
alpaca_chinese_dataset/2023-03中文datasetalpaca_chinese_datasetakou人工校验
alpaca-chinese-dataset/2023-03中文datasetalpaca-chinese-datasetcarbonz机器翻译
train_2M_CN2M2023-03中文datasetBELLEKe Technologies
train_1M_CN1M2023-03中文datasetBELLEKe Technologies
train_0.5M_CN0.5M2023-03中文datasetBELLEKe Technologies
HC3 人类-ChatGPT 问答/2023-03中文datasetchatgpt-comparison-detectionSimpleAI
firefly-train-1.1M1.1M2023-03中文datasetFireflyJianxin Yang
<p align="right">[<a href="#top">Back to Top</a>]</p>

Embedding

MTEB排行榜: https://huggingface.co/spaces/mteb/leaderboard 镜像

模型大小时间语言领域下载项目地址机构/个人
JinaColBERT V2large2024-08多语通用[🤗HF]/Jina AIPaper
Conan-embedding-v1large2024-08中文通用[🤗HF]/TencentABCPaper
xiaobu-v2large2024-07中文通用[🤗HF]/lier007
zpoint_largeLarge2024-06中文通用[🤗HF]/yang
BCE279M2024-01多语通用[🤗HF]BCEmbeddingnetease-youdao
CohereBase2023-09多语通用[🤗HF]/CohereBlog
jinaBase2023-10中英通用[🤗HF]/Jina AI
Dmeta400MB2024-02中文通用[🤗HF]/DMetaSoul
bge-m32024-02中文通用[🤗HF]/BAAIPaper
tao-8k2023-11中文通用[🤗HF]amu
bges/b/l2023-10中文通用[🤗HF]/BAAI
gte-zhs/b/l2023-08中文通用[🤗HF]/Alibaba DAMOPaper
m3es/b/l2023-06中文通用[🤗HF]/Moka-AI
LaBSE多语通用[🤗HF]/Sentence Transformers
<p align="right">[<a href="#top">Back to Top</a>]</p>

大模型评估基准

1. C-Eval Star

C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,查看论文了解更多细节。

[官方网站] [Github] [论文]

2. FlagEval Star

FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具,对多领域(如语言、语音、视觉及多模态)的基础模型进行多维度(如准确性、效率、鲁棒性等)的评测。我们希望通过对基础模型的评测,加深对基础模型的理解,促进相关的技术创新及产业应用。

[官方网站] [Github]

3. SuperCLUElyb Star

SuperCLUE琅琊榜,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。在本文中,我们发布了初步的结果和基于Elo评级系统的排行榜,Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新的模型,并通过提问和投票选出你最喜欢的答案来评估它们。

[官方网站] [Github]

4. XiezhiBenchmark Star

该基准包括来自13个不同学科的516个学科的220,000个多项选择题,以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估,结果表明在科学、工程、农学、医学和艺术等领域,大型语言模型的表现超过了人类的平均水平,但在经济学、法学、教育学、文学、历史和管理学等领域,人类的表现仍然远远超过了大型语言模型。

[官方网站] [Github] [论文]

5. Open LLM Leaderboard

由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型,以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。

[官方网站]

6. 中文大模型安全评测平台 Star

大模型安全测评依托于一套系统的安全评测框架,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别。

[官方网站] [Github] [论文]

7. OpenCompass大语言模型评测 Star

OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术,即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式,包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力。

[官方网站] [Github]

<p align="right">[<a href="#top">Back to Top</a>]</p>

在线体验大模型

:需要申请或者注册方可体验,更多见Github

1. ChatGPT--OpenAI

OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0.

[官方网站]

2. New bing--微软

NewBing是微软在2023年3月推出的一款全新的搜索引擎,它基于OpenAI的大型语言模型(LLM),并结合了ChatGPT和DALL·E的技术,为用户提供了一个AI驱动的网络助手。

[官方网站]

3. 文心一言--百度

百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

[官方网站]

4. 通义大模型--阿里

阿里大模型统一品牌,覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”

[官方网站]

5. 星火认知大模型--科大讯飞

科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

[官方网站]

6. Claude--Anthropic

Claude,是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。

[官方网站]

7. ChatGLM--智谱AI

基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双语大模型。

[官方网站]

8. 天工大模型--昆仑万维

天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。

[官方网站]

9. 序列猴子大模型--出门问问

序列猴子大模型是一个具有长序列、多模态、单模型、大数据等特点的超大规模语言模型,基于其通用的表示能力与推理能力,能够进行多轮交互,打造更便捷流畅的用户体验,极大地提高了生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

[官方网站]

10. MOSS--复旦大学

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型

[官方网站]

11. 360智脑大模--360

360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。

[官方网站]

12. 曹植GPT大语言模型--达观数据

达观数据积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务

[官方网站]

13. 日日新--商汤

商汤“日日新SenseNova”大模型体系,正式问世

不仅展示了大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,还揭开了依托商汤AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。

[官方网站]

14. 天燕大模型--APUS

天燕大模型是APUS公司自研的多模态大模型(LMM),具备对文本、图像、视频、音频的理解和生成能力(视频和音频的能力即将推出)。

[官方网站]

15. 元乘象--智子引擎

图文机器人

[官方网站]

16. 西湖大模型--西湖心辰

[官方网站]

17. Dongni--深思考

AI多模态搜索引擎

[官方网站]

18. 山海大模型--云知声

只需一次对话即可获取信息、知识和灵感,解决需求。是每个人身边的助理、朋友和专家。

[官方网站]

19. MiniMax大模型--MiniMax

MiniMax 最新一代的中文大语言模型帮助人类高效写作、激发创意、获取知识、做出决策现已对企业开放API体验

[官方网站]

<p align="right">[<a href="#top">Back to Top</a>]</p>

开源模型库平台

  1. 🤗HuggingFace: The AI community building the future.
  1. ModelScope: ModelScope平台是以模型为中心的模型开源社区
  1. flagopen: flagopen飞智大模型技术开源体系
  1. 始智AI: 中国AI开源创新社区
<p align="right">[<a href="#top">Back to Top</a>]</p>

开源数据集库

  1. huggfaceing数据集仓库: https://huggingface.co/datasets
  1. ModelScope数据集仓库:https://modelscope.cn/datasets
  1. flagopen数据集仓库: https://data.baai.ac.cn/data
  1. cluebenchmarks数据集仓库:https://www.cluebenchmarks.com/dataSet_search.html
  1. MNBVC: Massive Never-ending BT Vast Chinese corpus
  1. OpenDataLab数据集仓库: https://opendatalab.com/
  1. OSCAR: Open Super-large Crawled Aggregated coRpus, 多语言数据集
<p align="right">[<a href="#top">Back to Top</a>]</p>

other-awesome

1. Awesome-Chatgpt Star github

本项目旨在收集关于ChatGPT 的资源、工具、应用和用法等。

2. Awesome-ChatGPT-Prompts Star github

本项目旨在收集关于ChatGPT 模型使用的Prompts示例集。

3. Awesome-LLM Star github

本项目旨在收集有关大型语言模型相关资料,尤其是 ChatGPT 的论文的精选列表。它还包含 LLM 训练框架、部署 LLM 的工具、有关 LLM 的课程和教程以及所有公开可用的 LLM 模型和 API。

4. Awesome-LangChain Star github

本项目旨在收集与LangChain有关应用列表。LangChain是一个惊人的框架,可以在短时间内完成相关LLM应用开发。

5. Awesome-Open-Gpt Star github

本项目旨在收集关于GPT开源精选项目的合集(170+全网最全),其中包括了一些GPT镜像、GPT增强、GPT插件、GPT工具、GPT平替的聊天机器人、开源大语言模型等等。

6. Awesome-Multimodal-Large-Language-Models Star github

本项目是关于多模态大语言模型(MLLM)的精选列表,包括数据集、多模态模型、多模态语境学习、多模态思维链、llm 辅助视觉推理、基础模型等。此列表将实时更新。✨

7. Awesome-Transformer-Attention Star github

此 repo 包含 Vision Transformer & Attention 的综合论文列表,包括论文、代码和相关网站。

8. Awesome-Prompt-Engineering Star github

This repository contains a hand-curated resources for Prompt Engineering with a focus on Generative Pre-trained Transformer (GPT), ChatGPT, PaLM etc

9. Awesome-AITools Star github

这个仓库整理AI相关的实用工具。

10. Awesome-Chinese-LLM Star github

本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!

11. Awesome-LLM4Tool Star github

Awesome-LLM4Tool is a curated list of the papers, repositories, tutorials, and anythings related to the large language models for tools.

12. Awesome LLM Security Star github

A curation of awesome tools, documents and projects about LLM Security.

13. Awesome AI Agents Star github

Welcome to our list of AI agents. We structured the list into two parts: Open source projects and Closed-source projects and companies

14. Awesome-LLM-Large-Language-Models-Notes Star github

LLM-Large-Language-Models-Notes

15. Awesome-Efficient-LLM Star github

A curated list for Efficient Large Language Models。

16. Awesome Datasets for LLM Training Star github

A quick guide (especially) for trending instruction finetuning datasets。

17. Awesome-Align-LLM-Human Star github

A collection of papers and resources about aligning large language models (LLMs) with human.

18. Awesome RLHF (RL with Human Feedback) Star github

This is a collection of research papers for Reinforcement Learning with Human Feedback (RLHF). And the repository will be continuously updated to track the frontier of RLHF.

19. Prompt-in-context-learning Star github

An Open-Source Engineering Guide for Prompt-in-context-learning from EgoAlpha Lab.

20. Awesome Instruction Learning Star github

An awesome reading list of Instruction Tuning (or, put it more comprehensively, Instruction Learning), including papers and datasets.

21. Awesome-Foundation-Models Star github

A foundation model is a large-scale pretrained model (e.g., BERT, DALL-E, GPT-3) that can be adapted to a wide range of downstream applications. This term was first popularized by the Stanford Institute for Human-Centered Artificial Intelligence. This repository maintains a curated list of foundation models for vision and language tasks. Research papers without code are not included.

22. Awesome-AI-Devtools Star github

This is a curated list of AI-powered developer tools. These tools leverage AI to assist developers in tasks such as code completion, refactoring, debugging, documentation, and more.

23. Awesome-Autonomous-GPT Star github

A curated list of awesome projects and resources related to autonomous AI agents.

24. Awesome-Papers-Autonomous-Agent Star github

This is a collection of recent papers focusing on autonomous agent.

25. Awesome-Code-LLM Star github

a comprehensive review of LLM researches for code.

26. Awesome-LLM-Compression Star github

Awesome LLM compression research papers and tools to accelerate LLM training and inference.

27. Autonomous-Agents Star github

Autonomous Agents (LLMs). Updated daily.

28. Awesome-Large-Multimodal-Agents Star github

Awesome Large Multimodal Agents.

29. Awesome-LLM-Prompt-Optimization Star github

This repo aims to record advanced papers of LLM prompt tuning and automatic optimization (after 2022).

30. Awesome-LLMs-Datasets Star github

代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集.

30. Awesome-RAG-Survey Star github

This repo is constructed for collecting and categorizing papers about RAG according to our survey paper: Retrieval-Augmented Generation for AI-Generated Content: A Survey. Considering the rapid growth of this field, we will continue to update both paper and this repo.

31. Awesome-Tool-LLM Star github

Language models (LMs) are powerful yet mostly for text-generation tasks. Tools have substantially enhanced their performance for tasks that require complex skills.

32. LLM-Tool-Survey Star github

Recently, tool learning with large language models~(LLMs) has emerged as a promising paradigm for augmenting the capabilities of LLMs to tackle highly complex problems.

This is the collection of papers related to tool learning with LLMs. These papers are organized according to our survey paper "Tool Learning with Large Language Models: A Survey".

33. Awesome-Foundation-Model-Leaderboards Star github

Awesome Foundation Model Leaderboard is a curated list of awesome foundation model leaderboards (for an explanation of what a leaderboard is, please refer to this post), along with various development tools and evaluation organizations according to our survey:.

34. Awesome-LLM-KV-Cache Star github

Awesome-LLM-KV-Cache: A curated list of 📙Awesome LLM KV Cache Papers with Codes. This repository is for personal use of learning and classifying the burning KV Cache related papers!

35. Awesome-LLM-Strawberry Star github

This is a collection of research papers & blogs for OpenAI Strawberry(o1) and Reasoning.

And the repository will be continuously updated to track the frontier of LLM Reasoning.

36. Awesome-LLM-Resourses Star github

🧑‍🚀 全世界最好的LLM资料总结 | Summary of the world's best LLM resources.

37. Awesome-LLM-Reasoning-Openai-o1-Survey Star github

The related works and background techniques about OpenAI o1, including LLM reasoning, self-play reinforcement learning, complex logic reasoning, scaling law, etc.

38. Awesome-LLM-Reasoning Star github

Curated collection of papers and resources on how to unlock the reasoning ability of LLMs and MLLMs.

39. Awesome-Computer-Use-Agents Star github

This is a collection of resources for computer-use agents, including papers and blogs. The repository is currently under construction and will be continuously updated. We welcome contributions and feedback as we continue expanding this collection!

<p align="right">[<a href="#top">Back to Top</a>]</p>

NLU系列

BERT

模型版本TensorFlowPyTorch作者源地址应用领域
BERT-BasebaseGoogle DriveGoogle Researchgithub通用
BERT-wwmbase<p>Google Drive<br>讯飞云-07Xj</p>Google DriveYiming Cuigithub通用
BERT-wwm-extbase<p>Google Drive<br>讯飞云-4cMG</p>Google DriveYiming Cuigithub通用
bert-base-民事base阿里云THUNLPgithub司法
bert-base-刑事base阿里云THUNLPgithub司法
BAAI-JDAI-BERTbase京东云JDAIgithub电商客服对话
FinBERTbase<p>Google Drive<br>百度网盘-1cmp</p><p>Google Drive<br>百度网盘-986f</p>Value Simplexgithub金融科技领域
EduBERTbase好未来AI好未来AItal-techgithub教育领域
guwenbert-basebase<p>百度网盘-4jng<br>[🤗HF]</p>Ethangithub古文领域
guwenbert-largelarge<p>百度网盘-m5sz<br>[🤗HF]</p>Ethangithub古文领域
BERT-CCPoemsmallthunlpTHUNLP-AIPoetgithub古典诗歌

备注:

wwm全称为**Whole Word Masking **,一个完整的词的部分WordPiece子词被mask,则同属该词的其他部分也会被mask

ext表示在更多数据集下训练

<p align="right">[<a href="#top">Back to Top</a>]</p>

ChineseBERT

模型版本TensorFlowPyTorch作者源地址应用领域
ChineseBERTbase[🤗HF]ShannonAIgithub通用
ChineseBERTlarge[🤗HF]ShannonAIgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

RoBERTa

模型版本TensorFlowPyTorch作者源地址应用领域
RoBERTa-tiny-cluetinyGoogle Drive百度网盘-8qvbCLUEgithub通用
RoBERTa-tiny-pairtinygoogle drive百度网盘-8qvbCLUEgithub通用
RoBERTa-tiny3L768-cluetinyGoogle DriveCLUEgithub通用
RoBERTa-tiny3L312-cluetinygoogle drive百度网盘-8qvbCLUEgithub通用
RoBERTa-large-pairlargeGoogle Drive百度网盘-8qvbCLUEgithub通用
RoBERTa-large-cluelargegoogle drive百度网盘-8qvbCLUEgithub通用
RBT33层base<p>Google Drive<br>讯飞云-b9nx</p>Google DriveYiming Cuigithub通用
RBTL33层large<p>Google Drive<br>讯飞云-vySW</p>Google DriveYiming Cuigithub通用
RBTL44层large讯飞云-e8dNYiming Cuigithub通用
RBTL66层large讯飞云-XNMAYiming Cuigithub通用
RoBERTa-wwm-extbase<p>Google Drive<br>讯飞云-Xe1p</p>Google DriveYiming Cuigithub通用
RoBERTa-wwm-ext-largelarge<p>Google Drive<br>讯飞云-u6gC</p>Google DriveYiming Cuigithub通用
RoBERTa-basebase<p>Google Drive<br>百度网盘</p><p>Google Drive<br>百度网盘</p>brightmartgithub通用
RoBERTa-Largelarge<p>Google Drive<br>百度网盘</p>Google Drivebrightmartgithub通用
RoBERTa-tinytiny[🤗HF][🤗HF]DBIIR @ RUCUER通用
RoBERTa-minimini[🤗HF][🤗HF]DBIIR @ RUCUER通用
RoBERTa-smallsmall[🤗HF][🤗HF]DBIIR @ RUCUER通用
RoBERTa-mediummedium[🤗HF][🤗HF]DBIIR @ RUCUER通用
RoBERTa-basebase[🤗HF][🤗HF]DBIIR @ RUCUER通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ALBERT

模型版本TensorFlowPyTorch作者源地址应用领域
Albert_tinytinyGoogle DriveGoogle Drivebrightmartgithub通用
Albert_base_zhbaseGoogle DriveGoogle Drivebrightmartgithub通用
Albert_large_zhlargeGoogle DriveGoogle Drivebrightmartgithub通用
Albert_xlarge_zhxlargeGoogle DriveGoogle Drivebrightmartgithub通用
Albert_basebaseGoogle DriveGoogle Researchgithub通用
Albert_largelargeGoogle DriveGoogle Researchgithub通用
Albert_xlargexlargeGoogle DriveGoogle Researchgithub通用
Albert_xxlargexxlargeGoogle DriveGoogle Researchgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

NEZHA

模型版本TensorFlowPyTorch作者源地址应用领域
NEZHA-basebase<p>Google Drive<br>百度网盘-ntn3</p>lonePatientHUAWEIgithub通用
NEZHA-base-wwmbase<p>Google Drive<br>百度网盘-f68o</p>lonePatientHUAWEIgithub通用
NEZHA-largelarge<p>Google Drive<br>百度网盘-7thu</p>lonePatientHUAWEIgithub通用
NEZHA-large-wwmlarge<p>Google Drive<br>百度网盘-ni4o</p>lonePatientHUAWEIgithub通用
<p>WoNEZHA</br>(word-base)</p>base百度网盘-qgkqZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

MacBERT

模型版本TensorFlowPyTorch作者源地址应用领域
MacBERT-basebase<p>Google Drive<br>讯飞云-E2cP</p>Yiming Cuigithub通用
MacBERT-largelarge<p>Google Drive<br>讯飞云-3Yg3</p>Yiming Cuigithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

WoBERT

模型版本TensorFlowPyTorch作者源地址应用领域
WoBERTbase百度网盘-kim2ZhuiyiTechnologygithub通用
WoBERT-plusbase百度网盘-aedwZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

XLNET

模型版本TensorFlowPyTorch作者源地址应用领域
XLNet-basebase<p>Google Drive<br>讯飞云-uCpe</p>Google DriveYiming Cuigithub通用
XLNet-midmiddle<p>Google Drive<br>讯飞云-68En</p>Google DriveYiming Cuigithub通用
XLNet_zh_Largelarge百度网盘brightmartgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ELECTRA

模型版本TensorFlowPyTorch作者源地址应用领域
ELECTRA-180g-largelarge<p>Google Drive<br>讯飞云-Yfcy</p>Yiming Cuigithub通用
ELECTRA-180g-small-exsmall<p>Google Drive<br>讯飞云-GUdp</p>Yiming Cuigithub通用
ELECTRA-180g-basebase<p>Google Drive<br>讯飞云-Xcvm</p>Yiming Cuigithub通用
ELECTRA-180g-smallsmall<p>Google Drive<br>讯飞云-qsHj</p>Yiming Cuigithub通用
legal-ELECTRA-largelarge<p>Google Drive<br>讯飞云-7f7b</p>Yiming Cuigithub司法领域
legal-ELECTRA-basebase<p>Google Drive<br>讯飞云-7f7b</p>Yiming Cuigithub司法领域
legal-ELECTRA-smallsmall<p>Google Drive<br>讯飞云-7f7b</p>Yiming Cuigithub司法领域
ELECTRA-tinytiny<p>Google Drive<br>百度网盘-rs99</p>CLUEgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ZEN

模型版本TensorFlowPyTorch作者源地址应用领域
ZEN-Basebase<p>Google Drive<br>百度网盘</p>Sinovation Ventures AI Institutegithub通用
Erlangshen-ZEN2large[🤗HF]IDEA-CCNLgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ERNIE

模型版本PaddlePaddlePyTorch作者源地址应用领域
ernie-1.0-basebaselinkPaddlePaddlegithub通用
ernie_1.0_skep_largelargelinkBaidugithub情感分析
ernie-grambaselinkBaidugithub通用

备注:

PaddlePaddle转TensorFlow可参考: tensorflow_ernie

PaddlePaddle转PyTorch可参考: ERNIE-Pytorch

<p align="right">[<a href="#top">Back to Top</a>]</p>

ERNIE3

模型版本PaddlePaddlePyTorch作者源地址应用领域
ernie-3.0-base12-layer, 768-hidden, 12-headslink[🤗HF]PaddlePaddlegithub通用
ernie-3.0-medium6-layer, 768-hidden, 12-headslink[🤗HF]PaddlePaddlegithub通用
ernie-3.0-mini6-layer, 384-hidden, 12-headslink[🤗HF]PaddlePaddlegithub通用
ernie-3.0-micro4-layer, 384-hidden, 12-headslink[🤗HF]PaddlePaddlegithub通用
ernie-3.0-nano4-layer, 312-hidden, 12-headslink[🤗HF]PaddlePaddlegithub通用

PaddlePaddle转PyTorch可参考: ERNIE-Pytorch

<p align="right">[<a href="#top">Back to Top</a>]</p>

RoFormer

模型版本TensorFlowPyTorch作者源地址应用领域
roformerbase(L12)百度网盘-xy9xZhuiyiTechnologygithub通用
roformersmall(L6)百度网盘-gy97ZhuiyiTechnologygithub通用
roformer-charbase(L12)百度网盘-bt94ZhuiyiTechnologygithub通用
roformerV2small(L6)百度网盘-ttn4追一ZhuiyiTechnologygithub通用
roformerV2base(L12)百度网盘-pfoh追一ZhuiyiTechnologygithub通用
roformerV2large(L24)百度网盘-npfv追一ZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

StructBERT

模型版本TensorFlowPyTorch作者源地址应用领域
StructBERTlarge(L24)阿里云Alibabagithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

Lattice-BERT

模型版本TensorFlowPyTorch作者源地址应用领域
LatticeBERTtiny(L4)阿里云Alibabagithub通用
LatticeBERTsmall(L6)阿里云Alibabagithub通用
LatticeBERTbase(L12)阿里云Alibabagithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

Mengzi-BERT

模型版本TensorFlowPyTorch作者源地址应用领域
Mengzi-BERTbase(L12)[🤗HF]Langboatgithub通用
Mengzi-BERT-finbase(L12)[🤗HF]Langboatgithub金融财经
<p align="right">[<a href="#top">Back to Top</a>]</p>

Bloom

模型版本TensorFlowPyTorch作者源地址应用领域
bloom-6b4-zh6B(L30)[🤗HF]Langboatgithub通用

注:作者另有bloom-389m-zh到bloom-2b5-zh等多个中文模型

<p align="right">[<a href="#top">Back to Top</a>]</p>

TaCL

模型版本TensorFlowPyTorch作者源地址应用领域
TaCLbase(L12)[🤗HF]yxuansugithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

MC-BERT

模型版本TensorFlowPyTorch作者源地址应用领域
MC-BERTbase(L12)linkalibaba-researchgithub生物医疗
<p align="right">[<a href="#top">Back to Top</a>]</p>

二郎神

模型版本类型TensorFlowPyTorch作者源地址应用领域
Erlangshenlarge(L24)bert[🤗HF]IDEA-CCNLgithub中文通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

PERT

模型版本TensorFlowPyTorch作者源地址应用领域
PERT-basebase(12L)百度网盘-rcsw[🤗HF]Yiming Cuigithub通用
PERT-largelarge(24L)百度网盘-e9hs[🤗HF]Yiming Cuigithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

MobileBERT

模型版本TensorFlowPyTorch作者源地址应用领域
Chinese-MobileBERT-base-f2base百度网盘-56bjYiming Cuigithub通用
Chinese-MobileBERT-base-f4base百度网盘-v2v7Yiming Cuigithub通用
Chinese-MobileBERT-large-f2large百度网盘-6m5aYiming Cuigithub通用
Chinese-MobileBERT-large-f4large百度网盘-3h9bYiming Cuigithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

GAU-α

模型版本TensorFlowPyTorch作者源地址应用领域
chinese_GAU-alpha-char_L-24_H-768base下载ZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

DeBERTa

模型版本TensorFlowPyTorch作者源地址应用领域
DeBERTa-v2-Largelarge[🤗HF]IDEA-CCNLgithub通用
DeBERTa-v2-xLargexlarge[🤗HF]IDEA-CCNLgithub通用
DeBERTa-v2base[🤗HF]IDEA-CCNLgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

GlyphBERT

模型版本TensorFlowPyTorch作者源地址应用领域
GlyphCRM-basebase[🤗HF]HITsz-TMGgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

CKBERT

模型版本TensorFlowPyTorch作者源地址应用领域
pai-ckbert-base-zhbase[🤗HF]Alibabagithub通用
pai-ckbert-large-zhlarge[🤗HF]Alibabagithub通用
pai-ckbert-huge-zhhuge[🤗HF]Alibabagithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

LERT

模型版本TensorFlowPyTorch作者源地址应用领域
Chinese-LERT-small15m百度网盘-4vuy[🤗HF]Yiming Cuigithub通用
Chinese-LERT-base400m百度网盘-9jgi[🤗HF]Yiming Cuigithub通用
Chinese-LERT-large1.2G百度网盘-s82t[🤗HF]Yiming Cuigithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

RoCBert

模型版本TensorFlowPyTorch作者源地址应用领域
rocbertbase[🤗HF]Weiwe Shigithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

M3E

模型版本PyTorch作者源地址备注
m3e-basebasem3e-baseMoka-AIuniemStar文本嵌入模型
M3e-smallSmallm3e-smallMoka-AIuniemStar文本嵌入模型
<p align="right">[<a href="#top">Back to Top</a>]</p>

LEALLA

模型版本PyTorch作者源地址备注
LEALLA-basebaseLEALLA-baseGoogle Research/文本嵌入模型
LEALLA-largelargeLEALLA-largeGoogle Research/文本嵌入模型
<p align="right">[<a href="#top">Back to Top</a>]</p>

NLG系列

GPT

模型版本TensorFlowPyTorch作者源地址应用领域
GPT230亿语料<p>Google Drive<br>百度网盘-ffz6</p>Caspar ZHANGgpt2-ml通用
GPT215亿语料<p>Google Drive<br>百度网盘-q9vr</p>Caspar ZHANGgpt2-ml通用
CDial-GPTLCCC-basebase[🤗HF]thu-coaiCDial-GPT中文对话
CDial-GPT2LCCC-basebase[🤗HF]thu-coaiCDial-GPT中文对话
CDial-GPTLCCC-largelarge[🤗HF]thu-coaiCDial-GPT中文对话
GPT2-dialoguebase<p>Google Drive</br>百度网盘-osi6</p>yangjianxin1GPT2-chitchat闲聊对话
GPT2-mmibase<p>Google Drive</br>百度网盘-1j88</p>yangjianxin1GPT2-chitchat闲聊对话
GPT2-散文模型base<p>Google Drive</br>百度网盘-fpyu</p>Zeyao DuGPT2-Chinese散文
GPT2-诗词模型base<p>Google Drive</br>百度网盘-7fev</p>Zeyao DuGPT2-Chinese诗词
GPT2-对联模型base<p>Google Drive</br>百度网盘-i5n0</p>Zeyao DuGPT2-Chinese对联
roformer-gptbase(L12)百度网盘-2nnnZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

GPT-3

模型版本介绍PyTorch作者源地址应用领域
Chinese-Transformer-XL29亿参数(GPT-3)项目首页模型下载THUDMgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

NEZHA-Gen

模型版本TensorFlowPyTorch作者源地址应用领域
NEZHA-Genbase<p>Google Drive<br>百度网盘-rb5m</p>HUAWEIgithub通用
NEZHA-Genbase<p>Google Drive<br>百度网盘-ytim</p>HUAWEIgithub诗歌
<p align="right">[<a href="#top">Back to Top</a>]</p>

CPM-Generate

模型版本资源PyTorch作者源地址应用领域
CPM26亿参数项目首页模型下载Tsinghua AIgithub通用

备注:

PyTorch转TensorFlow可参考: CPM-LM-TF2

PyTorch转PaddlePaddle可参考: CPM-Generate-Paddle

<p align="right">[<a href="#top">Back to Top</a>]</p>

T5

模型版本TensorFlowPyTorch作者源地址应用领域
T5small[🤗HF][🤗HF]DBIIR @ RUCUER通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

T5-PEGASUS

模型版本KerasPyTorch作者源地址应用领域
T5 PEGASUSbase百度网盘-3sfnZhuiyiTechnologygithub通用
T5 PEGASUSsmall百度网盘-qgukZhuiyiTechnologygithub通用

Keras转PyTorch可参考: t5-pegasus-pytorch

<p align="right">[<a href="#top">Back to Top</a>]</p>

Mengzi-T5

模型版本TensorFlowPyTorch作者源地址应用领域
Mengzi-T5base(L12)[🤗HF]Langboatgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

PanGu-Alpha

模型版本资源下载地址作者源地址应用领域
盘古α-2.6B2.6G项目首页模型下载PCL-Platform.Intelligencegithub通用
盘古α-13B12G项目首页模型下载PCL-Platform.Intelligencegithub通用
盘古α-2.6B pytorch版本2.6G项目首页模型下载PCL-Platform.Intelligencegithub通用
盘古α-13B pytorch版本12G项目首页模型下载PCL-Platform.Intelligencegithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

EVA

模型版本介绍模型下载作者源地址应用领域备注
EVA28亿参数项目首页模型下载thu-coaigithub中文开放域对话需要登陆才能下载
EVA2.0-xLargexlarge项目首页[🤗HF]thu-coaigithub中文开放域对话
EVA2.0-largelarge项目首页[🤗HF]thu-coaigithub中文开放域对话
EVA2.0-basebase项目首页[🤗HF]thu-coaigithub中文开放域对话
<p align="right">[<a href="#top">Back to Top</a>]</p>-

BART

模型版本TensorFlowPyTorch作者源地址应用领域
BART-basebase[🤗HF]fastNLPgithub中文通用
BART-largelarge[🤗HF]fastNLPgithub中文通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

闻仲

模型版本类型TensorFlowPyTorch作者源地址应用领域
Wenzhonglarge(L24)GPT2[🤗HF]IDEA-CCNLgithub中文通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

余元

模型版本类型TensorFlowPyTorch作者源地址应用领域
Yuyuanlarge(L24)GPT2[🤗HF]IDEA-CCNLgithub医学领域
<p align="right">[<a href="#top">Back to Top</a>]</p>

RWKV

模型版本类型TensorFlowPyTorch作者源地址应用领域
RWKVbase(L12)githubPENG Bogithub小说
RWKV7B[🤗HF]PENG Bogithub小说
RWKV14B[🤗HF]PENG Bogithub小说
<p align="right">[<a href="#top">Back to Top</a>]</p>

PromptCLUE

模型版本TensorFlowPyTorch作者源地址应用领域
PromptCLUEbase(L12)[🤗HF]ClueAIgithub通用
PromptCLUE-v1-5base(L12)[🤗HF]ClueAIgithub通用
PromptCLUE-largelargeAPI在线调用ClueAIgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ChatYuan

模型版本类型TensorFlowPyTorch作者源地址应用领域
ChatYuanlargeT5[🤗HF]ClueAIgithub功能型对话
ChatYuan-large-v2largeT5[🤗HF]ClueAIgithub功能型对话
<p align="right">[<a href="#top">Back to Top</a>]</p>

SkyText

模型版本类型TensorFlowPyTorch作者源地址应用领域
SkyTextlargeGPT3[🤗HF]SkyWorkAIGCgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

ProphetNet

模型版本类型TensorFlowPyTorch作者源地址应用领域
ProphetNet-Zhlinkmicrosoftgithub通用
ProphetNet-Dialog-Zhlinkmicrosoftgithub对话
<p align="right">[<a href="#top">Back to Top</a>]</p>

NLU-NLG系列

UniLM

模型版本TensorFlowPyTorch作者源地址应用领域
Unilmbase百度网盘-tblr百度网盘-etwfYunwenTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

Simbert

模型版本TensorFlowPyTorch作者源地址应用领域
SimBERT Tinytiny百度网盘-1tp7ZhuiyiTechnologygithub通用
SimBERT Smallsmall百度网盘-nu67ZhuiyiTechnologygithub通用
SimBERT Basebase百度网盘-6xhqZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

RoFormer-sim

模型版本TensorFlowPyTorch作者源地址应用领域
roformer-simbase(L12)百度网盘-2cgzZhuiyiTechnologygithub通用
roformer-simsmall(L6)百度网盘-h68qZhuiyiTechnologygithub通用
roformer-sim-v2base(L12)百度网盘-w15nZhuiyiTechnologygithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

周文王

模型版本类型TensorFlowPyTorch作者源地址应用领域
Zhouwenwangbase(L12)roformer[🤗HF]IDEA-CCNLgithub中文通用
Zhouwenwanglarge(L24)roformer[🤗HF]IDEA-CCNLgithub中文通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

CPM-2

模型版本介绍模型下载作者源地址应用领域备注
CPM-2110亿参数项目首页模型下载BAAI-WuDaogithub通用需要申请才能下载
CPM-2100亿参数项目首页模型下载BAAI-WuDaogithub中英需要申请才能下载
CPM-21980亿参数项目首页模型下载BAAI-WuDaogithub中英需要申请才能下载
<p align="right">[<a href="#top">Back to Top</a>]</p>

CPT

模型版本TensorFlowPyTorch作者源地址应用领域
CPT-basebase(L12)[🤗HF]fastNLPgithub通用
CPT-largelarge(L24)[🤗HF]fastNLPgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

GLM

模型版本TensorFlowPyTorch作者源地址应用领域
GLMlarge[🤗HF]THUDMgithub通用
GLMxxlarge[🤗HF]THUDMgithub通用
GLM-130B130B申请地址1申请地址2THUDMgithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

PLUG

模型版本模型下载作者源地址应用领域
PLUG27BAliceMind-需要申请Alibabagithub通用
<p align="right">[<a href="#top">Back to Top</a>]</p>

OPD

模型版本介绍模型下载作者源地址应用领域备注
OPD6.3B项目首页模型下载thu-coaigithub中文开放域对话需要申请才能下载
<p align="right">[<a href="#top">Back to Top</a>]</p>

Multi-Modal

WenLan

模型版本介绍模型下载作者源地址应用领域备注
BriVL(WenLan)10亿参数项目首页模型下载BAAI-WuDaogithub中文通用图文需要登陆才能下载
<p align="right">[<a href="#top">Back to Top</a>]</p>

CogView

模型版本介绍模型下载作者源地址应用领域备注
CogView40亿参数项目首页模型下载THUDM github中文多模态生成模型需要登陆才能下载
<p align="right">[<a href="#top">Back to Top</a>]</p>

紫东太初

模型版本介绍模型下载作者源地址应用领域备注
紫东太初- light_vision_text项目首页模型下载中科院自动化所github中文图像-文本领域紫东太初多模态大模型中的图像-文本预训练模型
紫东太初-text[GPT]32亿参数项目首页百度网盘-nos5中科院自动化所github中文通用紫东太初多模态大模型中的文本预训练模型
紫东太初-vision项目首页模型下载中科院自动化所github视觉领域紫东太初多模态大模型中的视觉预训练模型
紫东太初-speech项目首页模型下载中科院自动化所github语音领域紫东太初多模态大模型中的语音检测与识别多任务模型
<p align="right">[<a href="#top">Back to Top</a>]</p>

Mengzi-oscar

模型版本TensorFlowPyTorch作者源地址应用领域
Mengzi-oscarbase(L12)[🤗HF]Langboatgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

R2D2

模型版本TensorFlowPyTorch作者源地址首页应用领域
R2D2ViT-LlargeGoogleyuxie11githubzero中文多模态-图文
PRD2ViT-LlargeGoogleyuxie11githubzero中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

Chinese-CLIP

模型版本TensorFlowPyTorch作者源地址应用领域
CN-CLIP<sub>RN50</sub>77MaliyuncsOFA-Sysgithub中文多模态-图文
CN-CLIP<sub>ViT-B/16</sub>188MaliyuncsOFA-Sysgithub中文多模态-图文
CN-CLIP<sub>ViT-L/14</sub>406MaliyuncsOFA-Sysgithub中文多模态-图文
CN-CLIP<sub>ViT-L/14@336px</sub>407MaliyuncsOFA-Sysgithub中文多模态-图文
CN-CLIP<sub>ViT-H/14</sub>958MaliyuncsOFA-Sysgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

TaiYi-CLIP

模型版本TensorFlowPyTorch作者源地址应用领域
Taiyi-CLIP-Roberta-large-326M-Chinesebase[🤗HF]IDEA-CCNLgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

AltCLIP

模型版本TensorFlowPyTorch作者源地址应用领域
AltCLIP3.22G[🤗HF]FlagAIgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

AltDiffusion

模型版本TensorFlowPyTorch作者源地址应用领域
AltDiffusion8.0G[🤗HF]FlagAIgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

Taiyi-Stable-Diffusion

模型版本TensorFlowPyTorch作者源地址应用领域
Taiyi-Stable-Diffusion1B[🤗HF]IDEA-CCNLgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

wukong

模型版本TensorFlowPyTorch作者源地址应用领域
CLIPurlHUAWEIgithub中文多模态-图文
FILIPurlHUAWEIgithub中文多模态-图文
wukongurlHUAWEIgithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

OFA

模型版本TensorFlowPyTorch作者源地址应用领域
OFAlinkOFA-Sysgithub中文多模态-图文
OFA-Chinese[🤗HF]Yang JianXingithub中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

QA-CLIP

模型版本视觉架构PyTorch作者源地址应用领域
QA-CLIPRN5077MResNet50[🤗HF]腾讯QA-CLIPStar中文多模态-图文
QA-CLIPViT-B/16188MViT-B/16[🤗HF]腾讯QA-CLIPStar中文多模态-图文
QA-CLIPViT-L/14406MViT-L/14[🤗HF]腾讯QA-CLIPStar中文多模态-图文
<p align="right">[<a href="#top">Back to Top</a>]</p>

Table

SDCUP

模型版本TensorFlowPyTorch作者源地址应用领域
sdcupbase阿里云Alibabagithub中文表格
sdcuplarge阿里云Alibabagithub中文表格
<p align="right">[<a href="#top">Back to Top</a>]</p>

更新

<p align="right">[<a href="#top">Back to Top</a>]</p>

Contributors

<a href="https://github.com/eryajf/learn-github/graphs/contributors"> <img src="https://contrib.rocks/image?repo=lonePatient/awesome-pretrained-chinese-nlp-models" /> </a>

Misc

↳ Stargazers

Stargazers repo roster for

↳ Forkers

Forkers repo roster for

↳ Star History

<div align="center"> [![Star History Chart](https://api.star-history.com/svg?repos=lonePatient/awesome-pretrained-chinese-nlp-models&type=Date)](https://star-history.com/#lonePatient/awesome-pretrained-chinese-nlp-models&Date) </div>

Visitor Count