Home

Awesome

MiLM-6B

介绍

MiLM-6B 是由小米开发的一个大规模预训练语言模型,参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

模型相关信息持续更新中...

评测结果

C-Eval

C-Eval 数据集是一个全面的中文基础模型评测数据集,涵盖了 52 个学科和四个难度的级别。

模型AverageSTEMSocial SciencesHumanitiesOthersAvg(Hard)
MiLM-6B60.254.571.762.757.742.0
MiLM-1.3B45.838.059.549.843.429.9

测试采用zero-shot

CMMLU

CMMLU 数据集是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。

模型平均分STEM人文学科社会科学其他中国特定主题
MiLM-6B60.3748.8863.4966.262.1462.07
MiLM-1.3B50.7940.5154.8254.1553.9952.26
模型平均分STEM人文学科社会科学其他中国特定主题
MiLM-6B57.1746.8561.1261.6858.8459.39
MiLM-1.3B45.3935.5949.5849.0347.5648.17