Home

Awesome

JMMLU

日本語マルチタスク言語理解ベンチマーク Japanese Massive Multitask Language Understanding Benchmark

日本語🇯🇵 | English🇬🇧 | 中文🇨🇳

JMMLUは、マルチタスク言語理解ベンチマークMMLU (Paper, Github)の一部を日本語に翻訳した問題(翻訳問題)、および、日本独自の文化的背景に基づく問題(日本問題)によって構成される4択問題である。大規模言語モデルの日本語能力の評価に用いられることを想定している。

翻訳問題は、MMLUの57タスク(科目)のそれぞれから最大150問を選択し、まず日本語に機械翻訳した。次に、翻訳者が機械翻訳結果を確認することによって、翻訳しにくい、もしくは、日本の文化と無関係または矛盾する問題やタスクを削除した。また、残った問題について、自然な日本語になるように修正した。

日本問題は、公民、日本史などの学校教科に基づく問題であり、日本人によって人手で作成されている。

フォーマットは、MMLUの形式と同じCSVで、

問題, 選択肢A, 選択肢B, 選択肢C, 選択肢D, 正解

である。

JMMLUは以下の56タスク(科目)、7,536問からなる。そのうち、CC BY-SA 4.0 ライセンスの53タスク、7,097問は JMMLUフォルダに、CC BY-NC-ND 4.0 ライセンスの3タスク 439問はJMMLU_NC_NDフォルダにある。

タスク名英語タスク名件数
専門医学professional_medicine150
専門心理学professional_psychology150
専門会計professional_accounting150
哲学philosophy150
雑学miscellaneous150
医学遺伝学medical_genetics99
形式論理formal_logic125
先史学prehistory150
天文学astronomy148
熟語japanese_idiom150
世界宗教world_religions147
世界事実global_facts97
世界史world_history150
社会学sociology150
栄養学nutrition149
日本史japanese_history150
日本地理japanese_geography139
人間の老化human_aging150
論理学logical_fallacies150
倫理的議論moral_disputes148
臨床知識clinical_knowledge150
経営学management102
解剖学anatomy132
計量経済学econometrics113
機械学習machine_learning111
国際法international_law120
公民japanese_civics150
公共関係public_relations109
高校心理学high_school_psychology150
高校物理high_school_physics150
高校統計学high_school_statistics150
高校数学high_school_mathematics150
高校生物学high_school_biology148
高校情報科学high_school_computer_science98
高校化学high_school_chemistry149
高校地理high_school_geography150
高校ヨーロッパ史high_school_european_history150
高校ミクロ経済学high_school_microeconomics149
高校マクロ経済学high_school_macroeconomics148
概念物理学conceptual_physics150
法理学jurisprudence107
電気工学electrical_engineering144
大学医学college_medicine150
大学物理college_physics100
大学数学college_mathematics99
大学生物学college_biology143
大学化学college_chemistry99
大学コンピュータ科学college_computer_science99
初等数学elementary_mathematics150
抽象代数abstract_algebra99
マーケティングmarketing150
ビジネス倫理business_ethics86
セクシュアリティhuman_sexuality130
セキュリティ研究security_studies150
コンピュータセキュリティcomputer_security99
ウイルス学virology150

なお、日本史、世界史の著作権はステップ株式会社が保有するものであり、言語モデルの研究・評価以外の商業利用は禁止されている。

熟語、公民、日本地理の著作権はVIST学習塾が保有するものであり、ライセンスはCC BY-NC-ND 4.0である。ただし言語モデルの研究・評価における商業利用は許可されている。

Shield: CC BY-SA 4.0

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

CC BY-SA 4.0

謝辞

本研究における翻訳に際し、理化学研究所からのご支援に深く感謝申し上げる。また、株式会社Stepには日本史及び社会史の内容提供について、VIST学習塾には熟語、公民、日本地理の提供について、心より御礼申し上げる。これらの支援がなければ、本研究の実施は困難であったことを認識し、関係各所のご協力に厚く謝意を表するものである。