Home

Awesome

Distant-Supervised-Chinese-Relation-Extraction

基于远监督的中文关系抽取

数据集构建

处理流程可在 kg_data/README.md 中查看。点击此处(谷歌云盘)下载处理后的数据子集。

模型选择

使用 thunlp/OpenNRE 的模型, 具体信息参考其说明。

源链接: https://github.com/thunlp/OpenNRE

运行代码

数据集文件目录代码默认为 data/chinese,在命令中运行:

python train_demo.py chinese pcnn att

模型结果

部分关系的结果如下:

类别精准度召回率F1分数
全部0.954280.950360.95232
/人物/其它/民族0.983740.9790.98137
NA0.968530.978240.97336
/人物/地点/国籍0.840750.926730.88164
/组织/地点/位于0.851570.836520.84398
/人物/其它/职业0.861210.80370.83147
/人物/组织/毕业于0.841370.780920.81002
/组织/人物/校长0.941180.592590.72727
/人物/地点/出生地0.810490.490280.61097
/人物/人物/家庭成员0.653850.377780.47887
/人物/组织/属于0.999990.113640.20408
/地点/地点/包含0.999990.06250.11765
/组织/人物/创始人0.999990.058820.11111

某些关系的召回率很低,分析发现原因可能是数据集中该关系的样本非常少。