Awesome

ChineseSTS

STS 中文文本语义相似度语料库建设

文本语义相似度（Semantic Text Similarity）是自然语言处理处理中的基本问题。

相似度值：[0,5]，5:相似度最高（意思一样），0:相似度最低(语义相反或不相干）

应用范围：QA、自动客服、搜索引擎、语义理解、自动阅卷......

项目意义：目前英文sts语料训练数据较为丰富，中文sts（Chinese Semantic Text Similarity）语料很少，而语料是文本进行深度学习的基本起点。

项目实施起始日期：2016-06-06 06:06:06 0 0 131 66

如有引用或使用本训练集请注明作者信息：唐善成, 白云悦, 马付玉. 中文语义相似度训练集. 西安科技大学.2016. https://github.com/IAdmireu/ChineseSTS

Tang Shancheng, Bai Yunyue, Ma Fuyu. Chinese Semantic Text Similarity Trainning Dataset. Xi'an University of Science and Technology.2016. https://github.com/IAdmireu/ChineseSTS