Home

Awesome

QAmodel-for-Retrivalchatbot

Chinese Retreival chatbot(中文检索式机器人)的QA模型

----------------------------------- 更新于2019/6/12 关于中文语料集 ----------------------------------

很多同学给我发邮件咨询QA_demo1的语料集,这个语料集我暂时无权公开,希望大家见谅!

QA_demo1的语料集的格式为: Q-Q, Q-A,其实主要还是在于Q-Q的数据集,因为做的是问题和问题之间的相似度,工业上都这么干,Q-A只是用来展示模型相应的效果而已,去任何一个有FAQ说明的网站都可以把QA对给爬下来。

这里提供2个中文数据集供大家参考,希望能够帮到大家:

  1. 中文文本语义相似度(Chinese Semantic Text Similarity)语料库建设
  2. 保险行业语料库

----------------------------------- 更新于2019/6/12 关于中文语料集 ----------------------------------

建设计划:

一、 基于tf-idf等特征的问答机器人
二、 基于语义模型,如cnn,rnn等深度学习模型的问答机器人
三、 基于ELMO的问答机器人
四、 基于BERT的问答机器人

项目名称数据类型技术类型可视化完成时间
基于tf-idf的问答机器人中文tf-idf,特征匹配2019/4/4
基于recall+rerank的问答机器人中文tf-idf,cnn2019/7/22
聊天机器人小天1.0中文route转换机制,支持闲聊和FAQ任务问答2019/7/25
基于BERT的问答机器人中文/敬请期待

如果觉得我的工作对您有帮助,请不要吝啬右上角的小星星哦!欢迎Fork和Star!也欢迎一起建设这个项目!
有时间就会更新问答相关项目,有兴趣的同学可以follow一下
留言请在Issues或者email xiezhengwen2013@163.com

Cite
如果你在研究中使用了QAmodel-for-Retrievalchatbot,请按如下格式引用:

@software{QR-Chatbot,
  author = {ZhengWen Xie},
  title = {QR-Chatbot: QAmodel for Retrievalchatbot},
  year = {2019},
  url = {https://github.com/WenRichard/QAmodel-for-Retrievalchatbot},
}