Home

Awesome

有需要为该开源项目贡献的小伙伴可以联系我哟。

<!-- TOC --> <!-- /TOC -->

Deep learning for Knowledge-Graph

探索认知智能系列---趋势:1. 数据融合知识;2. All in LLM。 包括知识获取、知识库构建、基于知识库的问答系统系列技术研究与应用。涉及到NLP领域的前沿技术和论文。

资源外链


<!-- ## 项目目录说明 - Algorithm-code 知识图谱相关算法实现 - datasets 相关数据集 - my summary 主要以PPT总结 - NLP&KG基础 自然语言处理与知识图谱基础知识,主要包括词表示、构建等。 - SmartInteraction 主要涉及对话系统的实践。是一个长期的规划。 - 认知科学 主要扩展知识了解 - 事理图谱 以事件为中心进行图谱建立 - 文本相似度 主要解决在对话中Query和Answer的匹配 - 知识存储 主要是知识库的建立 - 知识构建 主要涉及实体、关系的抽取等 - 中文金融文档抽取 涉及chFinAnn抽取的研究和探索 --- --> <!-- [![](https://img.shields.io/badge/技术集成项目-小智v1.0-brightgreen.svg)](https://github.com/lihanghang/Knowledge-Graph) <font color=red size=5>[小智交互平台](./SmartInteraction/)</font> -->

知识图谱的前世今生

序号文章
1为什么要将「知识图谱」追溯到 1956 年?

研究总结列表

专题研究

  1. 基于知识图谱的对话系统

KG&QA相关理论解析

  1. 知识图谱综述
  2. 知识图谱的挑战
  3. 深度学习与知识图谱
  4. CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System
  5. KBQA
  6. 赵汀阳:人工智能的自我意识何以可能?1-3
  7. NLP University 开张大吉--李维老师,Simon Fraser University,博士
  8. ACL 2019 知识图谱的全方位总结

NLP 相关论文解析

  1. The Illustrated Transformer
  2. An Attentive Survey of Attention Models
  3. BERT:Bidirectional Encoder Representations from Transformers
  4. ERNIE:Enhanced Representation through Knowledge Integration
  5. ERNIE: Enhanced Language Representation with Informative Entities
  6. Google T5: Text-To-Text Transfer Transformer

中文金融文档结构化研究

  1. Doc2EDAG

知识图谱相关会议

编号名称等级类型领域
1ACLA类学术会议人工智能
2CVPRA类学术会议人工智能
3ICMLA类学术会议人工智能
4IJCAIA类学术会议人工智能
5EMNLPB类学术会议人工智能
6CIKMB类学术会议数据库/数据挖掘/内容检索
7AAAIA类学术会议人工智能
8SIGKDDA类学术会议数据库/数据挖掘/内容检索
9TKDEA类学术期刊(数据库/数据挖掘/内容检索)
10SIGIRA类学术会议数据库/数据挖掘/内容检索

事理图谱

  1. 事理图谱综述
  2. 白硕:事理图谱六问六答

对话系统技术

  1. CSDN|公开课笔记:一文详解启发式对话中的知识管理_aispeech
  2. 对话系统综述
  3. 对话系统中的口语理解技术(SLU)

关于NLP/对话/KG的商业化相关(仅供交流学习)

  1. 语音交互中的自然语言处理技术--xiaomi
  2. 精益知识图谱方法论--文因互联
  3. 小i机器人在中文语义开放平台的研究与进展--小i机器人
  4. 科大讯飞-从应用角度来看知识图谱的价值和挑战--科大讯飞

主流开源的问答&&对话系统列表

编号名称地址
1questionAnsweringsystemQuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。
2QABasedOnMedicaKnowledgeGraph从无到有搭建一个以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。python
3DeepPavlovAn open source library for deep learning end-to-end dialog systems and chatbots. python

主流语义平台列表

编号名称
1腾讯文智中文语义平台
2科大讯飞开放语义平台
3玻森中文语义开放平台
4哈工大语言云

中英文文本预处理工具列表

编号名称主要功能
1THULAC中文词法分析工具,支持C++/JAVA/Python by清华
2LTP语言技术平台 pylyp LTP的Python封装 by 哈工大
3HanLP支持Java
4结巴分词中文分词(仅支持分词),Java、python、C++
5jiagu提供中文分词、词性标注、命名实体识别、关键词抽取、文本摘要、新词发现等常用自然语言处理功能。Python
6fudanNLP中文分词(分词、词性标注、命名实体识别), 支持Java
7deepdive斯坦福大学的开源知识抽取工具(三元组抽取), 支持python
8FudanDNN-NLP3.0用于中文分词、命名识别、词性标注、句子分类、语义分析、知识库访问、对话问答,支持Java----复旦大学计算机学院机器人研究实验室所开发的基于深度学习的中文自然语言处理工具
9Stanford CoreNLP可进行多语言的词性标注器、命名实体的识别器、解析器(句子与语法结构)、指代消解器(就是在篇章中确定代词指向哪个名词短语的问题)、情感分析器、 引导模式学习器、开放信息提取器, Java/Python----- Stanford CoreNLP是斯坦福大学的自然语言处理工具包,工具包需要java的支持

图存储与查询工具

编号名称主要功能
1Neo4j开源图形数据库,由Java开发。
2OrientDB开源的noSQL数据库,可处理文档、图形、传统数据库组件。由Java编写,存储速度快。
3Virtuoso支持RDF与SPARQL查询。
4Titan可与Gremlin/Hbase进行集成,可实现分布式存储和计算的图数据处理。
5Apache Jena-IDB 在JAVA下操作RDF。其中TDB是使用triple store的形式对RDF数据提供持久性存储(persistent store),TDB相比RDB、SDB更快且具有扩展性。
6Cypher声明式图查询语言,表达高效查询和更新图数据库。
7Gremlin一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂的属性图(property graph)的遍历或查询。
8SPARQL为RDF开发的一种查询语言和数据获取协议。
9rdflib基于Python语言编写的,RDF / XML,N3,NTriples,N-Quads,Turtle,TriX,RDFa和Microdata的解析器和序列化器,支持SPARQL 1.1查询和更新语句。

可视化工具

编号名称主要功能
1ECharts百度开源工具,API封装完善,简单好用,易上手,但不支持事件处理。
2Cytoscape.js针对图形和网络,事件交互性的支持不错,同样易上手。
3D3.js使用门槛较高,但支持事件处理器,D3的开销极小,支持大型数据集和交互动画的动态行为,支持图形丰富。

中英文知识图谱数据集列表

编号名称应用任务
1OpenKG开放知识图谱
2CN-Probase大规模中文概念图谱
3SentiBridge中文实体情感知识库,刻画人们如何描述某个实体,包含新闻、旅游、餐饮,共计30万对
4音乐知识图谱中文音乐知识图谱,歌手、歌曲等信息
5人物类RDF知识采集自百科网站的人物类知识,共65万个RDF三元组
6中国旅游景点知识图谱中国旅游景点中文知识图谱是CASIA-KB知识图谱的一部分。抽取自百度百科和互动百科。旅游景点知识图谱可用于地理、生活、娱乐等应用。
7200万条商品画像数据本数据是百分点在7年运营过程中积累的产品画像数据的小结,百分点自建了丰富的电商品分类体系和媒体分类体系。
8中文症状库这是一个包含症状实体和症状相关三元组的数据集。中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。
9cnSchema机场知识图谱基于cnSchema的机场知识图谱可查询世界各机场的属性,包含名称、时区、机场代码、地理位置(经纬度)等。
10七律-通用知识图谱本数据共包含8000万条百科三元组,为七律的一部分子集,后续将持续加大开放。七律-7Lore,是狗尾草科技精心打造的百科知识图谱,是人类世界海量知识的集合,它包含了事物、事实、概念、规则等等。

比赛

  1. ATEC蚂蚁开发者大赛之学习赛--NLP之问题相似度计算--2019-3
  2. 百度2019语言与智能技术竞赛之第二赛道--知识驱动对话--2019-4
  3. SMP2019中文人机对话技术评测(ECDT),子任务:领域分类、意图识别和语义槽填充--Task1:自然语言理解评测--2019-5

思考

Star History

Star History Chart

说明

Contact