

<!-- PROJECT LOGO --> <br /> <p align="center"> <h3 align="center">tableQA-Chinese</h3> <p align="center"> 无监督TableQA和数据库QA在中文表格数据和金融问题上的应用。 <br /> </p> </p>

In English



SnorkelBertopic 可能存在依赖冲突。建议使用 conda 安装不同虚拟环境分别区分 JointBERTSnorkelBertopic

conda create -n jointbert_env python=3.8
conda activate jointbert_env
pip install -r jointbert_requirements.txt
conda create -n snorkel_env python=3.8
conda activate snorkel_env
bash snorkel_install.sh
conda create -n topic_env python=3.8
conda activate topic_env
bash topic_install.sh

在使用notebook和script之前,请键入 conda activate 命令以初始化特定环境。下面是不同文件及其环境映射:<br/> <br/> (jointbert_env)<br/> condition_trainer.py<br/> tableQA_single_table.py<br/> tableqa-single-valid.ipynb<br/> fine-tune-on-finance.ipynb<br/> <br/> (snorkel_env)<br/> finance_dictionary_construction.py<br/> agg-classifier.ipynb<br/> tableqa_finance_unsupervised.py<br/> <br/> (topic_env)<br/> tableqa_search.py<br/> <br/> <br/>

<!-- USAGE EXAMPLES --> <h1><b>完全功能使用</b></h1> &ensp; &ensp; &ensp; &ensp; &ensp; &ensp;包含模型训练方式及使用

tableQA 使用方式

<!-- Use this space to show useful examples of how a project can be used. Additional screenshots, code examples and demos work well in this space. You may also link to more resources. _For more examples, please refer to the [Documentation](https://example.com)_ --> <h4> <p> <a href="https://github.com/ZhuiyiTechnology/TableQA"> 1. 从 github 上下载tableqa数据</a> </p> </h4> <h4> <p> <a href="https://github.com/monologg/JointBERT"> 2. 下载 JointBERT 工程</a> </p> </h4> <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/script/condition_trainer.py">3. 在tableqa数据上使用 JointBERT 训练实体和条件抽取模型</a> </p> </h4> &ensp; &ensp; &ensp; &ensp; &ensp; &ensp; 不要忘记在代码中配置 train_path 和 jointbert_path <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/notebook/tableqa-single-valid.ipynb">4. 在 tableqa-single-valid 中使用 tableQA_single_table.py 在单个数据表数据中执行数据表问答 </a> </p> </h4>

Huggingface 空间例子

你可以通过点击下面的链接在 Huggingface 空间上尝试单表 TableQA 例子 : <br/> https://huggingface.co/spaces/svjack/TableQA-Chinese

databaseQA 使用方式

<h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/script/finance_dictionary_construct.py">5. 运行 finance_dictionary_construct 对 databaseQA 建立金融字典</a> </p> </h4> <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/script/tableqa_search.py">6. 对 databaseQA 建立金融画像</a> </p> </h4> <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/script/tableqa_finance_unsupervised.py">7. 使用 Snorkel 从tableqa中筛选金融数据表格 </a> </p> </h4> <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/notebook/fine-tune-on-finance.ipynb">8. 在构建的金融数据库(由一些金融数据表格构建)上执行databaseQA</a> </p> </h4> <br/> <h1><b>简单使用方式</b></h1> &ensp; &ensp; &ensp; &ensp; &ensp; &ensp;使用已经构建好的预训练模型进行使用 <br/> <br/>

这是使用此项目的推荐方法,因为金融词典是通过从 ownthink 调用 API 构建的。如果 API 不稳定或 Bertopic 发生某些随机状态更改,可能会对数据库 QA 中的金融概况产生不良影响。因此,我推荐至少使用 Google Drive 中的 data.tar.gz。通过使用 data.tar.gz,您只需要安装 (jointbert_env) 环境即可探索 TableQA 和 DatabaseQA。<br/>

Google Drive 下载预训练模型和数据。此共享路径包含三个文件:<br/> <b>1 bert.tar.gz</b> (JointBERT 训练模型) <br/> <b>2 conds.tar.gz</b> (JointBERT 友好数据集) <br/> <b>3 data.tar.gz</b> (Bertopic 和 Snorkel 生成的数据,用于执行数据库 QA)<br/>

将它们解压缩到此项目的根路径,并将它们配置到上面的 Full Usage 文件中。您可以通过在 notebook 和 script 中搜索已解压缩的文件名来找到配置位置。<br/>

tableQA 使用

<!-- Use this space to show useful examples of how a project can be used. Additional screenshots, code examples and demos work well in this space. You may also link to more resources. _For more examples, please refer to the [Documentation](https://example.com)_ --> <h4> <p> <a href="https://github.com/ZhuiyiTechnology/TableQA"> 1. 从 github 上下载中文 tableqa 数据</a> </p> </h4> <h4> <p> <a href="https://github.com/monologg/JointBERT"> 2. 下载 JointBERT 工程</a> </p> </h4> <h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/notebook/tableqa-single-valid.ipynb"> 3. 在 tableqa-single-valid 中使用 tableQA_single_table.py 在单个数据表数据中执行数据表问答</a> </p> </h4>


databaseQA 使用方法

<h4> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/notebook/fine-tune-on-finance.ipynb">4. 在构建的金融数据库(由一些金融数据表格构建)上执行databaseQA </a> </p> </h4>




<br/> <h1> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/tableQA_construction.md"> 设计结构 (英文版)</a> </p> </h1> <h1> <p> <a href="https://github.com/svjack/tableQA-Chinese/blob/main/tableQA_api_documentation.md"> API 文档 (英文版)</a> </p> </h1> <!-- LICENSE -->


Distributed under the MIT License. See LICENSE for more information.

svjack - svjackbt@gmail.com

Project Link:https://github.com/svjack/tableQA-Chinese



