Awesome

ChatSensitiveWords

利用LLM+敏感词库，来自动判别是否涉及敏感词。已经在chatpaper上线！

Motivation：

在chatpaper中，我们免费提供了学术版GPT完整功能，这里面有一个隐藏的对话功能，我们希望给大家提供一个学术对话接口，但防不住大家好奇，或者有极少数人故意攻击我们的输出。

因此我们需要紧急上线敏感词检测。尤其是针对政治敏感词和色情敏感词。

方案：

传统敏感词库检测是否有敏感词
如果有敏感词，让Chat来判断语义，是否有误杀。
输出敏感词检测（待做）

使用步骤：

pip install -r requirements.txt
替换api key
确认敏感词库路径是否正确。

初步效果：

<details><summary><code><b>一些有意思的案例截图</b></code></summary>

GO5YV8RZ$$FOQ) 4 CEBHKG

M MNO8I853}YN RNLCGXNPR

FA LNCEEAC(XT05JVAQUJ~4

$7JU@}TJ 0)N8Z3{Z_63FE H$

</details>

时间消耗分析：

无敏感词的情况，消耗0.2s左右

有敏感词，消耗0.2+0.8s左右。

欢迎大家在本地测试和评估。 千万别在我们的学术版上测试！

欢迎大家一起玩耍

目前传统敏感词库的检测还没有做好，然后chat的prompt也没有调到最优。

欢迎大家star和pull新功能！

如果对搭网站的朋友有帮助的话，也欢迎打赏, 感谢认可！

8F26{U54RLC EUL6(MNEZPA

请不要打包卖钱，如果卖钱的话，分我点...

Starchart

Contributors

项目引用：

Please cite the repo if you use the data or code in this repo.

@misc{ChatPaper,
  author={Yongle Luo},
  title = {ChatSensitiveWords: Use LLM and sensitive word library to check sensitive input text.},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/kaixindelele/ChatSensitiveWords}},
}