Awesome
Rapid ASR
<p align="left">
<a href="https://huggingface.co/spaces/SWHL/RapidASRDemo" target="_blank"><img src="https://img.shields.io/badge/%F0%9F%A4%97-Hugging Face Demo-blue"></a>
<a href="https://www.modelscope.cn/studios/liekkas/RapidASRDemo/summary" target="_blank"><img src="https://img.shields.io/badge/ModelScope-Demo-blue"></a>
<a href=""><img src="https://img.shields.io/badge/OS-Linux%2C%20Win%2C%20Mac-pink.svg"></a>
<a href=""><img src="https://img.shields.io/badge/Python->=3.6,<3.13-aff.svg"></a>
<a href=""><img src="https://img.shields.io/badge/C++-aff.svg"></a>
</p>
📖文档导航
📆TODO以及任务认领
🎨整体框架
flowchart LR
A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])
📣更新日志
<details>
<summary>详情</summary>
- 2023-08-21 v2.0.4 update:
- 添加whl包支持
- 更新文档
- 2023-02-25
- 添加C++版本推理,使用onnxruntime引擎,预/后处理代码来自: [FastASR](https://github.com/chenkui164/FastASR)
- 2023-02-14 v2.0.3 update:
- 修复librosa读取wav文件错误
- 修复fbank与torch下fbank提取结果不一致bug
- 2023-02-11 v2.0.2 update:
- 模型和推理代码解耦(`rapid_paraformer`和`resources`)
- 支持批量推理(通过`resources/config.yaml`中`batch_size`指定)
- 增加多种输入方式(`Union[str, np.ndarray, List[str]]`)
- 2023-02-10 v2.0.1 update:
- 添加对输入音频为噪音或者静音的文件推理结果捕捉。
</details>