Awesome

Rapid ASR

🎉 推出知识星球RapidAI私享群，这里的提问会优先得到回答和支持，也会享受到RapidAI组织后续持续优质的服务。欢迎大家的加入。
Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch。
本仓库仅对模型做了转换，只采用ONNXRuntime推理引擎。该项目核心代码已经并入FunASR。
项目仍会持续更新，欢迎关注。
QQ群号：645751008

📖文档导航

语音识别：
- rapid_paraformer:
  - rapid_paraformer-Python
  - rapid_C++/C
- rapid_wenet
  - Python
  - C++
- rapid_paddlespeech-Python
标点符号
- RapidPunc

📆TODO以及任务认领

参见这里：link

🎨整体框架

flowchart LR

A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])

📣更新日志

<details> <summary>详情</summary> - 2023-08-21 v2.0.4 update: - 添加whl包支持 - 更新文档 - 2023-02-25 - 添加C++版本推理，使用onnxruntime引擎，预/后处理代码来自： [FastASR](https://github.com/chenkui164/FastASR) - 2023-02-14 v2.0.3 update: - 修复librosa读取wav文件错误 - 修复fbank与torch下fbank提取结果不一致bug - 2023-02-11 v2.0.2 update: - 模型和推理代码解耦（`rapid_paraformer`和`resources`） - 支持批量推理（通过`resources/config.yaml`中`batch_size`指定） - 增加多种输入方式（`Union[str, np.ndarray, List[str]]`） - 2023-02-10 v2.0.1 update: - 添加对输入音频为噪音或者静音的文件推理结果捕捉。 </details>