Home

Awesome

Webカメラの映像に自動字幕を重ねるWebページ

<img src="./sample.gif" alt="動作風景「このページを開くだけで音声認識をした結果の字幕をこんな感じで…」">

Web Speech API の音声認識を利用して文字起こしした結果をWebカメラ映像に重畳して表示するWebページです。ブラウザを画面収録して,ビデオ会議や生配信等で使用できます。

デモページ

https://1heisuzuki.github.io/speech-to-text-webcam-overlay/
*PC版のGoogle ChromeやMicrosoft Edgeのような音声認識をサポートするブラウザでアクセスしてください。Safariは2022年10月現在、挙動が不安定なので非推奨です。

目次

動作環境

かなりざっくりとした動作環境しか行っていません。
同様の環境で動かない場合はブラウザのアップデートや別ブラウザでの利用等をお試しください。

何ができるか

よくある質問

音声データ・文字起こしデータの扱いについて

使用環境関係

Google Chrome って何?どうやって使うの?

iPhoneやiPadのChromeで使えない

カメラやマイクが認識されない

機能について

相手側の音声を表示したい

文字の修正をしたい

ひらがなで表示したい

文字認識の結果を保存したい

自動で翻訳したい

他の言語を認識したい

フォントが表示されない

その他

ブログや生配信で紹介したい

外部のライブラリ(サブモジュール)について

サブモジュールとして追加しているレポジトリをまとめてcloneする場合は--recursive オプションを使用してcloneしてください。

kuromoji.js

関連資料

参考資料

コードを書くにあたって参考にしたWebページ等