Question 1

無料の音声テキスト変換の精度はどのくらいですか？

Accepted Answer

OpenAI Whisperは標準ベンチマークで4.2%の単語誤り率を達成しており、これはプロの人間による文字起こしと同等の水準です。クリアな音声では、日本語・英語をはじめほとんどの主要言語で95%以上の精度を実現します。SmallやMediumなどの大きめのモデルを選択すると、アクセントやノイズの多い音声でもさらに精度が向上します。

Question 2

この音声テキスト変換ツールは本当に無料ですか？

Accepted Answer

はい — ローカルモードはアカウント不要で完全無料です。TurboScribe（1日3回まで無料）やOtter.ai（300分超過後は月額16.99ドル）とは異なり、Whisper WebはAIを完全にデバイス上で実行するため、サーバーコストゼロ・利用制限なしでお使いいただけます。

Question 3

マイクを使ってオンラインで音声認識できますか？

Accepted Answer

はい。マイクボタンをクリックするとブラウザ内で直接録音できます。ブラウザが初回のみマイクへのアクセス許可を求めます。最大60秒の録音に対応し、停止すると自動的に文字起こしが開始されます。口述入力、メモ取り、簡単なボイスメモに最適です。

Question 4

音声テキスト変換はオフラインでも使えますか？

Accepted Answer

はい。初回のWhisperモデルダウンロード（Baseで約40 MB、Smallで約150 MB）後は、完全にオフラインで動作します。モデルはブラウザにキャッシュされるため、2回目以降はインターネット接続なしで利用可能です — 常時接続が必要なクラウドサービスとは異なります。

Question 5

音声データのプライバシーとセキュリティは確保されていますか？

Accepted Answer

すべての処理はWebGPUまたはWebAssemblyを使用してブラウザ内でローカルに行われます。音声がアップロード・保存・送信されることは一切ありません。そのため、医療の口述記録、法律関連の録音、プライベートな会議、HIPAA対応が必要なワークフローなど、機密性の高いコンテンツにも安心してご利用いただけます。

Question 6

無料の音声認識はどの言語に対応していますか？

Accepted Answer

Whisperは日本語、英語、スペイン語、中国語（普通話）、フランス語、ドイツ語、韓国語、アラビア語、ヒンディー語、ポルトガル語など100以上の言語に対応しています。自動言語検出で話している言語を識別するほか、最適な精度のために手動で言語を選択することもできます。

音声テキスト変換 — AIによる無料オンライン文字起こし

Whisper Webの音声テキスト変換が選ばれる理由

高精度な音声認識

リアルタイム処理

100以上の言語に対応

完全なプライバシー保護

インストール不要

柔軟なエクスポート機能

音声をテキストに変換する方法

録音またはアップロード

モデルを選択

自動で文字起こし

テキストをエクスポート

音声テキスト変換の活用例

Frequently Asked Questions

関連ツール

音声テキスト変換を始めよう — 無料＆プライベート