Skip to main content
Whisper Web
無料字幕ツール

字幕を生成 — 無料でSRT・VTTファイルを作成

あらゆる音声・動画から正確な字幕ファイルを作成できます。AIによる高精度な処理がブラウザ上で完結。YouTube用のSRTやWeb動画用のVTT形式でエクスポートできます。

Loading audio engine…

プロ品質の字幕を数分で作成

SRT・VTTエクスポート

YouTube、Premiere Pro、DaVinci Resolve対応の業界標準SRTファイル、またはHTML5ビデオプレーヤーやWebプラットフォーム向けのVTTファイルを生成できます。

動画・音声に対応

MP4、MOV、WebM、MP3、WAVなど、あらゆるメディア形式をアップロードできます。Whisper Webが音声を抽出し、タイミング付きの字幕を自動生成します。

100以上の言語に対応

100以上の言語で字幕を生成できます。グローバルな視聴者に向けて発信する国際的なコンテンツクリエイターに最適です。

正確なタイミング

AIが生成するタイムスタンプにより、字幕が音声に正確に同期されます。ほとんどのコンテンツで手動でのタイミング調整は不要です。

公開前のコンテンツも安心

未公開コンテンツの字幕を生成する場合も、動画がブラウザの外に出ることはありません。クラウド処理がないため、情報漏洩のリスクがありません。

即座にダウンロード

生成後すぐに字幕ファイルをダウンロードできます。メールアドレスの登録や処理待ちは不要です。

字幕の生成方法

1

動画または音声をアップロード

Whisper Webにファイルをドラッグ&ドロップしてください。MP4、MOV、WebM、MP3、WAV、M4Aなど多数のフォーマットに対応しています。

2

言語を選択

音声の言語を選択するか、自動検出にお任せください。100以上の言語に対応しています。

3

字幕を生成

AIモデルがブラウザ内でローカルにファイルを処理します。生成された字幕がリアルタイムで表示されます。

4

SRTまたはVTTでエクスポート

SRT形式(YouTube、動画編集ソフト用)またはVTT形式(Webプレーヤー用)で字幕ファイルをダウンロードし、プラットフォームに直接アップロードできます。

主な活用シーン

YouTube動画の字幕・クローズドキャプション
TikTokやInstagram Reelsのアクセシビリティ対応キャプション
オンラインコースやeラーニング動画の字幕
企業研修動画のキャプション
結婚式やイベント動画の字幕
ドキュメンタリーや映画の字幕
ウェビナーやプレゼンテーションの録画
聴覚に障がいのある視聴者向けのSNSコンテンツ
Whisper Web 開発チームより

動画にナレーションが必要ですか?

字幕ができました — 次は音声を追加しましょう。Sonickerには有名人、キャラクター、プロのナレーションなど50以上のAI音声モデルがあります。テキスト読み上げ、ボイスクローン、オリジナル音声の作成をお試しください。無料で始められます。

50以上のAI音声を試す — 無料

Frequently Asked Questions

どの字幕形式でエクスポートできますか?
Whisper WebはSRT(SubRip)形式とVTT(WebVTT)形式でエクスポートできます。SRTは最も広く対応されている形式で、YouTube、Vimeo、Premiere Pro、Final Cut Pro、DaVinci Resolveと互換性があります。VTTはWebベースの動画プレーヤーやHTML5ビデオ向けに設計されています。
YouTube動画用の字幕を生成できますか?
はい。SRTファイルとしてエクスポートし、YouTube Studioの字幕設定からアップロードしてください。YouTubeは手動キャプションアップロード用のSRTファイルに対応しています。
生成される字幕の精度はどの程度ですか?
OpenAI Whisperは標準的なベンチマークで4.2%の単語エラー率を達成しています。ノイズが少ないクリアな音声であれば、95%以上の精度が期待できます。固有名詞、ブランド名、専門用語については、公開前に確認することをおすすめします。
ダウンロード前に字幕を編集できますか?
はい。トランスクリプトはブラウザ上に表示され、エクスポート前に確認できます。詳細なタイミング調整が必要な場合は、エクスポートしたSRT/VTTファイルをテキストエディタやAegisubなどの字幕編集ソフトで編集できます。
動画の長さに制限はありますか?
厳密な制限はありません。処理はお使いのデバイス上で実行されます。最新のデバイスであれば、2時間程度の動画は問題なく処理できます。WebGPUが有効な場合、10分の動画で1〜3分で字幕が生成されます。
音声の言語と異なる言語で字幕を生成できますか?
Whisper Webは音声の言語で字幕を生成します(文字起こしであり、翻訳ではありません)。翻訳された字幕が必要な場合は、出力結果を別途翻訳サービスにかけてください。

数分で字幕を生成 — 完全無料

登録不要。サーバーへのアップロードなし。透かしなし。プロ品質の字幕をすぐに。

今すぐ字幕を生成