Skip to main content
Whisper Web
Darmowe narzędzie Whisper

Darmowa transkrypcja Whisper — uruchom OpenAI Whisper w przeglądarce

Korzystaj z modelu OpenAI Whisper do zamiany audio na tekst bezpośrednio w przeglądarce — bez klucza API, środowiska Pythona czy linii poleceń. Po prostu otwórz stronę i zacznij transkrybować tym samym modelem, z którego korzystają miliony.

Loading audio engine…

Whisper, uproszczony

Prawdziwy model OpenAI Whisper

To nie opakowanie ani proxy API — Whisper Web uruchamia rzeczywisty model Whisper lokalnie w przeglądarce, korzystając z WebAssembly i ONNX Runtime. Ta sama architektura, ta sama dokładność, brak zależności od chmury.

Przyspieszenie WebGPU

W obsługiwanych przeglądarkach (Chrome 113+, Edge) Whisper Web wykorzystuje GPU przez WebGPU do znacznie szybszego wnioskowania. Oczekuj 3-5x przyspieszenia w porównaniu z przetwarzaniem tylko na CPU.

Bez klucza API

Pomiń rejestrację do OpenAI API, konfigurację płatności i limity użycia. Whisper Web uruchamia model całkowicie na Twoim urządzeniu — bez klucza API, opłat za minutę ani limitów użycia.

Bez Pythona ani konfiguracji CLI

Bez środowisk conda, instalacji pip, zależności ffmpeg czy sterowników CUDA. Jeśli masz nowoczesną przeglądarkę, możesz uruchomić Whisper już teraz.

Wszystkie 100+ języków Whisper

Pełne wsparcie języków — te same 100+ języków dostępne w oryginalnym modelu Whisper. Automatyczne wykrywanie języka działa identycznie jak w wersji Pythona.

Standardowe formaty eksportu

Eksportuj transkrypcje jako TXT, SRT, VTT lub JSON — te same formaty, które uzyskasz z CLI Whisper. Zgodne z dowolnym edytorem napisów, narzędziem wideo czy procesorem tekstu.

Jak używać Whisper w przeglądarce

1

Otwórz Whisper Web

Przejdź na whisperweb.dev. Przy pierwszej wizycie pobierany jest model Whisper (~40-150 MB w zależności od rozmiaru). Potem działa offline.

2

Wybierz model

Wybierz spośród modeli Whisper: tiny, base, small lub medium. Większe modele są dokładniejsze, ale wolniejsze. Zacznij od 'small' dla najlepszego balansu.

3

Prześlij lub nagraj audio

Przeciągnij i upuść dowolny plik audio (MP3, WAV, M4A, FLAC, OGG, WebM) lub kliknij nagrywanie, aby przechwycić dźwięk z mikrofonu.

4

Odbierz transkrypcję

Whisper przetwarza audio lokalnie. Przejrzyj transkrypcję ze znacznikami czasu, a następnie wyeksportuj jako TXT, SRT, VTT lub JSON — dokładnie jak w wersji z linii poleceń.

Idealny do

Wypróbowania Whisper bez instalacji Pythona, ffmpeg czy CUDA
Uruchamiania Whisper na komputerach, gdzie nie można instalować oprogramowania
Prywatnej transkrypcji plików bez wysyłania audio do API OpenAI
Szybkich, jednorazowych transkrypcji bez konfiguracji klucza API i płatności
Generowania napisów SRT/VTT z plików audio lub wideo
Testowania dokładności Whisper w różnych językach i typach audio
Korzystania z zamiany mowy na tekst na Chromebookach, komputerach współdzielonych lub urządzeniach z ograniczonym dostępem

Frequently Asked Questions

Czy to prawdziwy model OpenAI Whisper?
Tak. Whisper Web uruchamia rzeczywistą architekturę modelu Whisper, przekonwertowaną do formatu ONNX na potrzeby wykonania w przeglądarce. To nie jest odtworzenie przez podmiot trzeci ani inny model o podobnej nazwie. Otrzymujesz tę samą jakość rozpoznawania mowy co w oryginale.
Jak dokładność porównuje się z wersją Pythona?
Dla tego samego rozmiaru modelu (tiny, base, small) dokładność jest równoważna — to te same wagi modelu. Główna różnica to prędkość: wnioskowanie z akceleracją WebGPU w przeglądarce jest szybkie, ale nadal wolniejsze niż uruchomienie Whisper na wysokiej klasy GPU NVIDIA przez bibliotekę Pythona.
Który rozmiar modelu Whisper wybrać?
Zacznij od 'small' — oferuje najlepszy balans dokładności i prędkości dla większości zastosowań. 'Tiny' i 'base' są szybsze, ale mniej dokładne, szczególnie przy mowie z akcentem lub hałasem w tle. 'Medium' daje lepszą dokładność, ale wymaga więcej czasu przetwarzania i pamięci.
Czy działa offline?
Tak. Po pierwszej wizycie, gdy pliki modelu zostaną pobrane, Whisper Web może działać całkowicie offline. Model jest zapisywany w pamięci przeglądarki. Jest to przydatne w środowiskach odizolowanych, podczas podróży lub przy słabym połączeniu internetowym.
Dlaczego to jest darmowe? Czy jest limit użycia?
Darmowy tryb lokalny Whisper Web uruchamia model AI na Twoim własnym urządzeniu — nie ma kosztów serwerowych. Tryb darmowy obsługuje pliki do 200 MB / 20 minut bez opłat za minutę ani dziennych limitów. Dla dłuższych plików lub przetwarzania wsadowego dostępny jest Whisper Web Unlimited.
Czy moje audio jest wysyłane do OpenAI lub jakiegokolwiek serwera?
Nie. Pomimo używania modelu OpenAI Whisper, żadne audio nie jest wysyłane do OpenAI ani żadnego innego serwera. Model działa całkowicie w Twojej przeglądarce. Jest to fundamentalnie różne od OpenAI Whisper API, które przetwarza audio na serwerach OpenAI.

Wypróbuj Whisper w przeglądarce — za darmo

Bez rejestracji. Bez wysyłania plików. Bez zbierania danych. Po prostu otwórz przeglądarkę i zacznij.

Rozpocznij transkrypcję