Skip to main content
Whisper Web
Eina Whisper gratuïta

Transcripció gratuïta amb Whisper — utilitzeu OpenAI Whisper al navegador

Utilitzeu el model de reconeixement de veu Whisper d'OpenAI directament al navegador — sense clau API, sense entorn Python, sense terminal. Obriu la pàgina i comenceu a transcriure amb el mateix model que fan servir milions d'usuaris.

Loading audio engine…

Whisper, simplificat

Model Whisper real d'OpenAI

No és una interfície ni un proxy d'API — Whisper Web executa el model Whisper real localment al navegador mitjançant WebAssembly i ONNX Runtime. La mateixa arquitectura, la mateixa precisió, cap dependència del núvol.

Acceleració WebGPU

Als navegadors compatibles (Chrome 113+, Edge), Whisper Web aprofita la GPU mitjançant WebGPU per a una inferència molt més ràpida. Obteniu una acceleració de 3-5x en comparació amb el processament només amb CPU.

No cal clau API

No cal registrar-se a l'API d'OpenAI, configurar la facturació ni preocupar-se pels límits de peticions. Whisper Web executa el model completament al dispositiu — sense clau API, sense càrrecs per minut, sense límits d'ús.

Sense configuració de Python ni CLI

Sense entorns conda, sense pip install, sense dependències de ffmpeg, sense controladors CUDA. Si teniu un navegador web modern, podeu executar Whisper ara mateix.

Tots els 100+ idiomes de Whisper

Suport complet d'idiomes: els mateixos 100+ idiomes que el model Whisper original. La detecció automàtica d'idioma funciona igual que la versió de Python.

Formats d'exportació estàndard

Exporteu les transcripcions com a TXT, SRT, VTT o JSON — els mateixos formats que obtindríeu amb la CLI de Whisper. Compatible amb qualsevol editor de subtítols, eina de vídeo o processador de text.

Com utilitzar Whisper al vostre navegador

1

Obriu Whisper Web

Obriu whisperweb.dev. La primera visita descarrega el model Whisper (~40-150 MB segons la mida). Després d'això, funciona sense connexió a Internet.

2

Trieu el vostre model

Seleccioneu entre els models Whisper tiny, base, small o medium. Els models més grans són més precisos però més lents. Comenceu amb 'small' per al millor equilibri.

3

Pugeu o graveu àudio

Arrossegueu i solteu qualsevol fitxer d'àudio (MP3, WAV, M4A, FLAC, OGG, WebM) o feu clic a gravar per capturar des del micròfon.

4

Obteniu la transcripció

Whisper processa l'àudio localment. Vegeu la transcripció amb marques de temps i exporteu-la com a TXT, SRT, VTT o JSON, igual que la versió de línia d'ordres.

Ideal per a

Provar Whisper sense instal·lar Python, ffmpeg ni CUDA
Executar Whisper en màquines on no podeu instal·lar programari
Transcriure fitxers de manera privada sense enviar àudio a l'API d'OpenAI
Transcripcions ràpides puntuals sense configuració de clau API ni facturació
Generar subtítols SRT/VTT a partir de fitxers d'àudio o vídeo
Provar la precisió de Whisper en diferents idiomes i tipus d'àudio
Utilitzar reconeixement de veu en Chromebooks, ordinadors compartits o dispositius restringits

Frequently Asked Questions

És aquest el model Whisper real d'OpenAI?
Sí. Whisper Web executa l'arquitectura real del model Whisper, convertida al format ONNX per a la seva execució al navegador. No és una recreació de tercers ni un model diferent amb un nom similar. Obteniu la mateixa qualitat de reconeixement de veu que l'original.
Com es compara la precisió amb la versió de Python?
Per a la mateixa mida de model (tiny, base, small), la precisió és equivalent — són els mateixos pesos del model. La diferència principal és la velocitat: l'execució al navegador accelerada per WebGPU és ràpida, però encara més lenta que executar Whisper en una GPU NVIDIA d'alta gamma mitjançant la biblioteca de Python.
Quina mida de model Whisper hauria d'utilitzar?
Comenceu amb 'small' — ofereix el millor equilibri entre precisió i velocitat per a la majoria de casos d'ús. 'Tiny' i 'base' són més ràpids però menys precisos, especialment amb veus accentuades o soroll de fons. 'Medium' ofereix una millor precisió, però requereix més temps de processament i memòria.
Funciona sense connexió a Internet?
Sí. Després de la primera visita, que descarrega els fitxers del model, Whisper Web pot funcionar completament sense connexió. El model es guarda a la memòria cau de l'emmagatzematge del navegador. Això és útil per a entorns aïllats, viatges o connexions a Internet poc fiables.
Per què és gratuït? Hi ha un límit d'ús?
El mode local gratuït de Whisper Web executa el model d'IA al vostre propi dispositiu — no hi ha costos de servidor. El mode gratuit admet fitxers de fins a 200 MB / 20 minuts sense càrrecs per minut ni límits diaris. Per a fitxers més llargs o processament per lots, Whisper Web Unlimited està disponible.
El meu àudio s'envia a OpenAI o a algun servidor?
No. Tot i que utilitza el model Whisper d'OpenAI, no s'envia cap àudio a OpenAI ni a cap altre servidor. El model s'executa completament al vostre navegador. Això és fonamentalment diferent de l'API Whisper d'OpenAI, que processa l'àudio als servidors d'OpenAI.

Proveu Whisper al vostre navegador — gratuït

Sense registre. Sense càrrega. Sense recollida de dades. Obriu el navegador i endavant.

Començar a transcriure