AI-ondertitelgenerator: gratis SRT- en VTT-bestanden maken
Ontdek hoe u met AI nauwkeurige ondertitels genereert met OpenAI Whisper — gratis, privacyvriendelijk en direct in uw browser. Exporteer SRT- en VTT-bestanden voor YouTube, Premiere Pro en elk videoplatform.
AI-ondertitelgeneratoren hebben videoproductie getransformeerd. In plaats van urenlang handmatig bijschriften te typen, kunt u nu in enkele minuten nauwkeurige SRT- en VTT-ondertitelbestanden genereren — gratis en zonder aanmelding. Deze handleiding laat u precies zien hoe u professionele ondertitels maakt met OpenAI's Whisper-model, direct in uw browser met Whisper Web.
Of u nu een YouTuber bent die bijschriften toevoegt voor betere SEO, een filmmaker die deliverables voorbereidt voor distributeurs, of een docent die cursusvideo's toegankelijk maakt — AI-gestuurde ondertitelgeneratie elimineert het meest tijdrovende deel van de postproductie. Het beste? Moderne browsergebaseerde tools draaien het AI-model direct op uw apparaat, zodat uw audio nooit uw computer verlaat.
Belangrijkste punten
- AI-ondertitelgeneratie gebruikt spraakherkenningsmodellen zoals OpenAI Whisper om audio automatisch te transcriberen en getimede ondertitelbestanden te produceren
- SRT en VTT zijn de twee meest gebruikte ondertitelformaten — SRT voor videobewerkers en YouTube, VTT voor webspelers en streaming
- Browsergebaseerde tools zoals Whisper Web laten u gratis ondertitels genereren zonder audio naar een server te uploaden
- Nauwkeurigheid bereikt doorgaans 95-97% bij heldere audio, met Whisper large-v3 die 100+ talen ondersteunt
- Nabewerking is 5-10x sneller dan handmatige transcriptie, waardoor AI-ondersteunde ondertiteling de meest efficiënte workflow is
Wat is een AI-ondertitelgenerator?
Een AI-ondertitelgenerator is een tool die automatische spraakherkenning (ASR) gebruikt om gesproken audio om te zetten in getimede tekst — ondertitelbestanden die synchroniseren met uw video. In tegenstelling tot basis transcriptie omvat ondertitelgeneratie nauwkeurige tijdstempels voor elk segment, waardoor bestanden ontstaan die u direct kunt importeren in videobewerkers, uploaden naar YouTube of insluiten in webspelers.
De onderliggende technologie is enorm verbeterd sinds OpenAI het Whisper-model in september 2022 uitbracht. Getraind op 680.000 uur aan meertalige audiodata, bereikt Whisper menselijke nauwkeurigheid op veel benchmarks. De open-source aard (MIT-licentie) betekent dat iedereen het kan draaien — inclusief direct in een webbrowser via projecten zoals Whisper Web, dat WebAssembly en WebGPU gebruikt om het model volledig op uw apparaat uit te voeren.
SRT vs VTT: Welk ondertitelformaat heeft u nodig?
Voordat u ondertitels genereert, is het handig om de twee dominante formaten te begrijpen:
SRT (SubRip Subtitle)
SRT is het meest ondersteunde ondertitelformaat. Het is een platte-tekstbestand met genummerde items, elk met een tijdstempelbereik en de bijbehorende tekst:
1
00:00:01,000 --> 00:00:04,500
Welkom bij deze tutorial over AI-ondertitelgeneratie.
2
00:00:05,200 --> 00:00:09,800
We behandelen hoe u professionele SRT-bestanden gratis maakt.
Gebruik SRT voor: YouTube-uploads, Adobe Premiere Pro, DaVinci Resolve, Final Cut Pro, Vimeo, Facebook en de meeste sociale mediaplatforms.
VTT (Web Video Text Tracks)
VTT (WebVTT) is het web-native ondertitelformaat, ondersteund door het HTML5 <video>-element. Het lijkt op SRT maar heeft extra opmaakmogelijkheden:
WEBVTT
00:00:01.000 --> 00:00:04.500
Welkom bij deze tutorial over AI-ondertitelgeneratie.
00:00:05.200 --> 00:00:09.800
We behandelen hoe u professionele VTT-bestanden gratis maakt.
Gebruik VTT voor: HTML5-videospelers, HLS/DASH-streaming, webapplicaties en elke browsergebaseerde videolevering. VTT ondersteunt CSS-styling, positionering en tekstopmaak die SRT niet aankan.
Snelle vergelijking
| Functie | SRT | VTT |
|---|---|---|
| YouTube-upload | ✅ Ja | ✅ Ja |
| Premiere Pro / DaVinci Resolve | ✅ Ja | ⚠️ Beperkt |
| HTML5-webspelers | ⚠️ Conversie nodig | ✅ Native |
| CSS-stylingondersteuning | ❌ Nee | ✅ Ja |
| Tijdstempelformaat | Komma (00:00:01,000) | Punt (00:00:01.000) |
| Opeenvolgende nummering | Vereist | Optioneel |
Vuistregel: Gebruik SRT als uw ondertitels naar een videobewerker of YouTube gaan. Gebruik VTT als ze voor een webgebaseerde videospeler of streamingplatform zijn. Whisper Web exporteert TXT-, JSON-, SRT- en VTT-formaten, zodat u één keer genereert en overal gebruikt.
Hoe genereert u gratis ondertitels met Whisper Web
Hier is een stapsgewijze uitleg voor het maken van ondertitelbestanden met Whisper Web, een gratis browsergebaseerde tool aangedreven door OpenAI Whisper:
Stap 1: Open Whisper Web
Ga naar whisperweb.dev in een moderne browser (Chrome, Edge of Firefox aanbevolen). Geen account aanmaken, geen installatie, geen API-sleutel nodig.
Stap 2: Selecteer uw model
Kies een Whisper-model op basis van uw behoeften:
- Tiny (75MB): Snelste download en verwerking. Goed genoeg voor heldere, eenmalige Engelstalige audio. ~10-12% Word Error Rate (WER).
- Base (142MB): Betere nauwkeurigheid met minimale snelheidsafweging. Aanbevolen voor snelle concepten. ~7-8% WER.
- Small (466MB): Sterke balans tussen snelheid en nauwkeurigheid. Geschikt voor de meeste gebruikssituaties. ~5-6% WER.
- Medium (1.5GB): Bijna-productienauwkeurigheid. Best voor meertalige inhoud of spraak met accent. ~4-5% WER.
- Large-v3-turbo: Hoogste beschikbare nauwkeurigheid. Gebruik dit voor definitieve, publicatieklare ondertitels. ~3-4% WER bij heldere audio.
Voor ondertitelwerk raden we aan te beginnen met Small voor concepten en Large-v3-turbo voor definitieve export. Het model wordt eenmalig gedownload en in uw browser gecachet voor toekomstige sessies.
Stap 3: Upload of neem audio op
U kunt een bestaand audio-/videobestand uploaden (MP3, WAV, M4A, MP4, WebM en meer) of direct opnemen via uw microfoon. Bij videobestanden haalt Whisper Web automatisch de audiotrack eruit — geen voorafgaande conversie nodig.
Stap 4: Transcribeer
Klik op de transcribeerknop en zie hoe de AI uw audio verwerkt. De verwerkingstijd hangt af van uw hardware en de modelgrootte:
- Een bestand van 10 minuten met het Small-model verwerkt doorgaans in 1-3 minuten op een moderne laptop
- WebGPU-versnelling (beschikbaar in Chrome/Edge) kan dit 3-5x versnellen
- Alle verwerking vindt lokaal plaats — uw audio verlaat nooit uw apparaat
Stap 5: Exporteer als TXT, JSON, SRT of VTT
Zodra de transcriptie voltooid is, exporteert u uw ondertitels in het gewenste formaat — TXT voor platte tekst, JSON voor gestructureerde data, of SRT/VTT voor getimede ondertitels. Controleer de uitvoer, breng correcties aan en uw ondertitelbestand is klaar voor gebruik. Voor meer details over het volledige proces, zie onze startgids.
Tips voor de beste ondertitelnauwkeurigheid
AI-ondertitelgeneratoren werken het beste wanneer u zowel uw invoer als uw workflow optimaliseert. Hier zijn bewezen technieken om de nauwkeurigheid te maximaliseren:
Audiokwaliteit is het belangrijkst
- Gebruik een speciale microfoon: Een USB-condensatormicrofoon van €50 levert aanzienlijk betere resultaten dan de ingebouwde microfoon van een laptop
- Verminder achtergrondgeluid: Neem op in een stille kamer. Zelfs mild achtergrondgeluid kan de WER met 5-10 procentpunten verhogen
- Houd een consistent volume aan: Vermijd te dicht bij of te ver van de microfoon te spreken. Clipping en lage niveaus schaden beide de nauwkeurigheid
- Gebruik waar mogelijk verliesvrije formaten: WAV of FLAC behoudt meer audiodetail dan gecomprimeerd MP3, hoewel het verschil minimaal is bij heldere spraak
Kies de juiste taalinstelling
Als uw audio in een andere taal dan Engels is, stel dan expliciet de taal in voordat u transcribeert in plaats van te vertrouwen op automatische detectie. Dit kan de nauwkeurigheid met 2-5% verbeteren bij niet-Engelse inhoud, vooral voor talen met vergelijkbare fonemen.
Nabewerking: De 80/20 van ondertitelwerk
Zelfs met 95%+ nauwkeurigheid profiteren AI-gegenereerde ondertitels van een snelle controle. Focus op:
- Eigennamen: Namen van personen, merken en technische termen zijn de meest voorkomende fouten
- Homofonen: "hun/hen/hunne", "jouw/u" — contextafhankelijke woorden die het model soms verwart
- Getallen en acroniemen: "15" vs "vijftien", "AWS" vs "A.W.S." — controleer deze tegen uw bron
- Tijdstempeluitlijning: Soms kunnen segmentgrenzen midden in een zin vallen. Pas aan waar nodig voor leesbaarheid
Deze nabewerkingsronde duurt doorgaans 10-15 minuten per uur inhoud — vergeleken met 4-6 uur voor volledig handmatige transcriptie. Dat is een productiviteitswinst van ruwweg 20x.
Platformspecifieke ondertitelhandleidingen
YouTube
YouTube accepteert SRT, VTT en verschillende andere formaten. Upload uw ondertitelbestand via YouTube Studio → Video → Ondertitels → Taal toevoegen → Bestand uploaden. YouTube genereert ook automatisch bijschriften, maar Whisper presteert consistent beter dan YouTube's ingebouwde ASR, vooral voor niet-Engelse inhoud, technische woordenschat en spraak met accent.
Pro-tip: Het toevoegen van nauwkeurige ondertitels aan YouTube-video's verbetert de zoekresultaten omdat YouTube bijschrifttekst indexeert. Video's met handmatig geüploade ondertitels scoren hoger dan die welke vertrouwen op automatische bijschriften, volgens YouTube's eigen documentatie voor makers.
Adobe Premiere Pro
Importeer SRT-bestanden via Bestand → Importeren → selecteer uw .srt-bestand. Premiere Pro 2024+ behandelt SRT als een native bijschriftspoor. U kunt de bijschriften opmaken, de timing op de tijdlijn aanpassen en ze in de export branden. Voor open bijschriften (ingebrand in video), gebruik het Essential Graphics-paneel na het importeren.
DaVinci Resolve
DaVinci Resolve ondersteunt SRT-import via de Media Pool. Sleep het SRT-bestand naar de tijdlijn en Resolve maakt een ondertitelspoor aan. De gratis versie van Resolve verwerkt SRT-bestanden prima — geen Studio-licentie nodig voor basisondertitelimport.
Webinsluiting met VTT
Voor webontwikkelaars die video met ondertitels insluiten, gebruik het <track>-element met VTT-bestanden:
<video controls>
<source src="video.mp4" type="video/mp4">
<track src="captions.vtt" kind="subtitles"
srclang="en" label="English" default>
</video>
Dit geeft kijkers een native bijschriftknop in de videobediening van de browser, zonder dat JavaScript nodig is.
Waarom browsergebaseerde ondertitelgeneratie?
U vraagt zich misschien af: waarom ondertitels genereren in een browser in plaats van een cloudservice zoals Rev, Descript of Otter.ai? Drie redenen:
- Privacy: Uw audio verlaat nooit uw apparaat. Voor inhoud onder NDA, niet-uitgebracht beeldmateriaal of gevoelige opnames elimineert dit het risico op gegevensblootstelling volledig. Lees meer over privacy bij spraakherkenning.
- Kosten: Cloudondertiteldiensten rekenen $0,25-$2,00 per minuut audio (per 2026-03). Voor een YouTube-video van 20 minuten is dat $5-$40. Vermenigvuldig met een wekelijks uploadschema en u geeft $260-$2.000+ per jaar uit. Browsergebaseerde Whisper-inferentie is momenteel gratis.
- Geen leveranciersafhankelijkheid: Clouddiensten kunnen prijzen wijzigen, functies stopzetten of offline gaan. Whisper in uw browser draaien geeft u onafhankelijkheid van elke aanbieder. Het model is open-source en zal altijd beschikbaar zijn.
Voor een gedetailleerde vergelijking van browsergebaseerde tools met cloud-API's, zie onze Whisper vs Google STT vs Deepgram-vergelijking.
Meertalige ondertitels met Whisper
Een van Whisper's opvallende kenmerken voor ondertitelgeneratie is de meertalige capaciteit. Het model ondersteunt 100+ talen en kan zelfs vreemdtalige audio direct naar Engelse ondertitels vertalen. Dit is bijzonder waardevol voor:
- Internationale contentmakers: Genereer ondertitels in de oorspronkelijke taal en vertaal vervolgens om een wereldwijd publiek te bereiken
- Taalleerplatforms: Maak tweetalige ondertitelsporen voor educatieve video's
- Documentairemakers: Ondertitel interviews in meerdere talen zonder aparte vertalers voor elke taal in te huren
- Bedrijfstrainingen: Lokaliseer trainingsvideo's voor kantoren in verschillende landen
Whisper's any-to-English-vertaalmodus is bijzonder krachtig: voer audio in het Japans, Duits of Arabisch in en het produceert direct Engelse ondertitels — geen tussenliggende transcriptiestap nodig. Whisper Web ondersteunt meerdere talen voor zowel transcriptie als vertaling.
Veelgestelde vragen
Hoe nauwkeurig zijn AI-gegenereerde ondertitels?
Bij heldere, goed opgenomen audio in het Engels bereiken moderne AI-modellen zoals Whisper large-v3 95-97% nauwkeurigheid (3-5% Word Error Rate). De nauwkeurigheid neemt af bij achtergrondgeluid, zware accenten of overlappende sprekers. Voor professionele opleveringen kunt u rekenen op een snelle handmatige controle na AI-generatie.
Kan ik ondertitels offline genereren?
Ja. Met Whisper Web kunt u, zodra het model is gedownload en in uw browser is gecachet, transcriberen en ondertitels genereren zonder internetverbinding. Dit maakt het ideaal voor werken in het vliegtuig, op afgelegen locaties of in air-gapped omgevingen.
Welke video- en audioformaten worden ondersteund?
Whisper Web accepteert de meeste gangbare audio- en videoformaten, waaronder MP3, WAV, FLAC, M4A, OGG, MP4, WebM en MKV. Bij videobestanden wordt de audiotrack automatisch geëxtraheerd voor verwerking — u hoeft niet eerst naar audio te converteren.
Hoe lang duurt het om ondertitels te genereren voor een video van 1 uur?
De verwerkingstijd hangt af van de modelgrootte en uw hardware. Met het Small-model op een moderne laptop verwerkt een bestand van 1 uur doorgaans in 5-15 minuten. Met WebGPU-versnelling en hetzelfde model daalt dit naar 2-5 minuten. Het gebruik van grotere modellen verhoogt de nauwkeurigheid maar ook de verwerkingstijd.
Zijn AI-gegenereerde ondertitels goed genoeg voor YouTube?
Ja, absoluut. Whisper-gegenereerde ondertitels presteren consistent beter dan YouTube's ingebouwde automatische bijschriften qua nauwkeurigheid, vooral voor niet-Engelse inhoud en technische woordenschat. Veel professionele YouTubers gebruiken Whisper-gebaseerde tools voor hun ondertitelworkflow. Een snelle controle na generatie zorgt voor uitzendkwaliteit.
Conclusie
AI-ondertitelgeneratie is veranderd van een premiumservice naar een gratis, browsergebaseerde tool die iedereen kan gebruiken. Met OpenAI Whisper als kracht achter de transcriptie en formaten zoals SRT en VTT die universele compatibiliteit bieden, is er geen reden om handmatig ondertitels te typen of per minuut cloudkosten te betalen (per 2026-03) terwijl er gratis lokale alternatieven bestaan.
De workflow is eenvoudig: upload uw audio of video, laat de AI transcriberen en van tijdstempels voorzien, exporteer als TXT, JSON, SRT of VTT, doe een snelle nauwkeurigheidscontrole en importeer in uw videobewerker of platform. Van begin tot eind kunt u een video van 30 minuten ondertitelen in minder dan 10 minuten.
Klaar om uw eerste ondertitelbestand te genereren? Open Whisper Web — de lokale modus is momenteel gratis, draait volledig in uw browser en uw audio blijft op uw apparaat. Geen aanmelding, geen API-sleutel, geen kosten per minuut. Alleen nauwkeurige, AI-gestuurde ondertitels in enkele minuten.