Hoe werkt spraaktechnologie eigenlijk? Als je tegen je computer praat wat gebeurt er dan, hoe wordt de spraak omgezet in de taal van de computer en dan naar de tekst die op het scherm verschijnt?

Tony , 40 jaar
17 april 2011

Wat gebeurd er hardwarematig als je bv een programma als Dragon gebruikt om je taal om te zetten naar geschreven taal?
Hoe kan een computer de gesproken taal omzetten naar machine taal?

Antwoord

De computer hoeft de gesproken taal helemaal niet om te zetten naar machinetaal. Wat hij wel moet doen is een heel proces doorlopen om uiteindelijk te komen tot geschreven taal. De computer start van de geluidsgolven die opgevangen worden door de microfoon. Deze geluidsgolven variëren in frequentie en in grootte; dat is nu net wat wij geluid noemen. Een eerste stap bestaat erin de geluidsgolf om te zetten in een lange rij van getalletjes. Deze rij getalletjes bevat, ruwweg, dezelfde informatie als de variaties in frequentie en grootte van de oorspronkelijke geluidsgolf. Deze rij getalletjes noemen we een digitaal signaal. Een tweede stap bestaat er nu in binnen dit signaal de aparte stukjes te onderscheiden gevormd door medeklinkers, klinkers, en pauzes tussen woorden. Dit kan een computer niet zomaar, omdat de klanken bij elke spreker anders klinken. Daarom wordt de computer eerst getraind doordat je hem een aantal gecontroleerde woorden (bestaande uit klinkers en medeklinkers) laat horen, zodat hij weet hoe jij praat. Bij gebrek aan deze training zal de computer ook nog wel een poging wagen, maar zal zich dan baseren op gemiddelde waarden die op voorhand reeds in zijn programma zitten. Het resultaat zal dan minder goed zijn. In de derde en laatste stap moet hij de onderscheiden klinkers en medeklinkers aan elkaar rijgen tot bestaande woorden. Dit is niet zo evident: als de computer, bijvoorbeeld, "watervallen" hoort, kan dit in de context zijn van een zin "je mag niet in het water vallen" of in een zin "in Congo zijn grote watervallen". Alles bij elkaar is dit een enorm moeilijk proces en het is dus geen wonder dat de computer af en toe foutjes maakt. Maar toch heeft men al indrukwekkende vooruitgang geboekt in dit moeilijk probleem. Met "men" bedoel ik de wetenschappers en ingenieurs, want zij zijn het uiteindelijk die de computer moeten programmeren voor spraakherkenning! De computer zelf kan alleen maar doen wat hem letterlijk opgedragen wordt in zijn programma.

Reacties op dit antwoord

Er zijn nog geen reacties op deze vraag.

Enkel de vraagsteller en de wetenschapper kunnen reageren op een antwoord.

Beantwoord door

 Jan Van den Bussche

informatica bio-informatica ecologie

Universiteit Hasselt
Agoralaan Universitaire Campus-gebouw D BE-3590 Diepenbeek
http://www.uhasselt.be/

Zoek andere vragen

© 2008-2025
Ik heb een vraag wordt gecoördineerd door Eos wetenschap. Voor vragen over het platform kan je terecht bij liam.verbinnen@eos.be