Talegenkendelse

Fra Wikipedia, den frie encyklopædi
Gå til: navigation, søg

Populært sagt er talegenkendelse (speech recognition) det modsatte af talesyntese, dvs. talegenkendelse betegner interaktionen mellem menneske og maskine som "tale-til-skreven tekst/kode" mens talesyntese betegner processen "skreven tekst-til-tale".

Indholdsfortegnelse

[redigér] Typer at talegenkendelse

Talegenkendelse opdeles typisk i to typer af genkendelse.

ASR - eller (Automated Speech Recognition/ Automatisk Talegenkendelse) og generel diktering (dictation).

[redigér] ASR

ASR er relateret til kommandostyret genkendelse (typisk mobil relaterede områder som tal (telefonnumre, datoer, bankkonti etc.), navne (omstillingsborde, bestilling af billetter etc.).

[redigér] Generel diktering

Generel diktering skal i bredeste forstand kunne genkende en hvilken som helst sætning/ indtalt besked.

[redigér] Forskelle

I grænseområdet mellem disse to typer ligger så den domænespecifikke diktering, f.eks. medicinsk diktering, som eksempelvis anvendes i forbindelse med EPJ-systemer, hvor man har udvalgt et (lingvistisk) begrænset område/ domæne for at optimere genkendelsesprocenten i et system.

[redigér] Eksempler

Typiske eksempler på eksisterende taletjenester med talegenkendelse og talegenkendelses software er:

Personlige værktøjer
Navnerum
Varianter
Handlinger
Navigation
Deltagelse
Værktøjer
Organisation
Udskriv/eksportér
Andre sprog