Maskinoversættelse

Fra Wikipedia, den frie encyklopædi
Spring til navigation Spring til søgning
Searchtool.svg Denne artikel bør gennemlæses af en person med fagkendskab for at sikre den faglige korrekthed.

Maskinoversættelse betegner automatisk oversættelse fra et sprog til et andet, hvor oversættelsen styres af en række komplicerede lingvistiske grammatikker og regler. På basis af sætningernes syntaks og semantik sigter man mod at opnå en oversættelse, der både er korrekt (dvs. sætningens opbygning/syntaks er i orden) og bevarer betydningen af den oprindelige sætning eller det oprindelige ord. Dog er der ikke altid et en-til-en forhold mellem ord på forskellige sprog, hvilket kan give udfordringer og/eller behov for manuel (af en person) redigering af en oversat tekst. Et andet problem er at mange sprog har mange ord med meget forskellige betydninger. Så længe den oversættende maskine ikke forstår teksten, kan den blot "gætte" hvilket ord nu er det rette. Dette søger man at undgå med udførlige ordlister for faste vendinger (eksempler ses i afsnittet #Typiske fejl).

Typer af maskinoversættelse[redigér | redigér wikikode]

Der findes forskellige typer af maskinoversættelse i svingende kvaliteter, de heldigste (målt i kvalitet og effektivitet) findes typisk inden for bestemte (sprogligt) afgrænsede områder, med oversættelse af en begrænset mængde af ord, fx patenttekster.

Et eksempel på et dansk firma som beskæftiger sig med maskinsættelse er Lingtech, der har udviklet et program til oversættelse af patenttekster. Det hed PaTrans og var i brug fra maj 1993 til efteråret 2007. Lingtech har nu erstattet det med et rent statistisk baseret maskinoversættelsessystem, som de kalder Sunbeam. Sunbeam er udviklet af languagelens, to forskere tidligere ansat på Copenhagen Business School.

Det dansk-norske GramTrans-projekt er et eksempel på genre-uafhængig maskinoversættelse og bygger primært på grammatisk analyse og dependensbaseret transfer.

"Dåsedansk"[redigér | redigér wikikode]

Dåsedansk er en betegnelse for en mislykket maskinoversættelse fra engelsk til dansk.[1] Udtrykket skyldes, at det engelske ord can både kan betyde dåse og kan. Nogle oversættelsessystemer erstattede konsekvent can med dåse, så maskinoversættelser giver nogle spøjse tekster, der i høj grad trænger til en kærlig hånd. Et mere nutidigt eksempel er, at Google Translate altid oversætter Application med Ansøgning.[kilde mangler] Det kræver således både kendskab til det oprindelige sprog og adgang til kildeteksten for at kunne gennemskue meningen og korrigere til en brugbar tekst.

Eksempler på fejl[redigér | redigér wikikode]

Question book-4.svg Der er få eller ingen kildehenvisninger i dette afsnit. Du kan hjælpe ved at angive kilder til de påstande, som fremføres.

Den følgende tabel gengiver et par eksempler på dansk fejloversatte engelske udtryk. Den giver et indtryk af hvilke sproglige finheder som indtil nu forhindrer en 100% korrekt oversættelse.

engelsk forkert oversættelse korrekt vending Bemærkninger
naked eye det nøgne øje det blotte øje
killer whale dræberhval spækhugger
limestone / lime rock limsten kalksten limsten kan dog bruges på olddansk
smart people smarte folk nogle gange kloge folk
chain saw kædesav motorsav Silvan har efterhånden indført det for gør-det-selv-folket
Ottoman Empire Ottomanske rige Osmanniske rige
police officer politiofficer Politibetjent politiofficer bruges kun om højtstående politifolk, ikke om gadebetjente
Kazakhstan Kazakhstan Kasakhstan
intelligence agency intelligenstjeneste efterretningstjeneste
(last) will min vilje testamente
windshield vindskærm forrude mht. biler og andre køretøjer
Madagascar Madagascar Madagaskar filmene undtaget
location Lokation placering, sted
entrepreneur Entreprenør nogle gange iværksætter

Se også[redigér | redigér wikikode]

Kilder[redigér | redigér wikikode]

Broom icon.svgDer mangler kildehenvisninger i teksten
Denne artikel har en liste med kilder, en litteraturliste eller eksterne henvisninger, men dens kilder er uklare, fordi kildehenvisninger ikke er indsat i teksten. Du kan hjælpe ved at indføre præcise kildehenvisninger på passende steder.
Text document with red question mark.svg
  • Eckhard Bick, 2007. "Dan2eng: Wide-Coverage Danish-English Machine Translation", I: Bente Maegaard (ed.), Proceedings of Machine Translation Summit XI, 10-14. Sept. 2007, Copenhagen, Denmark. pp. 37-43

Noter[redigér | redigér wikikode]