Apertium

Apertium
Stabil version3.1.1 (21. maj 2009)
Skrevet iC++
OperativsystemPOSIX-kompatibelt
Tilgængelig påMulti-sproget
TypeMaskinoversættelse
LicensGNU General Public License
Hjemmesidewww.apertium.org

Apertium er en software-platform til regelbaseret maskinoversættelse af sprog. Det er fri software og udgivet under licensen GNU General Public License.

Apertium er et maskinoversættelsessystem med "snæver overførsel" (uden semantik), som bruger finite-state transducere til alle leksikalske transformationer og skjulte Markov modeller til ordklassetagging og behandling af ordklasse-flertydighed. For nogle sprogpar (f.eks. bretonsk-fransk) benyttes desuden tagging ifølge restriktionsgrammatik (Constraint Grammar).

Historie

Apertium opstod som en af maskinoversættelses-løsningerne i projektet OpenTrad, som var finansieret af den spanske regering. Det var oprindeligt skabt til at oversætte mellem tæt forbundne sprog, men er senere blevet udvidet til også at kunne behandle mere fjerntstående sprogpar. For at udvide med maskinoversættelse af et nyt sprogpar er det blot nødvendigt at udvikle de lingvistiske oplysninger (ordbøger, regler) i et veldefineret XML-format.

De sprogdata, som er udviklet for Apertium (i samarbejde med Universidade de Vigo, Universitat Politècnica de Catalunya og Universitat Pompeu Fabra) understøtter nu (i stabile versioner) sprogene asturiansk, baskisk, bretonsk, bulgarsk, catalansk, dansk, engelsk, esperanto, fransk, galicisk, islandsk, makedonsk, norsk (bokmål og nynorsk), occitansk, portugisisk, rumænsk, spansk, svensk og walisisk. Den fulde liste fremgår af nedenstående tabel.

Adskillige firmaer er ligeledes invelveret i udviklingen af Apertium, herunder Prompsit Language Engineering, Imaxin Software og Eleka Ingeniaritza Linguistikoa.

Projekt har deltaget i Google Summer of Code i 2009 and 2010 og i Google Code-in 2010.[1]

Sprogpar

Liste over de nuværende stabile sprogpar. (Hold musen over sprogkoderne for at se de sprog, de repræsenterer).

ast eu br bg ca da en eo fr gl is mk nb nn oc pt ro es sv cy
AsturianskNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNej
BaskiskNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejJa (→)NejNej
BretonskNejNejNejNejNejNejNejJa (→)NejNejNejNejNejNejNejNejNejNejNej
BulgarskNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNejNejNejNejNejNejNej
CatalanskNejNejNejNejNejJa (⇄)Ja (←)Ja (⇄)NejNejNejNejNejJa (⇄)Ja (⇄)NejJa (⇄)NejNej
DanskNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejJa (←)Nej
EngelskNejNejNejNejJa (⇄)NejJa (⇄)NejJa (⇄)Ja (←)Ja (←)NejNejNejNejNejJa (⇄)NejJa (←)
EsperantoNejNejNejNejJa (←)NejJa (⇄)NejNejNejNejNejNejNejNejNejJa (←)NejNej
FranskNejNejJa (←)NejJa (⇄)NejNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNej
GalicianNejNejNejNejNejNejJa (⇄)NejNejNejNejNejNejNejJa (⇄)NejJa (⇄)NejNej
IslandskNejNejNejNejNejNejJa (→)NejNejNejNejNejNejNejNejNejNejNejNej
MakedonskNejNejNejJa (⇄)NejNejJa (→)NejNejNejNejNejNejNejNejNejNejNejNej
Norsk (Bokmål)NejNejNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNejNejNejNejNej
Norsk (Nynorsk)NejNejNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNejNejNejNejNej
OccitanskNejNejNejNejJa (⇄)NejNejNejNejNejNejNejNejNejNejNejJa (⇄)NejNej
PortugisiskNejNejNejNejJa (⇄)NejNejNejNejJa (⇄)NejNejNejNejNejNejJa (⇄)NejNej
RumænskNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejNejJa (←)NejNej
SpanskJa (⇄)Ja (←)NejNejJa (⇄)NejJa (⇄)Ja (⇄)Ja (⇄)NejNejNejNejNejJa (⇄)Ja (⇄)Ja (←)NejNej
SvenskNejNejNejNejNejJa (→)NejNejNejNejNejNejNejNejNejNejNejNejNej
WalisiskNejNejNejNejNejNejJa (→)NejNejNejNejNejNejNejNejNejNejNejNej

Note:

  • → betyder, at der findes en ordbog fra sproget i forspalten til kolonnens sprogversion
  • ← betyder, at der findes en ordbog fra kolonnens sprogversion til sproget i forspalten
  • ⇄ betyder, at der findes ordbøger fra og til begge sprogversioner

Kilder

  1. ^ "Google Summer of Code page". Arkiveret fra originalen 16. marts 2011. Hentet 29. december 2010.
  • Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
  • Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.


Eksterne henvisninger

Medier brugt på denne side

Apertium-tolk.png
Forfatter/Opretter: Wynand Winterbach and Francis Tyers, Licens: GPL
Screenshot of the Apertium-tolk application