PRINCIPLE project

Velkomin(n) á heimasíðu
PRINCIPLE-verkefnisins

PRINCIPLE (Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering) er samvinnuverkefni fimm aðila sem er ætlað að safna málföngum og þróa máltækni fyrir írsku, norsku, króatísku og íslensku:

Meðlimir í hópi: Dyflinnarháskóli (Dublin City University) sem einnig er samræmingaraðili verkefnisins, Háskóli Íslands, Hugvísinda- og félagsfræðideild háskólans í Zagreb (Sveučilišta u Zagrebu), Landsbókasafn Noregs (Nasjonalbiblioteket), Iconic Translation Machines Ltd.

PRINCIPLE er tveggja ára verkefni fjármagnað af Sjóði fyrir samtengda Evrópu (Connecting Europe Facility, CEF)  (Aðgerð 2018-EU-IA-0050, styrktarsamningur nr. INEA/CEF/ICT/A2018/1761837) þar sem aðalmarkmiðið er að greina, safna og vinna úr hágæða málföngum (e. Language Resources) fyrir fjögur evrópsk tungumál þar sem slík tilföng skortir: 

  • króatísku
  • íslensku
  • írsku
  • norsku (bókmál og nýnorsku)

Vinna við verkefnið hófst í september árið 2019 og lýkur í ágúst árið 2021.  

PRINCIPLE mun útbúa hágæða málföng og nota sviðsbundin vélþýðingarkerfi (CEF eTranslation engines) til að bæta gæði þýðinga í grunnvirkjum fyrir stafræna þjónustu (DSI) með áherslu á rafrænt réttarkerfi og rafræn innkaup.

Eftirfarandi ferli verður notað til að greina málföng af miklum gæðum:  

  • Margar innlendar stofnanir og hagsmunaaðilar í Króatíu, Írlandi, Noregi og á Íslandi hafa samþykkt að láta PRINCIPLE-verkefninu málföng í té og gegna hlutverki snemmbúins notanda (e. early adopters)
  • Iconic Translation Machines þróar þýðingarvélar sem notast við tauganet með það að markmiði að ganga úr skugga um gæði málfanganna sem lögð voru til verkefnisins.  Snemmbúnir notendur fá aðgang að þýðingarvélum á meðan á verkefninu stendur til að meta gæði úttaksins í alvöru notandaumhverfi og koma með ábendingar.

Í kjölfarið verða málföngin gerð aðgengileg rafrænum þýðingavélum Sjóðs fyrir samtengda Evrópu (CEF eTranslation engines) um gáttina ELRC-SHARE

PRINCIPLE-verkefnið útskýrt

  1. Málföngum er safnað hjá eigendum gagna og snemmbúnum notendum í löndunum fjórum (á sviði rafræns réttarkerfis og rafrænna innkaupa)
  2. Vélþýðingarkerfi eru búin til úr málföngunum og þau metin til að tryggja að úttakið sé af miklum gæðum
  3. Snemmbúnir notendur fá endurgjaldslausan aðgang að þýðingarvélunum á meðan á verkefninu stendur
  4. Snemmbúnir notendur nota vélþýðingarkerfin og koma með ábendingar
  5. Á grundvelli úttaks frá þýðingarvél og endurgjafar frá snemmbúnum notendum má bera kennsl á þau málföng sem eru af miklum gæðum 
  6. Til að betrumbæta sjálfvirka eTranslation-þýðingarkerfið er samhliða textaheildum af miklum gæðum hlaðið upp í ELRC-SHARE-gáttina.

Eftirfarandi eru helstu viðfangsefni PRINCIPLE sem verður náð í áföngum á meðan á verkefninu stendur. 

  • Viðfangsefni 1: Verkefni komið í framkvæmd
  • Viðfangsefni 2: Greining á notkunardæmum og kröfum sem gerðar eru til gagna og undirbúnings þeirra
  • Viðfangsefni 3: Þróun, mat og innleiðing vélþýðingarkerfa
  • Viðfangsefni 4: Greining, söfnun og sameining málfanga
  • Viðfangsefni 5: Hagnýting og sjálfbærni
  • Viðfangsefni 6: Upplýsingamiðlun 

Q1 og Q2 eru fyrstu áfangar framkvæmdaráætlunarinnar þar sem megináherslan er á að skilgreina notkunardæmi, kröfur til gagna og undirbúnings þeirra eftir fundi með snemmbúnum notendum. Að loknum fyrsta áfanga verður haldið áfram að mynda samband við eigendur gagna til að vekja áhuga og auka skilning þeirra á verkefninu og benda þeim í því skyni á upplifun snemmbúinna notenda.

Tengt Efni

Tengt efni: 

Gagnlegir tenglar:

Atburðir

Dagsetningar málstofa:

Bíður staðfestingar á tímabilinu Q1/Q2 2021 

Hvenær PRINCIPLE tók/mun taka þátt í ráðstefnum:

PRINCIPLE var kynnt á veggspjaldasýningu 17. vélþýðingarráðstefnunnar sem haldin var í Dublin City University á Írlandi dagana 19. til 23. ágúst árið 2019 og birtist þessi grein í ráðstefnuritinu: www.aclweb.org/anthology/W19-6718.pdf 

Fjallað verður um PRINCIPLE-verkefnið á EAMT 2020-ráðstefnunni í nóvember árið 2020. Tveggja blaðsíðna grein sem ber nafnið „Progress of the PRINCIPLE Project: Promoting MT for Croatian, Icelandic, Irish and Norwegian“ birtist í ráðstefnuriti EAMT 2020-ráðstefnunnar og er aðgengileg hér (greinin er á bls. 465-466): https://eamt2020.inesc-id.pt/proceedings-eamt2020.pdf 

Tengiliðir

Dublin City University (Írland) – Andy Way, samræmingarstjóri verkefnis, andy.way@adaptcentre.ie

Iconic Translation Machines Ltd. (Írland) – Dana Davis Sheridan, dana@iconictranslation.com

Hugvísinda- og félagsfræðideild háskólans í Zagreb (Sveučilišta u Zagrebu) – Petra Bago, samræming gagnasöfnunar, pbago@ffzg.hr

Háskóli Íslands – Gauti Kristmannsson, gautikri@hi.is 

Landsbókasafn Noregs (Nasjonalbiblioteket) – Jon Arild Olsen, jon.olsen@nb.no