PRINCIPLE project

Fáilte go dtí an suíomh
idirlín do thionscadal
PRINCIPLE

Tá i gceist le PRINCIPLE acmhainní a chur ar fáil sa Ghaeilge, san Ioruais, sa Chróitis agus san Íoslainnis ar mhaithe le hInnealtóireacht teanga (Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering). Cuibhreannas cúig bhall ar leith a chuireann an tionscadal i bhfeidhm: 

Ollscoil Chathair Bhaile Átha Cliath (Comhordaitheoir Tionscadail), Ollscoil na hÍoslainne, Dámh na nDaonnachtaí agus na nEolaíochtaí Sóisialta, Ollscoil Ságrab, Leabharlann Náisiúnta na hIorua, Iconic Translation Machines Ltd.

Tionscadal dhá bhliain atá in PRINCIPLE atá maoinithe faoin tSaoráid um Chónascadh na hEorpa (CEF) (Gníomh 2018-EU-IA-0050, Comhaontú Deontais INEA/CEF/ICT/A2018/1761837). An phríomhaidhm atá leis ná Acmhainní Teanga (AT) d’ardchaighdeán a aithint, a bhailiú agus a phróiseáil i gcás ceithre chinn de theangacha Eorpacha atá ar easpa acmhainní:

  •   An Chróitis
  •   An Íoslainnis
  •   An Ghaeilge
  •   An Ioruais (Bocmál agus an Nua-Ioruais)

Thosaigh an tionscadal i Meán Fómhair 2019 agus críochnóidh sé i mí Lúnasa 2021.

Cruthóidh PRINCIPLE na hAT saineagraithe ar ardchaigheán seo chun cur le caighdeán na n-aistriúchán sna Bonneagair Seirbhísí Digiteacha ag r-Cheartas agus r-Sholáthair trí chórais mheaisínaistriúcháin réimsedhírithe (innill eTranslation de chuid CEF).

Déanfar na hAT ar ardchaighdeán seo a aithint mar a leanas:

  •   Tá comhlachtaí náisiúnta agus páirtithe leasmhara áirithe sa Chróit, san Íoslainn, san Iorua agus in Éirinn tar éis toilliú AT a chur ar fáil do chuibhreannas PRINCIPLE mar ‘ghlacadóirí luatha’
  •   Forbróidh Iconic Translation Machines innill mheaisínaistriúchán néarach ó na hAT atá deonaithe chun caighdeán na n-acmhainní a dheimhniú. Cuirfear córais mheaisínaistriúcháin ar fáil do na ‘glacadóirí luatha’ fad a mhaireann an tionscadal chun caighdeáin a dheimhniú i gcásanna fíor-úsáide agus chun aiseolas a thiomsú.
  • Cuirfear AT ar fáil ansin d’innill eTranslation CEF tríd an tairseach ELRC-SHARE.

Achoimre ar an Tionscadal PRINCIPLE

  1. Bailítear Acmhainní Teanga (AT) ó shealbhóirí sonraí agus ó ‘ghlacadóirí luatha’ ó gach ceann den 4 thír atá páirteach (sna sainréimsí r-Cheartas agus r-Sholáthair)
  2. Cruthaítear córais mheaisínaistriúcháin ó na hAT seo agus déantar iad a mheas chun aschur ar ardchaigheán a chinntiú
  3. Cuirtear na córais mheaisínaistriúcháin ar fáil saor in aisce do ‘ghlacadóirí luatha’ fad a mhaireann an tionscadal
  4. Úsáideann na ‘glacadóirí luatha’ na córais mheaisínaistriúcháin agus tugann aiseolas
  5. Bunaithe ar an measúnú atá déanta ar aschur an mheaisínaistriúcháin agus ar an aiseolas atá faighte ó na glacadóirí luatha, déantar AT ar ardchaighdeán a aithint
  6. Déantar AT comhthreomhara ar ardchaighdeán a uaslódáil go dtí an tairseach ELRC-SHARE chun feabhas a chur leis an gcóras uathaistriúcháin r-Aistriúchán.

Beidh na príomhghníomhartha a leanas ar bun in PRINCIPLE agus iad ag teacht i bhfeidhm i gcéimeanna ar leith i rith an tionscadail.

  • Gníomh 1: Cur i bhFeidhm an Tionscadail
  • Gníomh 2: Anailís chásúsáide, Riachtanais Sonraí agus Réiteach Sonraí
  • Gníomh 3: Forbairt, measúnú agus imlonnú na gcóras meaisínaistriúcháin
  • Gníomh 4: Aithint, Bailiú agus Comhdhlúthú na nAcmhainní Teanga
  • Gníomh 5: Saothrú agus Inbhuanaitheacht
  • Gníomh 6: Forleathadhn

Bailíodh acmhainní teanga ó roinnt sealbhóirí sonraí agus glacadóirí luatha thar na ceithre tíortha. Rinneadh anailís ar na sonraí seo agus ullmhaíodh é d’fhorbairt meaisínaistriúcháin bunaithe ar chásúsáideanna socruithe. Chruthaigh Iconic Translation Machines córais mheaisínaistriúcháin néarach saincheaptha do dheich glacadóirí luatha. 

  • Ollscoil na hÉireann, Gaillimh (Éire)
  • CIKLOPEA D.O.O. (Croatia) 
  • Ministry of Foreign Affairs (Iceland)
  • Standards Norway 
  • Ministry of Foreign Affairs (Norway)
  • Rannóg an Aistriúcháin (the Translation Section of the Houses of the Oireachtas)
  • Foras na Gaeilge
  • Ministry of Foreign and European Affairs (Croatia)
  • Icelandic Standards
  • Icelandic Meteorology Office

 Má aithnítear sonraí mar ‘ardchaighdeáin’ le linn forbairt na n-inneall seo, beidh siad uaslódáilte chuig stór ELRC-SHARE i mí Mheithimh 2021.

Acmhainní

Acmhainní:

· Bileog/físghrafaic PRINCIPLE

Naisc Úsáideacha:

Imeachtaí

Dátaí le haghaidh ceardlanna:

Bhí seoladh tionscadail thar ceithre thír i 2021:

🇭🇷  An Chróit: Bhí an seoladh tionscadail PRINCIPLE don Chróit ar 1ú Iúil, 2021. Bhí an seoladh mar chuid den dara seisiún an chéid lae ‘Tionscadal agus Cur i láthair leabhair’ ag Professional and Scientific Symposium for Lectors of Croatian as a Second and Foreign Language (SIH). Tá an clár le fáil anseo.

Tá i gceist le PRINCIPLE acmhainní a chur ar fáil sa Ghaeilge, san Ioruais, sa Chróitis agus san Íoslainnis ar mhaithe le hInnealtóireacht teanga (Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering) – Thug Filip Klubičkaachoimre ar an tionscadal PRINCIPLE le béim ar acmhainní teanga Cróitise. Míníodh próiseas acmhainní teanga a aithint san earnáil phoiblí agus eacnamaíochta. Cuireadh glacadóirí luatha agus rannpháirtithe sonraí i láthair chomh maith le heolas ar conas a bhronnadh na hacmhainní teanga (mar shampla méid, réimse srl.) Cuireadh na príomhfhadhbanna i láthair agus rinneadh cur síos orthu, ó rannpháirtithe sonraí a aithint san earnáil phoiblí agus eacnamaíochta sa Chróit go próiseáil acmhainní teanga.

🇮🇸  An Íoslainn: Bhí an seoladh tionscadail PRINCIPLE don Íoslainn ar 18ú Bealtaine, 2021. Bhí an seoladh mar chuid den chlár comhdháil ar líne a chraoladh ar Ruv.is, suíomh greásáin na teilifíse náisiúnta. Eagraíodh an comhdháil le SÍM (cuibhreannas do theicneolaíocht teanga na hÍoslainne) agus Almannarómur (Ionad do theicneolaíocht teanga). Cludaíodh topaicí ar nós teicneolaíocht teanga, intleacht shaorga agus saothrú taighde na hollscoile sa saol laethúil. 

Thug Gauti Kristmannsson ó UoI achoimre ar an tionscadal PRINCIPLE le béim faoi leith ar próiseas a úsáideadh chun acmhainní teanga ardcaighdeán a aithint agus na glacadóirí luatha ag glacadh páirte sa tionscadal. Chuir Níels Rúnar Gíslason ó UoI scóir ó mheasúnú uathoibríoch agus daonna i láthair. Mhínigh sé a mbrí chomh maith leis an tábhacht a bhaineann le sain-sonraí ó chomhlachtaí agus comhlachtaí poiblí a roinnt. Tá an clár don chomhdháil le fáil anseo. Bhí an seoladh tionscadail réamhthaifeadta agus curtha in eagar don fhíschomhdháil agus le fáil anseo. Tá na sleamhnáin ón gcur i láthair a úsáideadh le linn an taifeadta anseo

Ar an lá céanna a chraoladh, thug Gauti Kristmannsson agus Níels Rúnar Gíslason cainteanna do na daoine gairmiúla sa tionscal ag an gCumann Chúirte ateangairí agus aistritheoirí cruinniú bliantiúil (trí theileachomhdháil). Ghlac siad páirt sa Cheist agus Freagra breise. Tá taifeadadh an chruinniú le fáil anseo.

🇮🇪  Éire: Bhí an seoladh tionscadail PRINCIPLE ar 24ú Meitheamh, 2021. Bhí an seoladh mar chuid den cheardlann ELRC d’Éire agus bhí sé mar chuid den tríú sheisiún – Teicneolaíocht teanga in Éirinn: cásanna fíor-úsáide an tionscadail PRINCIPLE. Tá an clár don cheardlann ELRC le fáil anseo. Bhí trí chur i láthair ar an tionscadal PRINCIPLE le linn séisiúin 3.

  1. Achoimre tionscadail PRINCIPLE – Thug Jane Dunne ó Ollscoil Chathair Bhaile Átha Cliath achoimre ar an tionscadal PRINCIPLE mar shampla  den bhealach is féidir teicneolaíocht teanga a úsáid san earnáil phoiblí in Éirinn. Míníodh bailiú agus réamhphróiseáil sonraí, chomh maith le measúnú uathoibríoch agus daonna ar na córais meaisínaistriúcháin éagsúla a tógadh do na deich glacadóirí luatha thar na ceithre thír. 
  2. Fíor cás úsáide san earnáil phoiblí – Chuir Mícheál Ó Maolruanaigh ó Foras na Gaeilge taithí na heagraíochta mar ghlacadóirí luatha i láthair trí Ghaeilge. Pléadh riachtanais aistriúcháin (mar shampla foirmeacha iarratais, tuarascáil bliantiúil, polasaithe, meáin shóisialta srl.) agus bhí míniú ar na huirlisí cuimhne aistriúcháin atá in úsáid ag a n-aistritheoir tí (MemoQ agus SDLTrados). Bhí an t-aiseolas maidir leis a dtaithí ó bheith mar chuid den tionscadal dearfach agus mhínigh Mícheál gur fhoghlaim siad go leor maidir le teicneolaíocht aistriúcháin agus measúnú daonna ar aschur córas aistriúcháin.
  3. Teicneolaíocht teanga don Ghaeilge: Fiontair Bheaga agus Mheánmhéide agus an earnáil phoiblí – Phléigh Róisín Moran ó RWS Language Weaver (ar a dtugtaí Iconic Translation Machines tráth) ról an chomhlachta sa tionscadal, rinne sí cur síos ar an gcaoi a rinneadh traenáil ar na córais measínaistriúchán agus iad a mheas agus conas a d’éirigh leo nuair a chuireadh i gcomparáid iad le córas measínaistriúchán ginearálta ar líne, agus ar an iomlán, bhí siad i bhfad níos fearr.
🇳🇴  An Iorua: Bhí an seoladh tionscadail PRINCIPLE don Iorua ar 3ú Márta 2021. Bhí an seoladh ar siúl leis an gceardlann ELRC don Iorua agus tá an clár le fáil anseo. Bhí dhá chur i láthair ag baint leis an tionscadal PRINCIPLE. 
  1. Ag úsáid measínaistriúcháin sa Roinn Gnóthaí Eachtracha – Chuir Stein Gabrielsen ón Roinn Gnóthaí Eachtracha i láthair taithí na heagraíochta mar ghlacadóirí luatha sa tionscadal PRINCIPLE. Rinne Stein cur síos ar tascanna aistriúcháin na Roinne don Limistéar Eorpach Eacnamaíoch (aistriúchán ar Dlí na hEorpa go príomha), úsáid uirlisí CAT roimhe seo (SDL Trados) agus taithí gairid le measínaistriúchán agus a taithí reatha ag úsáid innil measínaistriúchán, forbartha ag Iconic mar chuid den tionscadal PRINCIPLE. Mhínigh Stein go raibh a dtaithí go dtí seo an-dearfach ar fad. Tá torthaí maithe ag baint leis an inneal a mhéadaíonn táirgiúlacht an chomhlachta, agus bhí an plé le Iconic maidir le hinneal a fhorbairt agus a chur chun cinn an-mhaith agus fiúntach.
  2. Cad atá i gceist le sonraí teanga agus conas a bhailímid iad? – Chuir Magnus Breder Birkenes ón Banc Teanga Ioruaise ag an Leabharlann Náisiúnta Ioruaise dhá shampla den bhailiúchán sonraí a chuireann leis an tionscadal PRINCIPLE i láthair. An chéad sampla ná bailiúchán tairscintí Ioruaise atá foilsithe ar DOFFIN (An bunachar fógra Ioruaise do tógáil i seilbh phoiblí) agus a n-aistriúchán go Béarla atá foilsithe ar TED (An iris Eorpach do tógáil i seilbh phoiblí). Fuarthas na sonraí i bhformáid XML le haitheantóirí doiciméid. Rinne Magnus cur síos ar conas atá na sonraí próiseáilte le téacschomharthú abairte, ailíniú agus a athrú go formáid TMX. An dara sampla ná ransú suíomh greásáin eagraíocht phoiblí Ioruaise. Is é príomhaidhm an tionscadail ná measúnú a dhéanamh ar an méid eolais atá ar fáil i Nua-Ioruais agus Bocmál – an dá theanga scríofa oifigiúil chun a bheith cinnte go leanann na heagraíochta stáit acht teanga don Ioruais. Tá sonraí comhthreomhar in Ioruais agus i mBéarla áfach a bhainfidh siad amach agus curtha ar fáil mar chuid den tionscadal PRINCIPLE.
 
Dátaí le haghaidh comhdhálacha ina raibh ionadaíocht ag PRINCIPLE:

Rinneadh ionadaíocht ar PRINCIPLE ag seisiún an phóstaeir den XVII Cruinniú Mullaigh ar an Meaisínaistriúchán a reáctáladh in Ollscoil Chathair Bhaile Átha Cliath (Éire) ar an 19-23 Lúnasa 2019. Rinneadh an páipéar a leanas a fhoilsiú in imeachtaí na comhdhála: www.aclweb.org/anthology/W19-6718.pdf

Cuireadh PRINCIPLE i láthair ag an gcomhdháil EAMT 2020 i mí na Samhna 2020. Foilsíodh páipéar dhá leathanach dar teideal “Promoting MT for Croatian, Icelandic, Irish and Norwegian” in imeachtaí na comhdhála EAMT, atá ar fáil anseo (lch. 465-6).

Cuireadh PRINCIPLE i láthair ag seisiún an phóstaeir fíorúil den META-FORUM 2020 ar an 3ú Nollaig, 2020. 

Fuair PRINCIPLE cuireadh chun cur i láthair a dhéanamh ag an 5ú comhdháil ELRC ar an 10 Márta, 2021. Tá an cur i láthair le fáil anseo

Cuireadh PRINCIPLE i láthair ag an gcomhdháil ELRC san Ioruaidh ar 3 Márta, 2021. Chuir Stein Gabrielsen ón Aireacht Gnóthaí Eachtracha na hIorua taithí an ghlacadóra luatha mar chuid den tionscadal PRINCIPLE i láthair. Chuir Magnus Breder Birkenes ó Bhanc Teanga na hIorua bailiúchán agus baint sonraí teanga dátheangacha a chuireadh ar fáil don tionscadal i láthair. Tá an dhá chur i láthair le fáil (san Ioruais) ar Youtube.

Cuireadh obair tionscadal PRINCIPLE i láthair ag an MT Summit, Lúnasa, 2021. Rinne Páraic Sheridan (ó Iconic) cur i láthair dar teideal “Building MT systems in low resourced languages for Public Sector users in Croatia, Iceland, Ireland and Norway”. Chuir Páraic na samhlacha measínaistriúcháin ar fad, a tógadh le linn an tionscadail PRINCIPLE, chomh maith leis na glacadóirí luatha do gach teanga, os comhair an phobail. Tá an cur i láthair le fáil anseo. 

Teagmhálacha

Ollscoil Chathair Bhaile Átha Cliath (Éire) – Andy Way, Comhordaitheoir Tionscadail, andy.way@adaptcentre.ie

Iconic Translation Machines (Éire) – Dana Davis Sheridan, dana@iconictranslation.com

Dámh na nDaonnachtaí agus na nEolaíochtaí Sóisialta, Ollscoil Ságrab (An Chróit) – Petra Bago, Comhordaitheoir Bailiúchán Sonraí, pbago@ffzg.hr

Ollscoil na hÍoslainne (An Íoslainn) – Gauti Kristmannsson, gautikri@hi.is 

Leabharlann Náisiúnta na hIorua (An Iorua) – Jon Arild Olsen, jon.olsen@nb.no