PRINCIPLE project

Velkommen til
PRINCIPLE-prosjektets
nettsted

PRINCIPLE står for Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering og drives av et konsortium med fem medlemmer:

Konsortium: Dublin City University (prosjektkoordinator), Universitetet på Island, Fakultetet for humaniora og samfunnsvitenskap ved Universitetet i Zagreb, Nasjonalbiblioteket, Iconic Translation Machines Ltd.

PRINCIPLE er et toårig prosjekt med midler fra EU-programmet Connecting Europe Facility (CEF) (Action 2018-EU-IA-0050, Grant Agreement No. INEA/CEF/ICT/A2018/1761837). Målet for prosjektet er å finne, samle inn og bearbeide språkressurser av høy kvalitet for fire underrepresenterte europeiske språk i EUs automatiske oversettelsestjeneste eTranslation:

 • Irsk
 • Islandsk
 • Kroatisk
 • Norsk (bokmål og nynorsk)

Prosjektet begynte i september 2019 og avsluttes i august 2021. 

PRINCIPLE vil produsere språkressurser av høy kvalitet for å styrke kvaliteten til EUs digitale tjenesteinfrastrukturer eJustice, og eProcurement ved hjelp av domenespesifikke oversettelsesmaskiner innenfor EUs eTranslation.

Språkressurser av høy kvalitet vil bli skaffet til veie gjennom følgende prosess:

 • Flere statlige og private virksomheter i Irland, Island, Kroatia og Norge har sagt seg villig til å bidra med språkressurser til PRINCIPLE-prosjektet.
 • Iconic Translation Machines vil bygge nevrale oversettelsesmaskiner basert på de innsamlede språkressursene for å teste kvaliteten.
 • Noen av bidragsyterne har sagt seg villig til å bruke de områdespesifikke oversettelsesmotorene i egen virksomhet i prosjektperioden og gi tilbakemeldinger om kvaliteten.
 • Språkressursene vil så bli gjort tilgjengelig for eTranslation i ELRC-SHARE portalen

PRINCIPLE-prosjektet i korte trekk

 1. Språkressurser blir samlet inn fra dataprodusenter i hvert de fire involverte landene (med fokus på relevans for eJustice og eProcurement).
 2. Oversettelsesmaskiner blir produsert på grunnlag av de innsamlete ressursene og evalueres for å sikre at resultatene er av høy kvalitet
 3. Bidragsytere får tilbud om å benytte oversettelsesmaskinene kostnadsfritt i løpet av prosjektperioden som «tidlige brukere».
 4. «Tidlige brukere» bruker oversettelsesmaskinene i egen virksomhet og gir tilbakemeldinger om kvaliteten.  
 5. Språkressurser av høy kvalitet blir identifisert på grunnlag av oversettelsesresultatene og tilbakemeldinger fra «tidlige brukere».
 6. Parallellspråkligere ressurser av høy kvalitet blir lastet opp i ELRC-SHARE-portalen for å styrke den automatiske oversettelsestjenesten eTranslation.

PRINCIPLE-prosjektet inneholder følgende nøkkelaktiviteter som vil bli utført i forskjellige faser av prosjektperioden:

 • Aktivitet 1: Prosjektoppstart
 • Aktivitet 2: Bruksmønsteranalyse, datakrav og databearbeiding
 • Aktivitet 3: Utvikling, evaluering og utplassering av maskinoversettelsessystemer
 • Aktivitet 4: Kartlegging, innsamling og bearbeiding av språkressurser
 • Aktivitet 5: Utnytting og bærekraft
 • Aktivitet 6: Formidling

Halvveis gjennom prosjektet er det samlet inn språkressurser fra flere dataprodusenter og tidlige brukere i fire land. Dataene er blitt analysert og tilpasset til utvikling av maskinoversettelsessystemer basert på avtalte bruksmønstre. Så langt har Iconic Translation Machines skapt skreddersydde maskinoversettelsessystemer for følgende tidligere brukere:

 • National University of Ireland Galway (Irland)
 • CIKLOPEA D.O.O. (Kroatia)
 • Utenriksdepartementet (Island)
 • Standard Norge
 • Utenriksdepartementet (Norge)

Disse systemene er nå i ferd med å bli evaluert. Nye tidligere brukere forventes å bli inkludert og forsynt med skreddersydde maskinoversettelsesløsninger i de neste månedene før prosjektet avsluttes i august 2021.

Arrangementer

Datoer for workshops:

Fastsettes senere i første og andre kvartal 2021  

Datoer for konferanser hvor PRINCIPLE var/vil være representert:

PRINCIPLE deltok med en poster på XVII Machine Translation Summit som ble arrangert av Dublin City University (Irland) 19.-23. august 2019 og denne artikkelen ble publisert i konferanserapporten: www.aclweb.org/anthology/W19-6718.pdf 

PRINCIPLE vil delta på EAMT 2020 i November 2020. En tosiders artikkel med tittelen «Progress of the PRINCIPLE Project: Promoting MT for Croatian, Icelandic, Irish and Norwegian” er publisert i rapporten fra EAMT konferansen 2020 og er tilgjengelig her (artikkelen står på s. 465-466):  https://eamt2020.inesc-id.pt/proceedings-eamt2020.pdf  

Kontakter

Dublin City University (Irland) – Andy Way, prosjektkoordinator, andy.way@adaptcentre.ie

Iconic Translation Machines Ltd. (Irland) – Dana Davis Sheridan, dana@iconictranslation.com

Fakultet for humaniora og samfunnsvitenskap, Universitetet i Zagreb (Kroatia) – Petra Bago, datainnsamlingskoordinator, pbago@ffzg.hr

Universitet på Island (Island) – Gauti Kristmannsson, gautikri@hi.is 

Nasjonalbiblioteket (Norge) – Jon Arild Olsen, jon.olsen@nb.no