

Velkommen til
PRINCIPLE-prosjektets
nettsted
PRINCIPLE står for Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering og drives av et konsortium med fem medlemmer:
Konsortium: Dublin City University (prosjektkoordinator), Universitetet på Island, Fakultetet for humaniora og samfunnsvitenskap ved Universitetet i Zagreb, Nasjonalbiblioteket, Iconic Translation Machines Ltd.

PRINCIPLE er et toårig prosjekt med midler fra EU-programmet Connecting Europe Facility (CEF) (Action 2018-EU-IA-0050, Grant Agreement No. INEA/CEF/ICT/A2018/1761837). Målet for prosjektet er å finne, samle inn og bearbeide språkressurser av høy kvalitet for fire underrepresenterte europeiske språk i EUs automatiske oversettelsestjeneste eTranslation:
- Irsk
- Islandsk
- Kroatisk
- Norsk (bokmål og nynorsk)
Prosjektet begynte i september 2019 og avsluttes i august 2021.
PRINCIPLE vil produsere språkressurser av høy kvalitet for å styrke kvaliteten til EUs digitale tjenesteinfrastrukturer eJustice, og eProcurement ved hjelp av domenespesifikke oversettelsesmaskiner innenfor EUs eTranslation.
Språkressurser av høy kvalitet vil bli skaffet til veie gjennom følgende prosess:
- Flere statlige og private virksomheter i Irland, Island, Kroatia og Norge har sagt seg villig til å bidra med språkressurser til PRINCIPLE-prosjektet.
- Iconic Translation Machines vil bygge nevrale oversettelsesmaskiner basert på de innsamlede språkressursene for å teste kvaliteten.
- Noen av bidragsyterne har sagt seg villig til å bruke de områdespesifikke oversettelsesmotorene i egen virksomhet i prosjektperioden og gi tilbakemeldinger om kvaliteten.
- Språkressursene vil så bli gjort tilgjengelig for eTranslation i ELRC-SHARE portalen

PRINCIPLE-prosjektet i korte trekk
- Språkressurser blir samlet inn fra dataprodusenter i hvert de fire involverte landene (med fokus på relevans for eJustice og eProcurement).
- Oversettelsesmaskiner blir produsert på grunnlag av de innsamlete ressursene og evalueres for å sikre at resultatene er av høy kvalitet
- Bidragsytere får tilbud om å benytte oversettelsesmaskinene kostnadsfritt i løpet av prosjektperioden som «tidlige brukere».
- «Tidlige brukere» bruker oversettelsesmaskinene i egen virksomhet og gir tilbakemeldinger om kvaliteten.
- Språkressurser av høy kvalitet blir identifisert på grunnlag av oversettelsesresultatene og tilbakemeldinger fra «tidlige brukere».
- Parallellspråkligere ressurser av høy kvalitet blir lastet opp i ELRC-SHARE-portalen for å styrke den automatiske oversettelsestjenesten eTranslation.
PRINCIPLE-prosjektet inneholder følgende nøkkelaktiviteter som vil bli utført i forskjellige faser av prosjektperioden:
- Aktivitet 1: Prosjektoppstart
- Aktivitet 2: Bruksmønsteranalyse, datakrav og databearbeiding
- Aktivitet 3: Utvikling, evaluering og utplassering av maskinoversettelsessystemer
- Aktivitet 4: Kartlegging, innsamling og bearbeiding av språkressurser
- Aktivitet 5: Utnytting og bærekraft
- Aktivitet 6: Formidling

Halvveis gjennom prosjektet er det samlet inn språkressurser fra flere dataprodusenter og tidlige brukere i fire land. Dataene er blitt analysert og tilpasset til utvikling av maskinoversettelsessystemer basert på avtalte bruksmønstre. Så langt har Iconic Translation Machines skapt skreddersydde maskinoversettelsessystemer for følgende tidligere brukere:
- National University of Ireland Galway (Irland)
- CIKLOPEA D.O.O. (Kroatia)
- Utenriksdepartementet (Island)
- Standard Norge
- Utenriksdepartementet (Norge)
Disse systemene er nå i ferd med å bli evaluert. Nye tidligere brukere forventes å bli inkludert og forsynt med skreddersydde maskinoversettelsesløsninger i de neste månedene før prosjektet avsluttes i august 2021.

Ressurser
Ressurser:
Nyttige lenker:

Arrangementer
Datoer for workshops:
Fastsettes senere i første og andre kvartal 2021
Datoer for konferanser hvor PRINCIPLE var/vil være representert:
PRINCIPLE deltok med en poster på XVII Machine Translation Summit som ble arrangert av Dublin City University (Irland) 19.-23. august 2019 og denne artikkelen ble publisert i konferanserapporten: www.aclweb.org/anthology/W19-6718.pdf
PRINCIPLE vil delta på EAMT 2020 i November 2020. En tosiders artikkel med tittelen «Progress of the PRINCIPLE Project: Promoting MT for Croatian, Icelandic, Irish and Norwegian” er publisert i rapporten fra EAMT konferansen 2020 og er tilgjengelig her (artikkelen står på s. 465-466): https://eamt2020.inesc-id.pt/proceedings-eamt2020.pdf

Kontakter
Dublin City University (Irland) – Andy Way, prosjektkoordinator, andy.way@adaptcentre.ie
Iconic Translation Machines Ltd. (Irland) – Dana Davis Sheridan, dana@iconictranslation.com
Fakultet for humaniora og samfunnsvitenskap, Universitetet i Zagreb (Kroatia) – Petra Bago, datainnsamlingskoordinator, pbago@ffzg.hr
Universitet på Island (Island) – Gauti Kristmannsson, gautikri@hi.is
Nasjonalbiblioteket (Norge) – Jon Arild Olsen, jon.olsen@nb.no