PRINCIPLE project

Velkommen til
PRINCIPLE-prosjektets
nettsted

PRINCIPLE står for Providing Resources in Irish, Norwegian, Croatian and Icelandic for Purposes of Language Engineering og drives av et konsortium med fem medlemmer:

Konsortium: Dublin City University (prosjektkoordinator), Universitetet på Island, Fakultetet for humaniora og samfunnsvitenskap ved Universitetet i Zagreb, Nasjonalbiblioteket, Iconic Translation Machines Ltd.

PRINCIPLE er et toårig prosjekt med midler fra EU-programmet Connecting Europe Facility (CEF) (Action 2018-EU-IA-0050, Grant Agreement No. INEA/CEF/ICT/A2018/1761837). Målet for prosjektet er å finne, samle inn og bearbeide språkressurser av høy kvalitet for fire underrepresenterte europeiske språk i EUs automatiske oversettelsestjeneste eTranslation:

  • Irsk
  • Islandsk
  • Kroatisk
  • Norsk (bokmål og nynorsk)

Prosjektet begynte i september 2019 og avsluttes i august 2021. 

PRINCIPLE vil produsere språkressurser av høy kvalitet for å styrke kvaliteten til EUs digitale tjenesteinfrastrukturer eJustice, og eProcurement ved hjelp av domenespesifikke oversettelsesmaskiner innenfor EUs eTranslation.

Språkressurser av høy kvalitet vil bli skaffet til veie gjennom følgende prosess:

  • Flere statlige og private virksomheter i Irland, Island, Kroatia og Norge har sagt seg villig til å bidra med språkressurser til PRINCIPLE-prosjektet.
  • Iconic Translation Machines vil bygge nevrale oversettelsesmaskiner basert på de innsamlede språkressursene for å teste kvaliteten.
  • Noen av bidragsyterne har sagt seg villig til å bruke de områdespesifikke oversettelsesmotorene i egen virksomhet i prosjektperioden og gi tilbakemeldinger om kvaliteten.
  • Språkressursene vil så bli gjort tilgjengelig for eTranslation i ELRC-SHARE portalen

PRINCIPLE-prosjektet i korte trekk

  1. Språkressurser blir samlet inn fra dataprodusenter i hvert de fire involverte landene (med fokus på relevans for eJustice og eProcurement).
  2. Oversettelsesmaskiner blir produsert på grunnlag av de innsamlete ressursene og evalueres for å sikre at resultatene er av høy kvalitet
  3. Bidragsytere får tilbud om å benytte oversettelsesmaskinene kostnadsfritt i løpet av prosjektperioden som «tidlige brukere».
  4. «Tidlige brukere» bruker oversettelsesmaskinene i egen virksomhet og gir tilbakemeldinger om kvaliteten.  
  5. Språkressurser av høy kvalitet blir identifisert på grunnlag av oversettelsesresultatene og tilbakemeldinger fra «tidlige brukere».
  6. Parallellspråkligere ressurser av høy kvalitet blir lastet opp i ELRC-SHARE-portalen for å styrke den automatiske oversettelsestjenesten eTranslation.

PRINCIPLE-prosjektet inneholder følgende nøkkelaktiviteter som vil bli utført i forskjellige faser av prosjektperioden:

  • Aktivitet 1: Prosjektoppstart
  • Aktivitet 2: Bruksmønsteranalyse, datakrav og databearbeiding
  • Aktivitet 3: Utvikling, evaluering og utplassering av maskinoversettelsessystemer
  • Aktivitet 4: Kartlegging, innsamling og bearbeiding av språkressurser
  • Aktivitet 5: Utnytting og bærekraft
  • Aktivitet 6: Formidling

Første og andre kvartal 2020 utgjør den første fasen av prosjektplanen med fokus på bruksmønsteranalyse, datakrav og databearbeiding i etterkant av møter med «tidlige brukere». Etter denne innledningsfasen vil prosjektpartnerne i de deltakende landene bruke erfaringene til tidlige brukere for å skape interesse og bevissthet om prosjektet hos andre dataprodusenter.

Arrangementer

Datoer for workshops:

Fastsettes senere i første og andre kvartal 2021  

Datoer for konferanser hvor PRINCIPLE var/vil være representert:

PRINCIPLE deltok med en poster på XVII Machine Translation Summit som ble arrangert av Dublin City University (Irland) 19.-23. august 2019 og denne artikkelen ble publisert i konferanserapporten: www.aclweb.org/anthology/W19-6718.pdf

Kontakter

Dublin City University (Irland) – Andy Way, prosjektkoordinator, andy.way@adaptcentre.ie

Iconic Translation Machines Ltd. (Irland) – Dana Davis Sheridan, dana@iconictranslation.com

Fakultet for humaniora og samfunnsvitenskap, Universitetet i Zagreb (Kroatia) – Petra Bago, datainnsamlingskoordinator, pbago@ffzg.hr

Universitet på Island (Island) – Gauti Kristmannsson, gautikri@hi.is 

Nasjonalbiblioteket (Norge) – Jon Arild Olsen, jon.olsen@nb.no