UiT Norges arktiske universitets samiske språkteknologiutviklere har laget en lulesamisk talesynthesizer med tre syntetiske stemmer. Bak prosjektet står Divvun, en enhet ved UiT Norges arktiske universitet som jobber med å utvikle og videreutvikle samisk språkteknologi og praktiske verktøy.
– Jeg har jobbet med og studert samisk i mange år nå. Det føles meningsfylt å ikke bare forske for vår egen del, men også å skape et verktøy som kommer det samiske samfunnet til gode, sier Inga Lill Sigga Mikkelsen, ingeniør ved Divvun.
Talesyntese er en funksjon som leser opp tekst på din digitale enhet. Den gjør tekst om til tale og kalles derfor også ofte tekst-til-tale. Ved hjelp av talesyntese kan du nå lytte til det som står skrevet på nord- og lulesamisk. Dette er et viktig hjelpemiddel for personer med lese- og skrivevansker eller synsproblemer.
Inga Lill Sigga Mikkelsen snakker selv lulesamisk hjemme med barna sine, og hun forteller at det lulesamiske skriftspråket har en kort historie
– Lulesamisk som undervisningsspråk er bare 40 år gammelt, og jeg var en av de første som gikk på skole på lulesamisk. Faren min har alltid snakket det hjemme, men kan verken lese eller skrive.
Det er problematisk å telle antallet lulesamisktalende, som anslås til mellom 800 og 3000, avhengig av definisjon.
Har overlevd fornorskningen
Vi har allerede begynt å kommunisere verbalt med maskinene som omgir oss, og nå som datamaskiner kan snakke samisk, er de samiske språkene for alvor på vei inn i taleteknologiens tidsalder.
– Hjemme snakker jeg allerede med Siri på iPhone, en Sonos-høyttaler og i bilen, på norsk og engelsk. Det er litt skummelt med tanke på at de samiske språkene må brukes for at de skal bli hørt i fremtiden, men så får disse dingsene meg til å snakke andre språk i mitt eget hjem. Derfor er en lulesamisk talesyntese et stort skritt i riktig retning og en utvikling som gir meg håp for fremtiden, fortsetter hun.
Selv snakker hun lulesamisk.
Tre syntetiske lulesamiske stemmer
Sander Andersen, Sigmund Johnsen og Britt Inger Sikku har bidratt til prosjektet ved å låne ut stemmene sine til den lulesamiske talesyntesen. I talesyntesen kan du velge hvilken kunstig stemme du vil høre, så når datamaskinen nå kan snakke lulesamisk, vil den høres ut som en av disse tre.
– Sander, Sigmund og Britt Inger har alle gjort et viktig arbeid for det lulesamiske språket, og nå vil stemmene deres følge oss inn i fremtiden, og dermed også bli hørt og brukt av nye generasjoner av lulesamisktalende, sier Mikkelsen.
Ny versjon av nordsamisk talesyntese
Den første nordsamiske talesyntesen ble publisert i 2015 i et samarbeid mellom Divvun og Acapela. Nå har den blitt forbedret med en ny versjon. Den nye versjonen har bedre lydkvalitet og uttale, og den er mer behagelig å lytte til.
Nyttig i språkopplæring
Stemmeteknologi er et viktig satsingsområde for Divvun, og i løpet av høsten vil Divvun også lansere en sørsamisk stemme. Divvun jobber også med talegjenkjenning, det vil si at datamaskinen skriver det du sier, for både nord-, lule- og sørsamisk. Katri Hiovain-Asikainen har jobbet med utviklingen av det taleteknologiske verktøyet. Den nye talesyntesen er i sin helhet utviklet med åpen kildekode, og ny kode er utviklet og eies av Divvun-gruppen og UiT.
Divvuns overordnede oppgaver er å utvikle og vedlikeholde lignende språkteknologiske verktøy for de samiske språksamfunnene, inkludert stavekontroller, grammatikkontroller, tastaturer, ordbøker og andre digitale og nettbaserte verktøy.
De aller fleste Divvun-verktøyene er gjort fritt tilgjengelige som åpen kildekode. Divvun er finansiert av Kommunal- og regionaldepartementet (KDD).Divvuns språkteknologiske verktøyet finner du her.
Bærekraftsmålene på samisk finner du her.
Samene er en nasjonal minoritet i Norge, Sverige og Finland. Samiske varieteter har status som minoritetsspråk i Sverige og i deler av Finland og Norge.
Det internasjonale tiåret for verdens urfolksspråk varer fra 2022 til 2032. Av verdens totale befolkning regnes 6 % som urfolk, men antallet språk som snakkes av urfolk, er betydelig. Det anslås at av de rundt 6 700 språkene som snakkes i verden, er mer enn 4 000 urfolksspråk. Det internasjonale tiåret for verdens urfolksspråk har som mål å beskytte urfolks rettigheter til å bevare, revitalisere og fremme språkene sine, og samtidig integrere det språklige mangfoldet.