Synnerjysk og wæstjysk og alle andre dialekter i Danmark skal gemmes

Vi er ikke så mange i verden, der taler dansk. Til gengæld er der rigtigt mange måder at tale dansk på. Derfor skal de alle sammen registreres og gemmes. Det kan i yderste konsekvens redde liv.

Vi er længe forbi det punkt, hvor maskiner kan forstå tale og tale selv, som computeren Hal i filmen 'Rumrejse år 2001' fra 1968, der nærmest er teknologisk stenalder.

Computerprogrammer kan omsætte tekst til tale og omvendt. Og så er vi kun lige i gang med at forstå, hvad kunstig intelligens kan bruges til. Men der er et problem.

- Langt de fleste af de stemmer, der er på nettet, er mandestemmer, og de fleste af dem er yngre, fortæller direktør for Alexandra Instituttet, Niels Husted Kjær.

Det har Alexandra Instituttet fået i opdrag af Digitaliseringsministeriet at gøre noget ved.

Niels Husted Kjær, direktør for Alexandra Instituttet.
Niels Husted Kjær, direktør for Alexandra Instituttet.
Foto: Alexandra Instituttet

Det er dyrt at producere "stemme-data", men kunstig intelligens skal bruge data for at blive brugbar, og derfor er vi i udgangspunktet væsentligt ringere stillet i Danmark end i lande, vi ellers sammenligner os med, fordi vi ikke er så mange.

Alexandra Instituttet er en privat, non-profit virksomhed, der har som mål at rulle de nyeste it-løsninger ud i Danmark.

Derfor har instituttet i samarbejde med en række partnere fået 14 millioner kroner af Innovationsfonden til at registrere danske stemmer, unge og gamle, bornholmere og sønderjyder, mænd og kvinder, ja, også danskere med udenlandske rødder skal give deres stemme.

- Målet er at gøre det lettere for både virksomheder og det offentlige at videreudvikle eksisterende løsninger og at udbrede brugen af taleteknologier til nye områder og brancher, hvor den ikke bruges i dag, fortæller Alexandra Instituttet.

Projektet med det blomstrede navn, Coral, skal løbe i to år og tale med mere end 2.000 danskere.

- Der er ingen virksomheder, der har råd til at lave sådan en database alene, fortæller direktør Niels Husted Kjær.

De tilsammen 1500 timers tale bliver tilgængelige for alle, så computerprogrammerne kan forstå alle dialekter og alle accenter. Stemmeafgivelsen er startet i Nordjylland i dag, mandag, og fortsætter landet rundt.

For at være med skal man underskrive en erklæring om, at ens stemme må bruges på nettet. Og det er ikke kun oplæsning.

- Vi taler alle sammen lidt anderledes, når vi taler med nogen, der taler samme dialekt, som vi selv gør. Derfor skal alle deltagerne tale med en med samme dialekt. 

Derudover skal de læse en tekst op, og så skal de tale med støj i baggrunden.

Tekst bliver læst op i lydstudiet.
Tekst bliver læst op i lydstudiet.
Foto: Alexandra Instituttet

- Vi taler også anderledes, når vi står på gaden, og der er trafikstøj. Derfor får deltagerne høretelefoner på og skal så tale, fortæller direktøren for Alexandra Instituttet.

- Jeg har altid været overbevist om, at dialekter har stor kulturel værdi for danskerne. Men dette projekt åbner helt nye perspektiver for værdien af vores regionale dialekter. Det vil være til gavn for den enkelte borger, som får en bedre oplevelse, men også for samfundet generelt, siger digitaliseringsminister, Marie Bjerre, V.

Hvad er Alexandra Instituttet?

De skriver selv:

Vi er sat i verden for at sikre at den nyeste it-forskning kommer helt ud i erhvervslivet og det offentlige og skaber værdi. Vores opgave er at hjælpe organisationer med avancerede, effektive, sikre og innovative it-løsninger.  

Som almennyttig virksomhed investerer vi hele vores overskud i ny forskning til gavn for samfundet. Det skaber spændende arbejdspladser og fremtidssikre digitale løsninger.  

Uanset hvad vi udvikler, skal teknologien, brugerne og økonomien spille sammen. Derfor spænder vores medarbejdere fra alle afskygninger af it-specialister til antropologer, designere og forretningsudviklere, der dagligt arbejder sammen.

Det betyder, at du får sat det rigtige team af specialister, der samarbejder fra dag ét. Og kan kalde flere til, hvis vi mangler dem. 

Vores specialister fordeler deres tid på forskningsprojekter, hvor de samarbejder med verdensklasse forskningsmiljøer og konsulentopgaver. Vi er derfor de første til at høre om de nyeste teknologier og bruger dagligt vores viden til at udvikle fremtidssikre, digitale teknologier og services og give vores kunder uvildig rådgivning.

Vi er et af Danmarks syv GTS-institutter (Godkendt Teknologisk Service-institut og er godkendt af Uddannelses- og Forskningsministeriet til at omsætte den nyeste viden til vækst og velfærd. Det gør vi bl.a. gennem forskning og formidling af ny viden og teknologi. Vi blev dannet i 1999 og er det eneste GTS-institut specialiseret i it og digitalisering.

De mange danske stemmer kan for eksempel gøre det lettere at gengive tale helt præcist, hvis en SOSU-assistent bruger et tale til tekst program til at registrere sin gøren og laden, om hun så er fra Bylderup Bov eller Bulgarien.

De danske stemmer kan endda redde liv. Der findes allerede programmer, der kan høre om en patient, der ringer til 112, er i fare for at få et hjerteanfald. Det kan blive mere præcist med et større bredde i stemmegrundlaget.

- For at vi kan få et virkeligt bredt udsnit af den danske befolkning, bliver alle registreret med alder, køn, beskæftigelse og oprindelse. Vi vil ikke forskelsbehandle nogen, siger direktør Niels Husted Kjær.

Man kan melde sig til her.