Wake up. Open microsoft outlook. Create new email. Andreas. Press enter. Subject.
Mosken Bergh ligger i sengen og snakker til pc-en gjennom et headset med mikrofon. Med stemmen åpner hun nettleser, Microsoft outlook, forfatter en e-post og sender den til sønnen.
Flere ganger i døgnet er hun innom sitt eget nettforum for folk med kroniske smerter, som hun redigerer via talen, på engelsk.
Innsamlet materiale
Den sengeliggende, uføre juristen er en av fem superbrukere som i flere år har brukt det amerikanske talegjegjenkjenningsprogrammet Dragon naturally speaking (DNS).
Dataprogrammet lar henne kommunisere og leve et aktivt liv på internett. Eneste, men ikke ubetydelige hake, er at det sosiale livet må foregå på engelsk.
– Det er uforståelig. Jeg skjønner ikke hvordan regjeringen på den ene siden sier det er altfor mange uføre og at flere må ut i arbeid, og samtidig nekte å bidra til å etablere talegjenkjenning på norsk. Det henger ikke på greip.
Bergh sikter til at Nuance, et av verdens ledende selskap innen taleteknologi, som i dag tilbyr talegjenkjenning på åtte språk, har sagt seg villig til å utvikle en skandinavisk oversettelse ved hjelp av språkmateriale tidligere innsamlet i Norge.
Prisen er beregnet til 13 millioner norske kroner. En sum Arbeidsdepartementet ikke vil betale.
Les også: Snart kan du trene fra lenestolen
Satsingen havarerte
Året er 2003. Innbyggerne i Voss konstaterer at drømmen om hundrevis av it-arbeidsplasser i bygda er tapt.
Det var Norges største språkteknologisatsing noensinne. Etter flere runder med gjenopplivningsforsøk er konkursen til Nordisk språkteknologi (NST) et faktum.
På Voss skulle en storstilt satsing legge det teknologiske grunnlaget for utvikling av avansert nordisk taleteknologi. Endelig skulle svensker, dansker og nordmenn kunne legge seg på sengen, droppe tastaturet og snakke inn en e-post, akkurat som briter, amerikanere og tyskere hadde gjort i flere år. Uten altfor stor feilmargin.
Målgruppen var formidabel. Advokater, studenter, funksjonshemmede, eller folk som bare ville gjøre ting litt mer effektivt.
Konkursen til NST-medeier Lernout & Hauspie var starten på nedturen for NST. Det belgiske selskapet ble veltet overende etter kreativ regnskapsføring i beste Finance Credit-stil.
I løpet av om lag seks års drift, fra oppstart i 1997 til konkursen i 2003, hadde NST på Voss svidd av over 200 millioner kroner.
Les også: Åpner for å passe på demente med GPS
Språkarv
Tilbake lå enorme mengder innsamlet materiale om det nordiske språk: 6000 stemmeprøver fra over 3000 personer.
Stemmeopptak fordelt på 11 norske, ti svenske og åtte danske dialekter, tatt opp gjennom både mobiltelefon, telefon og mikrofon for å sikre hele spekteret fra god til dårlig kvalitet på talegjengivelsen.
Stemmeprøvene er splittet opp i sine minste bestanddeler, og sammen med registrering av alle mulige lydoverganger, er disse lagret i et enormt «fonembibliotek».
Etter konkursen ble den lingvistiske databasen etter hvert tatt over av et interimstyre, eiet av Universitetet i Oslo, Universitetet i Bergen, NTNU, Språkrådet og IBM. Senere ble eierskapet til språkmaterialet overdratt til Nasjonalbiblioteket for forvaltning og videreutvikling.
I praksis ligger nå den norske språkarven fra Nordisk språkteknologi fritt tilgjengelig på internett via Språkbanken. Til fri benyttelse for selskap som utvikler taleteknologi, forskere, språkvitere og offentlige virksomheter som utvikler elektroniske løsninger for offentlige tjenester.
Superbrukere testet
Nav Kompetansesenter for tilrettelegging og deltakelse har i årevis sett et stort behov for talegjenkjenningsteknologi til svært mange ulike grupper av uføre og sykmeldte, med alt fra alvorlige nevrologiske lidelser og dysleksi til såkalt musearm.
I 2011 bevilget Nav 200 000 kroner til et forprosjekt for å se om det var mulig heller å realisere talegjenkjenning på norsk gjennom eksisterende teknologi. En gruppe med fem superbrukere ble etablert.
– Tilbakemeldingen fra brukerne er svært positiv. Programvaren til Dragon naturally speaking er robust og tilrettelagt for målgruppen til å fungere effektivt i en arbeidssituasjon. Brukerne mener det ikke lenger står på teknologien, men språket, forteller ingeniør Daniel Scheidegger i Nav, som i en årrekke har jobbet med å finne teknologi som kan hjelpe funksjonshemmede å fungere i hverdagen.
Scheidegger kontaktet det norske selskapet Infoshare Solutions AS, som har agenturet for Nuance i Norge, og ba dem undersøke muligheten for å få Dragon naturally speaking på norsk.
Infoshare hadde allerede gjort undersøkelser, og mente det norske markedet kunne være like stort som det tyske. Infoshare ventet likevel at jobben ville bli krevende.
Les også: Snart kan du få sprøytestikk uten smerter
Norge – et nobody
– Isolert sett er Norge et «nobody» for Nuance, markedet er for lite. Vi var også usikre på om hvorvidt lydfilene og dokumentasjonen på filene fra tidlig 2000-tallet var av god nok kvalitet, forteller Bengt-Jarle Kjellså.
Infoshare hadde imidlertid nettopp formidlet salg av 4000 lisenser for pdf-konvertere til et stort industrikonsern i Norge, og hadde gjort inntrykk hos Nuance.
I tillegg kom Kjelså over en god nyhet: Nuance, som på midten av 2000-tallet kjøpte opp flere konkurrerende bedrifter, hadde også kjøpt Lernout & Hauspie, som i sin tid førte til konkursen på Voss.
– Det ga oss et håp om at datamaterialet var spilt inn på en måte som gjorde det enkelt for Lernout & Hauspie å benytte, og dermed også Nuance. Vi sendte over datamaterialet med kurer til USA. Noen måneder senere fikk vi svar: Materialet var ikke helt komplett, men de kunne bruke det, og enda bedre, de var interessert i å gjøre jobben, forteller Kjellså.
Egenandel
Amerikanerne setter imidlertid betingelser. Oversettelsen må være på norsk, dansk og svensk. En ren norsk utgave av «Dragon» vil ha et for lite marked.
Et annet krav er at en del av utviklingskostnadene, beregnet til 13 millioner norske kroner, må dekkes av det offentlige. Nuance har ikke opplyst hva deres egen andel er, men forventer å dekke inn noe av det gjennom framtidig salg.
– Det meste av jobben er gjort, men noen flere talekorpus må leses inn. Det viktigste er at de faktisk kan bruke det norske materialet, for det er langt dyrere å lage talemotoren fra bunnen av. Og når oversettelsen først er på plass, forplikter Nuance seg til å utvikle produktet videre og lansere nye, oppdaterte versjoner, sier Kjellså.
Les også: Slik vil ny teknologi forandre helsevesenet
«Ikke kommersiell aktør»
Der stopper imidlertid medgangen for Nav. De har ikke mandat til å bevilge de 13 millionene over eget budsjett.
Nav kan kort fortalt kjøpe, men ikke utvikle ny teknologi. Hos Arbeidsdepartementet og Innovasjon Norge er det heller ingen positive signaler.
– Arbeids- og velferdsetaten er ikke en kommersiell aktør eller utvikler av nye teknologiske eller tekniske løsninger som skal selges og kjøpes i et marked, men etaten er en potensiell kunde når produktet er utviklet, svarte arbeidsminister Anniken Huitfeldt 4. februar i år, på spørsmål fra stortingsrepresentant Sylvi Graham (H) om når talegjenkjenning kommer på norsk.
Huitfeldt avslutter med at det er uklart når en «eventuell norsk versjon» av et talegjenkjenningsprogram vil komme på markedet.
Kvalifiserer ikke for støtte
– Min påstand er at det vil være lettere å få 100 millioner kroner i støtte fra Innovasjon Norge til utvikling av ny, risikofylt norsk teknologi, enn 13 millioner kroner til å fullføre talegjenkjenning på norsk gjennom et amerikansk firma, sier Scheidegger.
Det frustrerer brukerne som har sett hva DNS-programvaren på engelsk kan tilføre tilværelsen.
– I sju år lå jeg på magen og arbeidet. Så sviktet nakken på grunn av belastningen, og jeg måtte ligge på ryggen med tastaturet på fanget. Etter en stund ble armene betent, og nå er jeg fullstendig avhengig av Dragen, som jeg kaller den, for å kommunisere elektronisk, forteller Mosken Bergh.
Les også: Sjekk fremtidens behandlinger på sykehuset
Må ligge
Felles for superbrukerne av DNS-programvaren, er at de på en eller annen måte ikke kan bruke vanlig tastatur.
Bergh har en kronisk inflammatorisk muskelsykdom som gjør det smertefullt å sitte oppreist. I tillegg gjør kroniske betennelser i armene det vanskelig å bevege fingrene over tastaturet.
Nav har gjennom forprosjektet identifisert grupper som kan være utestengt fra jobb, eller stå i fare for å falle utenfor arbeidslivet fordi de i perioder eller permanent ikke kan skrive på tastatur.
Beregningene er vanskelige fordi funksjonsproblemer ofte er sammensatt, og enkel teknologisk tilrettelegging ofte ikke er nok til å holde en funksjonshemmet i jobb. Økonomiske beregninger av sykefravær er heller ikke rett fram.
Likevel viser forsiktige, nøkterne anslag enormt potensial for samfunnsøkonomiske besparelser, dersom talegjenkjenningsteknologi blir etablert på norsk, ifølge rapporten.
To milliarder NAV-kroner
Snaut 50 000 personer var i 2009 uføretrygdede innen aktuelle diagnoser, som for eksempel sykdommer i øyet, muskel- og skjelettsystemet og nervesystemet.
Dersom bare 10 prosent av disse personene kunne brukt talegjenkjenning til å delta i arbeidslivet, kunne det betydd en besparelse på over 1,1 milliard i året.
I sykefraværsstatistikken for 2010 var det 13 927 tapte årsverk innenfor 11 identifiserte, aktuelle diagnoser. De aller fleste innenfor muskel- og skjelettgruppen. Totaltapet er beregnet til 9,4 milliarder kroner.
«Om talegjenkjenning på norsk kunne hindret bare 10 prosent av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner kroner», heter det i rapporten.
Slår man sammen potensialet innenfor uføretrygdede og sykemeldte, blir det over to milliarder kroner i sparte Nav-utbetalinger – hvert år.
50–60 personer
– Dette er så høye tall, at det kan være vanskelig å ta det inn over seg. Men la oss snu på det. En investering på 13 millioner kroner vil være tjent inn dersom bare 50-60 personer kan bruke talegjenkjenning i arbeidslivet i ett år, sier Scheidegger.
En av regjeringens fanesaker er et inkluderende arbeidsliv. Scheidegger mener talegjenkjenning på norsk er en av de viktigste brikkene i å få funksjonshemmede som ikke kan bruke tastatur og mus ut i arbeid.
– Dette er helt avgjørende i et samfunn som har gjort seg avhengig av datamaskinen både i yrkeslivet og den private arena, sier Scheidegger.
Teknisk Ukeblad har bedt om intervju med arbeidsminister Anniken Huitfeldt. Ifølge seniorrådgiver Jan Richard Kjelstrup i Arbeidsdepartementet har verken statsråden eller andre i politisk ledelse tid til å snakke om denne saken i dag. De vet heller ikke når de får tid til å kommentere den.
Les også: