IT

Denne forskeren kan jage vekk 9 av 10 troll på nettet

Nyutviklet metode med kunstig intelligens.

Hugo Hammer har forsket frem en metode som avdekker hat og trusler i nettkommentarer - med 90 prosent treffsikkerhet.
Hugo Hammer har forsket frem en metode som avdekker hat og trusler i nettkommentarer - med 90 prosent treffsikkerhet. Bilde: HIOA
13. okt. 2014 - 09:43

Hat og trusler på nettet kan bli merkbart redusert som følge av et forskningsprosjekt ved Høgskolen i Oslo og Akershus.

Forsker Hugo Hammer har utviklet en metode som oppdager ulovlige ytringer i kommentarfelt til artikler og postinger på nettet.

– Det finnes løsninger som i prinsippet gjør en slik jobb i dag, men de er ikke så presise som den metoden vi har utviklet, sier Hammer til Teknisk Ukeblad. Han er førsteamanuensis ved høyskolen.

10 prosent feilmargin

For eksempel er det automatiserte løsninger som overvåker kommentarfeltene i nettavisenes artikler.

Her genereres det rapporter ut fra stikkord i kommentarene, slik at upassende innhold kan slettes.

Mange av disse rapportene viser seg imidlertid å peke på kommentarer som det ikke er grunn til å fjerne.

– Forsøkene med den nye metoden har så langt hatt en feilmargin på 10 prosent, sier Hammer.

Innsikt: Begrepet kunstig intelligens oppstod i 1956. Hvor er vi nå?

Ulovlig

Bakgrunnen for arbeidet er at forskeren har registrert stadig mer hat og diskriminering på nettet.

Og han ser at det er lite eller ingen forskning på hvordan man kan bruke datateknologi for å oppdage netthets og sjikane i kommentarfeltene.

– Dette er et viktig arbeid blant annet fordi slike ytringer er ulovlige, både etter norsk og internasjonal lov, sier Hammer.

Han har undersøkt hvordan man kan bruke datamaskiner til automatisk å oppdage ulovlige ytringer, og spesielt trusler om vold eller sympati med voldsbruk.

Sjekket 25.000 setninger

Metoden var å lese gjennom 25.000 setninger i kommentarfeltene på Youtube.

Hammer identifiserte 1500 trusler om vold eller sympatier med vold.

Deretter matet han kommentarene inn i programvare for statistikk til å gjenkjenne setninger og ordbruk.

Typiske trekk som avslører voldstrusler er at de nesten alltid inneholder «jeg», «vi» eller et aggressivt ord som «drepe», «utrydde» eller for eksempel «balltre». Målet for trusselen er ofte inkludert, som «innvandrerne» eller «svina».

Les også: Derfor har Norge krevd brukerdata fra 68 Google-kontoer

Kunstig intelligens

– Kjernen i metoden ligger i å la datamaskinen lære å gjenkjenne setninger med disse egenskapene, forklarer Hammer.

Her er vi inne på såkalt kunstig intelligens, der programvaren blir bedre etter hvert som den blir brukt.

– La oss si at en frivillig organisasjon bruker et verktøy basert på min metode. Etter hvert som administrator korrigerer hva som er korrekt og feil treff på trusler og rasistiske kommentarer, vil løsningen stadig bli bedre og rapportere med færre feil, forklarer Hammer.

Kan hjelpe politiet

Feilene dreier seg om to forhold:

  • Verktøyet klassifiserer mange setninger som problematiske, men som viser seg å være harmløse.
  • Setninger klassifiseres som harmløse, men viser seg å ha et ulovlig innhold.

Metoden hans er ikke feilfri, men i materialet fra Youtube klassifiserte metoden slike feil i mindre enn én av ti tilfeller.

Målet har vært å utvikle en metode som kan bistå politi, frivillige organisasjoner, moderatorer og andre som har behov for å fjerne ulovligheter.

– Dermed kan de som daglig ser etter hatefull aktivitet på internett nøye seg med å fokusere på en langt mindre del av innholdet på internett, noe som vil gjøre deres hverdag mye lettere, sier forskeren.

Les også: Skyleverandør slakter egen bransje: – Kutt ut nettskyen

Bedre analyse

Arbeidet startet i fjor høst og ble presentert på etterretnings- og sikkerhetskonferansen JISIC i september.

Det er ikke et kommersielt verktøy han har laget.

– Nei, dette er forskning på en metode som andre kan benytte til å utvikle kommersielle løsninger, forklarer Hammer.

Han ønsker å ta forskningen ett skritt lenger, men foreløpig finnes det er ikke penger til det.

– Da vil det være snakk om å kunne brekke analysene ned på brukernavn, tema og utviklingen av diskusjoner over tid. På den måten kan metoden bli enda mer treffsikker, mener Hammer.

Og kombinert med en såkalt web crawler, kan det være mulig å utvikle metoden til løsninger som samler store mengder informasjon for å avdekke nye nettsteder med hatefulle ytringer som ellers ville være svært vanskelig å oppdage.

Les også:

Disse programmene hindrer deg i å kaste bort tid på nett

TUs lesere har talt: Dette er de mest irriterende programmene

– «Likes» spiller nesten ingen rolle lenger  

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.