Lærer å utnytte dine dataspor

ABB, Telenor, Nav og flere andre store private og offentlige virksomheter går sammen med vitenskapsfolk om å utnytte big data til å økt verdiskaping.

Norsk Regnesentral leder arbeidet i et nytt Senter for forskningsrettet innovasjon (SFI) med navnet «Big Insight – Statistics for the knowledge economy».

I et SFI samarbeider forskning, utdanning og arbeids- og næringsliv om å utvikle og teste metoder og verktøy.

Norges forskningsråd sørger for grunnbevilgningen til prosjektene, men i hovedsak er det et spleiselag. På det meste kan potten i Big Insight komme opp i 340 millioner kroner over åtte år.

Maskinlæring
Målet er å utvikle nye metoder innen statistikk og maskinlæring som håndterer store og komplekse datamengder.


Senior data scientist Kenth Engø-Monsen hos Telenor Research legger ikke skjul på flere utfordringer med utviklingen av nye big data-verktøy.

– Det samles inn enorme mengder data på mange områder. Senteret skal bidra til at disse dataene brukes til å gi dyp innsikt og bedre beslutninger, skriver Norsk Regnesentral på sitt nettsted.

I dag bygger beslutninger på gjennomsnittlig atferd, mens målet er mer individuelle løsninger på områder som medisinsk behandling, tjenester og markedsføring.

– Vi skal utvikle nye modeller for bedre å kunne predikere fenomener, forstå uforklarte mekanismer og sammenhenger, og avdekke skjulte mønstre, forklarer professor Arnoldo Frigessi, som leder Big Insight.

Hele verden
Ambisjonen er ikke snauere enn at Big Insight skal være et ledende internasjonalt senter i bruk av modellbasert statistikk for å finne nye innovative løsninger ved hjelp av komplekse, høydimensjonale data. Det siste betyr data der man har et stort antall målinger i et lite utvalg av observasjoner.

Telenor sitter på store mengder data som bedriften ønsker å utnytte i hovedsak på to måter:

  1. Kundedata til å skreddersy tjenester.
  2. Data fra drift og trafikk for å forutse problemer i nettet.

Den store datakilden i et telefonselskap er kundedata, også kjent som call detail record eller CDR, der du legger igjen spor hver gang du bruker telefonen: Hvilket nummer som benyttes, hvem du kommuniserer med, tidspunkt og sted m.m.

Fakta
Big Insight
Senter for forskningsbasert innovasjon, SFI-prosjekt for utvikling av big data-verktøy.
Prosjektperiode mellom fem og åtte år,

Deltakere:
Norsk Regnesentral, Universitetet i Oslo, Universitetet i Bergen.
ABB, DNB, DNV GL (Veritas), Gjensidige Forsikring, Norsk Hydro, Telenor.
NAV, Skatteetaten, Oslo universitets­sykehus.

Årlig finansiering:
Forskningsrådet 12 mnok
Partnere 7,5 mnok
Egeninnsats fra forskningspartnere 13 mnok
Egeninnsats fra brukerpartnere 10 mnok

Lojale kunder
– Dette er informasjon vi trenger for kunne levere tjenesten og sende faktura. Men vi ønsker også å bruke slike data til å skreddersy informasjon til kundene, for eksempel når de går inn i nettbutikken vår, forklarer Kenth Engø-Monsen.

Han er senior data scientist ved Telenor Research og deltar i Big Insight.

Et eksempel er å registrere mengden databruk hos en kunde og dermed tilby en bedre abonnementspakke. Kunden får en bedre avtale, og Telenor bygger lojalitet.

– Vi skal ikke underslå at vi driver business, sier Engø-Monsen til digi.no.

Sikrere nett
Målet er også å bruke analyser av data om driftsforhold og trafikk i nettet til å forutse og oppdage unormale hendelser.

Her er det større usikkerhet om utfallet.

– Vi beveger oss inn på et metodisk område som er ukjent for mange. Sett fra et algoritmisk ståsted er slik prediksjon vanskelig. Det krever mye data, og vi må ha data å trene disse algoritmene på. Likevel har vi ingen garanti for at modellene vil fungere når vi laster opp nye og ekte data, poengterer han.

For alle
Telenor skal ikke alene dra nytte av slike nye verktøy.

Såkalt personalisering av produkter og tjenester skal kunne benyttes i flere bransjer, som telekom, finans og medisin.

– Og deteksjon av unormale hendelser skal Veritas kunne benytte til å avdekke feil på skip i fart, forklarer Engø-Monsen.

– Hvor mangelfulle er verktøyene dere har i dag på disse områdene?

– Nå er vi på det vi kan kalle versjon 1.0, mens vi skal opp på 2.0 og 3.0.

Personvernet legger begrensingen på utnyttelsen av analyser av store datamengder.

– Det er et tema vi har som bakteppe i alt vi skal gjøre ved senteret, sier Engø-Monsen.

Leave a Reply

Your email address will not be published.