HPs havn for «big data»


I juni i fjor kunngjorde HP en ny plattform for å analysere «big data», døpt HAVEn.

Det engelske ordet «haven» viser til et område der man søker trygghet og ro, eller som framstår som et avgrenset paradis.

For HP er det en sammensetning: H står for «Hadoop», A for Autonomy, V for Vertica, E for «enterprise security» og «n» for det mangfold av applikasjoner HP forestiller seg vil bli bygget på plattformen. I det følgende vil det konsekvent skrives Haven for å betegne denne plattformen.

Hadoop er, som kjent, et rammeverk i åpen kildekode for å lagre og prosessere store mengder data på klynger av x86-servere. Hadoop tilbyr blant annet et distribuert filsystem (HDFS), verktøy for å forvalte maskinressurser (YARN) og en programmeringsmodell for dataprosessering i stor skala (MapReduce).

I webinaret Big Data in Action beskriver Dan Wood, HPs markedssjef for Big Data i Europa, Hadoop som et verktøy for å katalogisere store mengder data, i forkant av videre behandling med ekte analytiske verktøy.

HP har altså lagt Hadoop til grunn for sin big data-plattform.

Autonomy og Vertica er de viktigste oppkjøpene HP gjorde i 2011, det året tidligere SAP-sjef Leo Apotheker styrt HP og hadde som ambisjonen å gjøre verdens største maskinvareleverandør til en stormakt innen programvaren.

Autonomys rolle i Haven er å få fram betydningen av menneskeskapte data, første og fremst korte eller lange tekster fra dokumenter, blogger og ytringer i sosiale medier. Dan Wood sier at Autonomy gjør det mulig å fange opp følelser, sinnelag og stemninger. Programvaren kan også brukes til å analysere tale.

Vertica beskrives som et analytisk databaseverktøy, HPs motstykke til i-minne-løsninger som SAPs Hana og Oracle. Poenget er å tilby analyse av store mengder data i høy tempo, fra transaksjonssystemer, sensorer og andre kilder til strukturert informasjon.

– Haven krever ikke at du tar i bruk alle moduler, understreker Wood. – Du kan gjerne bygge løsninger på bare Vertica og Hadoop, eller bare Autonomy og Hadoop.

Wood mener Haven er tilpasset tre typer data som alle er av interesse for moderne bedrifter:

  • Tradisjonelle data, det vil si det som leveres av ERP-systemer, CRM-systemer, datavarehus og så videre
  • Maskindata, det vil si alt som genereres i eller av selve IT-systemet: loggfiler, data om oppdateringer av databaser og forespørsler overfor servere, klikkdata, sensorer og så videre
  • Menneskelige data, det vil si alt som legges ut av dokumenter og ytringer, ikke bare sosiale medier men på web generelt

Alt kan sies å bidra til konseptet big data.

Wood advarer at det er noe mer: mørk data, «dark data».

Han viser til en undersøkelse, The Digital Universe, publisert av IDC i desember 2012. Her ble det anslått at 23 prosent av all data kunne vært nyttig, dersom det det ble tagget og analyser. I praksis tilrettelegges – «tagges» – bare rundt en åttendedel av denne potensielt nyttige datamengden for mulig analyse. Og forholdet mellom det som faktisk nyttiggjøres gjennom analyse og det som kun tilrettelegges for analyse, er som én til seks.

En annen måte å si det på: 23 prosent av det «digitale universet» kan komme til nytte. I praksis er det kun 0,5 prosent som faktisk gjør det. «Mørk data» viser ikke til det unyttige, men til det potensielt nyttige som ikke utnyttes.

Erfaringene til HPs referansekunder for Haven tyder på at deres «mørke data» ikke bare var av den «menneskelige typen». De gikk også glipp av nyttig informasjon fra sine tradisjonelle bedriftssystemer og fra sin maskinvare.

I oktober 2012 publiserte Harvard Business Review hva bedrifter oppnår ved å skaffe seg en «360 graders oversikt» over sine kunder. En «360 graders oversikt» er når man i sanntid fanger opp både strukturerte data som klikkstrømmer, transaksjoner og loggfiler, og strukturerte data som samtaler, e-postmeldinger og ytringer i sosiale medier. Studiet konkluderte med at en 360 graders kundeoversikt øker produktiviteten med 5 prosent, og lønnsomheten med 6 prosent.

Oppgaven HP nå har, er altså å overbevise sine kunder om at Haven er et hensiktsmessig grunnlag for å bygge opp en 360 graders oversikt over alt som vedgår kunder og drift, og sørge for at all potensielt nyttig data bidrar til innsikt i sanntid om hvordan ting kan gjøres bedre.

En av de fremste referansekundene på HP Haven er motebutikkjeden Guess.

Her var problemet at Guess brukte nattlige batchkjøringer til å prosessere CRM- og ERP-data og greide ikke å styre butikkene i samme takt som moten. Løsningen var å erstatte batchkjøringene med Vertica, og få innsyn i sanntid. Innsynet ble gjort tilgjengelig for de butikkansatte gjennom en app for nettbrett: Det er, som kjent, de som løpende kan gjøre noe med hva som stilles ut og anbefales.

En referansekunde på Autonomy-delen av Haven er Nascar, et selskap som arrangerer en spesiell type baneløp for bil.

Her var poenget å følge med på stemninger, hva «fansen» er opptatt av i øyeblikket: et race, en bil, en sponsor, en fører. Informasjon fra systemet brukes til å tilrettelegge nettsted og tv-dekning, minutt for minutt, inklusiv annonser. Til grunn ligger millioner av ytringer i sosiale fora.

HP ser på Haven som et økosystem, der partnere er tiltenkt en avgjørende rolle.

Håpet er at partnere og uavhengige utviklere skal sette sammen og dele på applikasjoner på Haven-plattformen. Haven har en egen utviklerportal, og det er ordninger som gjør det mulig å prøve ut produktet uten å betale lisens.

Blant Haven-applikasjoner fra HPs partnere:

  • Accenture har utviklet et verktøy for sikkerhetsanalyse.
  • Avnet har laget et analytisk verktøy for helse- og omsorg.
  • Capgemini har framstilt et verktøy for risikovurdering innen forsikring.
  • Deloitte har utviklet en løsning for å avdekke når misfornøyde medarbeidere snoker for mye rundt i interne systemer («Insider Threat Analysis»).
  • Pwc har en løsning for prediktiv analyse innen e-handel.
  • Wipro har et verktøy for analyse av service behov innen industriproduksjon.

IT-selskaper kan ikke selv unnlate å bruke produkter som de skal selge til andre.

HP oppgir to eksempler på intern bruk av Haven: Vertica-baserte løsninger legges til grunn for daglige justeringer av nettstedet hp.com. Autonomy-baserte løsninger brukes til å analysere ustrukturert informasjon, for eksempel fra løpende kundeundersøkelser.

Leave a Reply

Your email address will not be published.