Archive for December 21, 2016

Slik finner søkemotorene det de tror passer for deg

– Svært få tenker over hvordan søkemotoren velger og prioriterer sine treff, sier professor Krisztian Balog ved Universitetet i Stavanger.

Google for eksempel, bestemmer hvilke tilbud som kommer øverst, og hvilke som havner lenger nede.

Balog forsker på data-gjenfinning, som i stor grad dreier seg om utviklingen av søkemotorene.

Søkemotorene henter ut informasjon fra store mengder ustrukturerte data. De kombinerer resultatene fra flere søkekilder til et forståelig og nyttig format ved bruk av såkalt maskinlæring. Det betyr at maskinen på egen hånd kan forbedre sin evne til problemløsning, som i dette tilfellet gir mer relevante og presise søk.

Balog er tilknyttet Institutt for data- og elektroteknikk ved Det teknisk-naturvitenskapelige fakultet, Universitetet i Stavanger.

Lærer av seg selv

– Lagring og deling av store datamengder er ikke interessant i seg selv hverken for leverandøren eller kunden, men det enorme volumet med tilgjengelig informasjon gjør det nødvendig for den enkelte av oss å stole på verktøyene og på teknologien, sier Balog.

Søkemotorene bruker en såkalt edderkopp, også kalt crawler, for å samle inn informasjon.

Den besøker nettsider flere ganger. På denne måten oppdager den kontinuerlig ny informasjon og den tilegner seg på minutter det vi ellers ville trengt uker på å lære oss.


Professor Krisztian Balog underviser på nytt masterkurs: Webprogrammering, websøk og data mining på Universitetet i Stavanger. (Foto: Lars Gunnar Dahle/ UiS)

Google tilpasser søkene sine til steder du allerede er pålogget og opererer dermed innenfor brukerens egen informasjonsboble.

Det du liker på Facebook vil påvirke hvilket innhold du får presentert i neste omgang.

– Søkemotorene er det nærmeste vi i dag kommer kunstig intelligens, samtidig som den beste måten å gjøre dem mer intelligente på er å bruke dem enda mer, sier professoren.

Søkemotorene har vokst kraftig

– AltaVista, en av de aller første søkemotorene, ble bygget i 1995. I år 2000 ga den tilgang til 500 millioner sider. I dag kunne disse vært lagret på én maskin og Google alene laster nå ned over 20 milliarder sider daglig.

– Hva ellers skiller dagens søkemotorer fra sine 10 år gamle forgjengere?

– Google opererer i dag mer enn et dusin kjempestore datasentre over hele kloden for å dekke behovet, og i stedet for ti blå lenker med dokumenter får vi i dag en mengde treff med fyldige og direkte svar. I tillegg er relevante utdrag markert i ingressen.

På toppen av dette mottar vi mye tilleggsinformasjon, faktabokser med lenker, gjerne sortert etter relevante parametre, som for eksempel tilberedningstid for matretter og reisetid.

Hjelper uten at du ber om det

En søkemotor fyller også inn informasjon som mangler, og som er nødvendig for å kunne gi deg et svar. På samme måte som iPhones hjelpsomme venninne Siri kjenner søkemotorene deg bedre for hver gang du spør om noe.

Alt handler om å tilby korrekt informasjon til rett person til avtalt tid, på samme måte som Google Now presenterer informasjon som er relevant for det du holder på med – uten at du aktivt ber om det. Dette kan være flyavganger, viktige arrangement eller attraksjoner i nærheten, fødselsdager, avtaler du har gjort og som nærmer seg i tid.

– Datavitenskapen kan gjennom å etablere brukervennlige grensesnitt bidra til at organisasjoner og enkeltbrukere forstår og kan nyttiggjøre seg store datamengder på en bedre måte enn i dag, mener Balog.

Han spår en videre sterk vekst de nærmeste årene innen proaktiv søking, der maskinen søker for deg på egen hånd, basert på din søkehistorie og dine preferanser. 

Gjør våre digitale fotspor evige

Balog peker også på de mange utfordringene som er knyttet til jus og personvern i forhold til avansert bruk av søkemotorer.

– På den ene siden hjelper de oss til raskt å få tilgang til relevant informasjon. På den andre siden inneholder søkehistorien opplysninger av privat karakter, som søkeordene i seg selv, for eksempel informasjonssøk om sykdommer.

I tillegg lever opplysninger om politisk engasjement, økonomiske forhold, dommer, bøter og annen sensitiv informasjon i tilnærmet evig tid på nettet.

På dette området gjenstår det mye arbeid med personvern, ulik lovgivning og rettspraksis landene imellom og for eksempel mellom EU og landene utenfor.

– De sponsede lenkene som kommer opp i søkene er også basert på din personlige søkehistorie, legger Balog til.

Han forteller at EU har under arbeid et lovframlegg om innsyn i hvorfor en algoritme anbefaler deg det ene framfor det andre når du søker på internett. Det kunne også gjelde søkeresultatene, men dette utløser en mengde spørsmål.

– Vi kan anta at Google ikke vil dele informasjon med konkurrentene om hvordan systemene deres arbeider, da denne kunnskapen vil gjøre det mulig for nettsteder å rykke frem i køen gjennom å lure søkemotoren, sier Balog.

Referanse:

J. Rybak m.fl.: Anticipating Information Needs Based on Check-in Activity, Tenth ACM International Conference on Web Search and Data Mining (WSDM ’17). Blir publisert i februar 2017. 

Kvantedatamaskiner i skyen kan regne på hemmelige data

Kvantedatamaskinene kommer. Før eller siden vil forskerne klare å konstruere en kvantedatamaskin som kan brukes til et vell av ulike beregninger, som den vil kunne utføre mye raskere enn vanlige datamaskiner.

Men til å begynne med vil de være ekstremt vanskelige å bygge. Dermed blir de svinedyre og forbeholdt de få.

For de fleste blir det bare mulig å foreta slike beregninger ved å kjøpe seg adgang til en kvantedatamaskin for en kort  periode.

Via det fremtidige kvanteinternettet blir det mulig å sende regnestykkene sine til en kvantedatamaskin i skyen, som det så poetisk heter. Kvantedatamaskinen kan for eksempel stå hos Google, Microsoft eller IBM – for nå å nevne noen firmaer som allerede tilbyr cloud computing og arbeider for å utvikle kvantedatamaskiner. Når «skyen» er klar med resultatet, blir det sendt i retur til brukeren.

Hemmelige beregninger på en fremmed maskin

Selv om det fortsatt ikke finnes verken kvanteinternett eller fullt utbygde kvantedatamaskiner, bør vi begynne å forberede oss.

Det mener i hvert fall Christian Scheffmann Jacobsen, som er postdoktor ved Institut for Fysik ved Danmarks Tekniske Universitet (DTU). Sammen med kolleger fra instituttet og fra University of Toronto i Canada har han vist hvordan man det er mulig å la en kvantedatamaskin regne på hemmelige, krypterte data.

– Når en helt ny teknologi er på vei, bør vi sørge for at sikkerheten er på plass, sier han.

– I begynnelsen vil kvantedatamaskinene være sentralisert. Da trenger vi metoder for å sikre private data. Men det vil selvfølgelig også være nyttig senere, etter hvert som kvantedatamaskiner blir mer utbredte. Da vil det fortsatt være fint å ha noen metoder som sikrer informasjonen.

Datamaskinen får ikke kikke

Hvis vi bare skal lagre data, er det ikke noe stort problem. Da er det bare å kryptere dataene før du sender dem opp i skyen.

Men det er vanskeligere hvis datamaskinen i skyen skal utføre beregninger på dataene – uten å vite hva den regner på. Det er som å utføre et Google-søk uten at Google får vite hva vi skriver i søkefeltet.

– Det er mulig på vanlige datamaskiner, selv om det er vanskelig og ressurskrevde, forteller Jacobsen.

– Spørsmålet var om vi kunne gjøre noe lignende med kvantedatamaskiner, som fungerer på en helt annen måte, altså å sende krypterte data til en fremmed kvantedatamaskin, som utfører beregningene og sender resultatet kryptert tilbake.

Det har fysikerne nå klart, ifølge en artikkel i tidsskriftet Nature Communications.

Halvferdig kvantedatamaskin ble tatt i bruk

På DTU forsøker fysikerne å utvikle en kvantedatamaskin som er basert på laserlys. Ved å manipulere styrken på og fasen til laserlyset kan de produsere kvanteeffekter som kan danne utgangspunktet for beregninger.


Prinsippet bak metoden ser innviklet ut, men den er lett å forstå. Kvantedatamaskinen regner på input som er kryptert og sender et kryptert svar i retur. (Illustrasjon: K. Marshall et al./Nature Comm.)

Fysikerne i Canada har vist at metoden med å holde data hemmelige for fungerte i teorien, men spørsmålet var fortsatt om det ville fungere i praksis, sier Jacobsen:

– Det kunne ha vært eksperimentelle begrensninger for metoden. Det kunne vi teste ved DTU. Vi har selvfølgelig ikke noen ferdig kvantedatamaskin, men vi har en del av den teknologien som er nødvendig. Og forsøket viste at metoden fungerte.

Kan utvikle fremtidens medisiner

Men hva kan det brukes til? Det kommer an på hvilke programmer – kvantealgoritmer – forskerne klarer å utvikle. Men det er for eksempel store forhåpninger til at kvantedatamaskiner kan bidra til å utvikle nye medisiner.

– Et firma har kanskje et molekyl de vil bruke i nye medisiner. De vil simulere hvordan molekylet oppfører seg når det påvirkes på en bestemt måte, ved hjelp av en kvantedatamaskin i skyen, forteller Jacobsen.

– I dette eksempelet vil inputen være det spesifikke molekylet. Kvantealgoritmen vil simulere påvirkningen, og outputen vil være resultatet av påvirkningen. Med metoden vår kan firmaet holde selve molekylet hemmelig.

Dermed er forskerne med på å sikre at vi fortsatt kan holde på hemmelighetene våre i en fremtid der den utrolige regnekraften til kvantedatamaskiner blir noe vi leier på nettet.

Referanse:

Marshall, K. (et al.) Continuous-variable quantum computing on encrypted data. Nature Communications (2016), DOI: 10.1038/ncomms13795

© Videnskab.dk. Oversatt av Lars Nygaard for forskning.no.