? Et datavarehus er en relasjonsdatabase , en elektronisk database hvor data er lagret i tabeller med rader og kolonner . Den er designet for spørring og analyse , snarere enn hverdagen transaksjonsbehandling. En transaksjon er en atom enhet av arbeid, for eksempel å betale en strømregning fra bankkontoen din , som enten lykkes eller mislykkes. I motsetning til en transaksjonsbehandling system , ikke et datavarehus ikke trenger å svare umiddelbart på brukerens ønsker og har andre unike egenskaper. Subject Oriented
En database er utviklet for å hjelpe analytikere analysere data . Som sådan , er data lagret av saksområdet , snarere enn av søknaden , med andre ord , er dataene Den nøyaktige saksområdet kan variere fra virksomhet til virksomhet, men en bedrift kan bestemme seg for å strukturere sin datavarehus ved "emne -orientert . " salg, leveranser eller inventar , slik at det kan svare på spørsmål som " Hvilke kunden kjøpte det meste av dette produktet i fjor ? "
Extract, Transform og Load
et annet kjennetegn ved et datavarehus er at det må trekke sammen data fra ulike operasjonelle databaser , filer og data segmenter , det så presenterer dem på en konsistent format . Dette betyr at , før de overføres til et datavarehus , må den gjennomgå en prosess som kalles ekstrakt, transformere og laste. Først trekker ut data fra denne prosess en eller flere operative datakilder. Sekund, fjerner det uoverensstemmelser fra dataene , og endelig , laster den dataene inn i datavarehuset . Til syvende og sist avgjør effektiviteten av denne prosessen kvaliteten på dataene i et datavarehus .
Nonvolatile
Når overført til et datavarehus , gjør data ikke endre , og er beskrevet som " ikke-flyktig . " Dataene er ikke ment å kjøre den dag- til-dag virksomhet , i motsetning til data holdt i operasjonelle databaser , er det ikke oppdatert etter hver enkelt transaksjon . I stedet overføres data i datavarehuset med jevne , bestemte intervaller , for eksempel en gang per dag , en gang per uke eller en gang per måned, avhengig av det nøyaktige innholdet i dataene.
Historiske data
motsetning til en transaksjonsbehandling system, der historiske data er arkivert for å opprettholde ytelsen til databasen, må et datavarehus inneholde historiske data. For å identifisere business trender , analytikere krever store mengder data , samplede over tid , inneholder så et datavarehus historiske " snapshots " av operasjonelle data til bestemte tider . Med andre ord , blir dataene i et datavarehus beskrevet som "tid variant , " fordi det fokuserer i hovedsak endre seg over tid .