Datamaskin databaser er programmer lagrer store mengder informasjon på en organisert måte . Disse dataene kan gjelde alt fra baseball statistikk til selskapets resultater . Det kan også inkludere en rekke elementer , 100-1000000 . Forstå trender av disse dataene kan være vanskelig, men summarization metoder i stor grad bidra til å bryte ned informasjonen til brukbare oppsummert komponenter. Line Items
Linje elementer referere til hver enkelt post i en database , ikke- kortversjon av dataene . Dette inneholder det rå informasjon matet inn i databasen , vanligvis gjennom manuelt oppføring. En linje kan inneholde flere tall, men hvert tall gjelder en bestemt post . For eksempel kan du ha en liste over 20 baseball-spillere , hver baseballspiller regnes som en linje og for hver spiller har du fem av sine Major Spilt statistikk for en gitt sesong . Hver og en av disse statistikkene er ikke en artikkel , men hver linje inneholder fem statistikken.
Segment Samandrag
Segment samandrag refererer til å ta de ikke- oppsummerte linjeelementer og omorganisere dataene på en måte som er mer fornuftig når du prøver å forstå eller tolke den generelle budskapet i dataene. For eksempel , hvis selskapet generert en linjeelementrapport av hvert element solgt det siste året , kan det være mer fornuftig å oppsummere eller omorganisere dataene ved mengden av hver type element solgt . I dette tilfellet ville du ønsker å segmentere dataene i deler ved hjelp av produktenes varenumre .
Nivå 1 Samandrag
I et Level 1 samandrag , en del av dataene er kuttet ut og bare visse opplysninger gjenstår. I dette nivået av samandrag , starter du med hele datasettet av linjeelementer , tar all informasjon i betraktning, så hvis du bare er interessert i et bestemt element selges , for eksempel, ville du slette all annen informasjon bortsett fra at av interesse for deg og omorganisere de resterende data . I vårt eksempel , kan du omorganisere etter element prisklasser, elementet beskrivelse eller tid der varene ble solgt.
Nivå 2 Samandrag
Nivå 2 samandrag bygger på nivå 1 samandrag . Her vil du ikke starte med de rå linjeelementfunksjonene data , men ta informasjonen fra nivå 1 samandrag , og bestemme hva informasjonen er ikke relevant for anaysis din . For eksempel kan du bare være interessert i salg i vinter og deretter forkaster informasjon fra mars til oktober , med fokus kun på november til februar salg .