Personvern og rengjøring er prosessen med å fikse data og fjerne unødvendige data for å optimalisere daglige Datawarehousing operasjoner. Datawarehousing er lagring av data i et sentralt register , slik at alle i en organisasjon kan få tilgang til den. For Datawarehousing å være vellykket, må databasen informasjonen være nøyaktig. Men gitt det store volumet av data som selskapene arbeider med , kan disse dataene ikke alltid rettes opp manuelt . Derfor er automatisert data rensing nødvendig. Tilgjengelighet
data rensing må gjøre de mest relevante data raskt tilgjengelig for dem som søker etter det. Bortkastet tid å søke gjennom irrelevant informasjon kan kaste bort tid for ansatte og avfall selskapets ressurser. Informasjon som er overflødig kan kaste bort selskapet lagringsplass.
Integrity
data rensing må ikke slette eller endre data til hvor dataene blir unøyaktig. Unøyaktige data kan føre til selskaper for å gjøre feil som å sende en regning til feil adresse , som kan sinne kunder og avfall penger . Data må også oppdateres gjennom databasene . Hvis en kunde oppdaterer en fakturaadresse, bør denne oppdateringen distribueres til databaser i alle relevante avdelinger.
Organisere
data rensing bør ta relevante data fra ulike kilder og automatisk flytte disse dataene til egnede steder , slik at dataene kan lett finnes når det trengs . Dette eliminerer behovet for å skape nye data når data som allerede eksisterer.
Error Correction
feil og selvmotsigelser , for eksempel en feilstavet navn , bør lokalisert og korrigert av data renseprosesser . Feil spesielt må korrigeres i dataprogrammer programmering, siden slike feil kan føre til datasystemer for å ikke fungere skikkelig.
Automation
data rensing verktøy bør minimere mengden av manuell innspill som er nødvendig. Med andre ord bør database administratorer ikke å stadig sette i gang prosesser selv, men disse prosessene skal skje automatisk. Det bør også være minimal programmering innsats trengs. Programmerere bør ikke ha å kode når en rutine handling blir utført .
Simplicity
data rensing verktøy må forenkle informasjon når det er mulig . Kompliserte data avfall selskapets ressurser og også tvinger ansatte til å bruke mer tid på jakt etter visse opplysninger .
Analyse
Post- prosessanalyse er manuell undersøkelse av data etter at data er renset . Uansett hvor effektive data renseprosesser er, kan uunngåelige feil oppstår. Database administratorer fortsatt trenger å jevnlig sjekke data manuelt for å sikre at dataene er korrekte. Data rensing verktøy bør tillate administratorer å vise data i en lett forståelig format , slik at korreksjoner kan gjøres raskt.
Effektivitet
data rensing kan være tidkrevende og dyrt. Alt som kan øke hastigheten langs data renselsesprosess eller redusere kostnadene forbundet med data rensing er nødvendig for å maksimere bedriftens lønnsomhet .