Programvare databaser motta informasjon fra en rekke kilder og lagre denne informasjonen for bruk av programmer og sluttbrukere. Ikke all informasjon som presenteres i et format som en database kan håndtere, dataene må gjennomgå visse endringer for å gjøre den kompatibel med database format. Utvinning, transformasjon og lasting prosesser gjør det mulig for informasjon å komme fra en datakilde og lastes inn i en database . Utvinning
Extraction er prosessen med å ta data fra en kilde filsystem eller et annet sted for eventuell integrering i en database . Hvis data er feilaktig hentet deretter påfølgende prosesser er sannsynlig å møte problemer hvis de ikke klarer helt. Utvinning er spesielt viktig for databaser som trekker informasjon fra flere kilder som filsystemer som brukes av hver kilde er kanskje ikke fullt kompatibel med databasen eller hverandre . Flere utvinning metoder kan være nødvendig for å sikre forsvarlig utvinning fra alle kilder .
Transforming
transformasjonsprosessen forbereder hentet data for lasting inn i en database . Avhengig av likhetene mellom filsystemet som brukes av datakilde og at den inneholder , kan en rekke endringer i dataene være nødvendig å gjøre den kompatibel med databasen filsystemet . Disse endringene kan omfatte sammenslåing av ulike datafelt , oversettelsen av data fra ett format til et annet og gjøre justeringer i retning av data felt, slik at de samsvarer med tilsvarende format av databasen .
loading
lasting prosessen tar data som har blitt forvandlet og genererer nye database poster basert på disse dataene. Disse nye postene er i standard database format og kan nås av programvare eller brukere med med riktig legitimasjon eller database administratorrettigheter. Andre endringer kan gjøres til dataene etter brukere eller database programvare , selv om disse endringene ikke vil bli reflektert i dataene fortsatt holdt på den opprinnelige kilden.
Bruk av ETL prosesser
ETL- prosesser er ofte brukt i datavarehus og lignende operasjoner hvor store mengder data er hentet fra en rekke forskjellige datamaskiner eller servere . De tre prosesser som arbeider sammen for å sikre at data er riktig omdannes fra sin kilde formen til en form som kan brukes ved den sentrale databasen uten feil. Uten bruk av ETL prosesser , data kan bli registrert feil i databasen sin format eller kan ende opp med ikke å bli tatt opp i det hele tatt .