" ETL " står for Extract, Transform og Load - de tre grunnleggende oppgaver av ETL . Ekstrakt innebærer å trekke ut data fra eksterne kilder som du ønsker å bringe inn i databasene. Transform innebærer manipulere de eksterne dataene til et format som vil matche opp med formatet på dataene for tiden i databasene. Belastningen er for import av de transformerte data i den endelige database eller system hvor den vil ligge . Noen har funnet det lettere å laste inn data priot å transformere det , og det er mulig å se begrepet skrevet som " ELT . " Hver oppgave på egen hånd kan være komplisert , og det er software verktøy og systemer bygget spesielt for ETL behandling. Pakk
" Extract " oppgave innebærer å innhente data fra eksterne kilder som du ønsker å bringe inn i dine systemer og databaser . I et selskap, kan dataene bli funnet i frittstående databaser eller regneark som ikke er integrert med noen master databasen . Dataene kan også være hard- kopi eller kan være data du kjøper fra en dataleverandør . Målet med denne oppgaven er å forstå formatet på data , vurdere den samlede kvaliteten på dataene og å trekke ut data fra kilden slik at det kan bli manipulert i neste oppgave.
Transform
i " Transformer" trinn , bruker du en rekke verktøy og selv tilpasset programmering for å manipulere dataene slik at den integreres med data du allerede har. For eksempel vurdere et system som identifiserer menn med en " M" og kvinner med en " F." Hvis du har hentet data fra en ekstern kilde som identifiserer menn med en " 1" og kvinner med en " 2 , "du trenger for å forvandle dataene ved å konvertere " 1 " til en" M " og" 2 "til en" F ", slik at den passer med de data som for tiden bor i dine databaser og systemer .
Load
Etter at du har lykkes forvandlet de dataene du trenger å fysisk laste det inn i systemet eller database. Før du laster dataene, må du ha en backup av ditt nåværende system , eller at du kan rulle tilbake eller angre import hvis det mislykkes . Etter lasting av data , er det vanlig å kjøre tilsynsrapporter slik at du kan vurdere resultatene fra de fusjonerte databaser og systemer for å sikre at de nye dataene har ikke forårsaket noen feil eller problemer.
ELT
Når " Transformer" oppgave i seg selv er stort og komplekst , kan det være lurt å trekke ut data , legger du det inn i en midlertidig tabell inne i databasen hvor det vil bo fast og utføre handlingene til " ; Transform " skritt etter at du har lastet dataene. Etter å ha dataene som er lagt i det endelige systemet under " Transform " step noen ganger gjør det enklere å kjøre rapporter og å teste resultatene av transformasjonen operasjoner. På grunn av dette , er det mulig å se begrepet skrevet som " ELT " heller enn " ETL . "