Hyppig mønster gruvedrift, også kjent som hyppig itemset gruvedrift, er en teknikk for å oppdage grupper av elementer som ofte opptrer sammen i en database . Ifølge Dr. Christian Borgelt , Principal Forsker ved Det europeiske senter for Soft Computing , har hyppig mønster gruvedrift vært en av de mest aktivt forsket temaer i data mining siden tidlig på 1990-tallet og en rekke matematiske algoritmer har blitt utviklet . Hyppig Pattern Mining
Hyppig mønster gruvedrift er en elementær problem i mange applikasjoner. En typisk transaksjonsbaserte database - for eksempel en database som beskriver oppførselen til shoppere på Main Street , på postordre eller på nettet - inneholder et stort antall itemsets og presenterer en utfordring i form av å utvikle effektive og skalerbare algoritmer . Hyppige mønster gruvedrift algoritmer kjent som Apriori , Eclat og FP - veksten er blant de mest kjente .
Apriori algoritme
Apriori algoritme, først foreslått av Rakesh Agrawal og Ramkrishnan Srikant av IBM Almaden Research Center i 1994 , fungerer på prinsippet om at itemsets telles når de oppstår i transaksjoner. Databasen er skannet for å finne en hyppig - itemsets , blir det 1- itemsets brukt til å generere 2- itemsets og så videre opp til k- itemsets . En k - itemset sies å være hyppige hvis og bare hvis alle sine subitemsets er hyppige. Siden det først ble foreslått , har mange forbedringer i Apriori algoritmen blitt foreslått
FP - vekst Algoritmen
FP - vekst algoritme - . FP står for " Frequent Pattern" - benytter en teknikk kjent som algoritmen skanner databasen til å opprette en liste over hyppige elementer i synkende rekkefølge , som den bruker til å komprimere databasen til en FP - treet " splitt og hersk ". . FP - treet selv er minelagt , og starter med hver hyppig lengde - 1 mønster - også kjent som suffiks mønster - for å skape en betinget FP - treet, som inneholder prefikser tilsvarende elementer som co- skje med det første suffikset mønster. Den innledende suffikset mønsteret er sammensatt med hyppige mønstre funnet i den betingede FP - treet for å oppnå mønster vekst.
Eclat algoritme
Apriori og FP - vekst algoritmer gruve hyppige mønstre fra et sett av transaksjoner arrangert horisontalt. Likeverdighet Class Transformation ( Eclat ) algoritme - foreslått av Mohammed J. Zaki , professor i informatikk ved Rensselaer Polytechnic Institute i 2000 - på den annen side , arrangert gruver hyppige mønstre i et sett av transaksjoner vertikalt. Den Eclat algoritme starter med et enkelt element og bruker et sett kryss for å avgjøre hyppige itemsets og gjentar inntil ingen ytterligere hyppige itemsets kan bli funnet .