MapReduce er en parallell programmering modell utviklet i Google for store datasett . Den behandler data i porsjoner i stedet for i sekvensiell rekkefølge . Ved å gjøre det , det er avhengig av et kart over sammenkoblede inngangsfunksjoner ( keys ) og verdier som det da setter gjennom Reduser funksjon - dermed sitt navn - for å gjøre dataene lettere å forstå. I stedet for å gi kartfunksjon med en nøkkel og verdi , en invertert indeks par ord og dokumenter for å søke tekst . Du kan bruke inverterte indekser i MapReduce å opprette en indeks for et søkeord , for eksempel. Instruksjoner en
Skriv inn følgende kode for kartfunksjon : en
public static class InvertedIndexerMapper strekker MapReduceBaseimplements Mapper {private final statisk tekst ordet = new tekst (); private endelige statisk tekst location = ny tekst ( ) ;
public void kart ( LongWritable nøkkel , Tekst val , OutputCollector utgang , Reporter reporter ) kaster IOException { FileSplit FileSplit = ( FileSplit ) reporter.getInputSplit (); String filnavn = fileSplit.getPath ( ) getName (); location.set (filnavn ) ;