Los archivos de secuencia son generados por las tareas de MapReduce y pueden utilizarse como formato común para transferir datos entre trabajos de MapReduce.
Se pueden leer de la siguiente manera:
Configuration config = new Configuration();
Path path = new Path(PATH_TO_YOUR_FILE);
SequenceFile.Reader reader = new SequenceFile.Reader(FileSystem.get(config), path, config);
WritableComparable key = (WritableComparable) reader.getKeyClass().newInstance();
Writable value = (Writable) reader.getValueClass().newInstance();
while (reader.next(key, value))
// perform some operating
reader.close();
también puede generar archivos de secuencias por sí mismo utilizando SequenceFile.Writer.
Las clases utilizadas en el ejemplo son los siguientes:
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.SequenceFile;
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.io.WritableComparable;
y están contenidos dentro de la dependencia hadoop-core
experto:
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-core</artifactId>
<version>1.2.1</version>
</dependency>
¿Cuál es la clase de clave y la clase de valor aquí. ¿Desde donde se accede? Plese ayúdame en esto. Gracias por adelantado. –