lunes, 23 de enero de 2012

Arquetipo Maven para proyectos con Hadoop

Últimamente, he tenido que realizar un proyecto con Hadoop. Para facilitar esta tarea tenemos a nuestra disposición un arquetipo maven que nos simplifica enormemente el trabajo en estos proyectos. Para comenzar con un proyecto maven para Hadoo solo tenemos que utilizar la siguiente línea de comandos:
mvn archetype:generate -DarchetypeCatalog=http://dev.mafr.de/repos/maven2/

Selecciona hadoop-job-basic y completa los datos según se vayan pidiendo (artifactId, groupId, version) y tendrás un proyecto con el ejemplo tradicional de Hadoop WordCount.

Genera el proyecto de la manera tradicional con maven:
mvn install

Una vez generado, el fichero interesante es el artifactId-version-job.jar. Este fichero está autocontenido, con lo ejecutarlo en Hadoop es bastante sencillo:
hadoop jar artifactId-version-job.jar argumentos



No hay comentarios:

Publicar un comentario