Cuando Hadoop termina de procesar los datos, nos pone el resultado en un fichero llamado part-r-00000 dentro del directorio que le hayamos indicado el ejecutar el .jar (en nuestro caso output). Dichos resultados se podrían ver fácilmente en el terminal, aunque no sería muy visual para el usuario. Por ello, se ha implementado un código en Java que se encarga de tomar el fichero part-r-00000 de Hadoop una vez pasado de hdfs a local y a partir de él construir un fichero HTML que muestre los resultados y extraiga conclusiones.
El código se encuentra en GITLAB dentro de la carpeta "resultado". Únicamente dispone de la clase *Ficheros.java*, que se puede usar únicamente modificando al final la ruta en la que se encuentre el fichero part-r-00000 y en la que se va alojar el fichero con los resultados. Para que funcionen bien los scripts, se recomienda que los ficheros estén dentro del directorio compdist_business_analysis_tweets. El código Java es el siguiente:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.PrintWriter;
public class Ficheros {
public void escribirHTML(String ruta, String dest) {
Además de los scripts que ya se han ido comentando, existe otro llamado ./script.sh, que directamente se encarga de realizar todos los pasos para la obtención de los resultados, es decir que una vez arrancado hadoop, si se ejecuta, éste se encargará de descargar los tweets, almacenarlos en MongoDB, generar el .csv, procesarlo con Hadoop, exportar los resultados, pasarlos a HTML y abrir un navegador con los mismos. El código es básicamente una concatenación del ./tweets.sh y el ./hadoop.sh; por lo que los cambios necesarios para que funcione son los mismos que se describieron con anterioridad.
## RESULTADOS
Como nuestro cometido era conocer quién de las cuatro compañías entre Amazon, Apple, Google y Microsoft tenía más valoración, descargamos los 81000 tweets que comentamos y los procesamos con Hadoop según lo ya descrito. Finalmente estos son los resultados obtenidos: