... | ... | @@ -103,6 +103,7 @@ Para el desarrollo del proyecto, podemos establecer tres partes bien diferenciad |
|
|
2. Procesamiento de datos: Una vez que tenemos el fichero .csv con el nombre del usuario que publicó el tweet junto con su mensaje, indicaremos las palabras que queremos encontrar dentro de los tweets relacionadas con las empresas y en el momento que se produzca una concidencia se sumarán tantos puntos como valoración tenga el usuario según otro fichero donde se indique. Si el usuario no se encuentra en dicho fichero, se le asignará una puntuación de 1 por defecto.
|
|
|
3. Presentación de resultados: Una vez que Hadoop consiga procesar los tweets y obtener todos los puntos en el bloque anterior, se generará un fichero de salida que se procesará para generar un fichero HTML con los resultados que será el que se muestre en pantalla.
|
|
|
|
|
|
Además, para la ejecución del proyecto se han desarrollado scripts que automatizan el proceso.
|
|
|
Además, para la ejecución del proyecto se han desarrollado scripts que automatizan el proceso. Podemos ver un esquema de los distintos procesos en el siguiente diagrama de bloques:
|
|
|
|
|
|
|
|
|
 |