... | @@ -15,3 +15,58 @@ Respecto del software general que se necesita tenemos: |
... | @@ -15,3 +15,58 @@ Respecto del software general que se necesita tenemos: |
|
1. Linux
|
|
1. Linux
|
|
2. Java JDK 7
|
|
2. Java JDK 7
|
|
3. Mozilla Firefox (o su equivalente Iceweasel) para visualizar los resultados.
|
|
3. Mozilla Firefox (o su equivalente Iceweasel) para visualizar los resultados.
|
|
|
|
|
|
|
|
De forma más específica, se requerirá el siguiente software:
|
|
|
|
1. MongoDB (base de datos no relacional)
|
|
|
|
2. Hadoop
|
|
|
|
|
|
|
|
Además, para no tener que modificar demasiado los scripts de ejecución, se han colocado los ficheros tanto de MongoDB como de Hadoop en una carpeta llamada cdtools dentro del raíz $HOME y la versión utilizada de Hadoop es la 2.5.1. Cuando se comenten los scripts se indicará lo que se debería hacer si se dispone de otra versión o el directorio es distinto.
|
|
|
|
|
|
|
|
Por si no se dispone de alguno de los últimos requisitos estos son los pasos para su obtención:
|
|
|
|
### Instalación de MongoDB
|
|
|
|
1. Crea la carpeta cdtools si no dispone de ella (mkdir cdtools).
|
|
|
|
2. Entra en la misma (cd cdtools).
|
|
|
|
3. Descarga la última versión de MongoDB via web mediante (http://www.mongodb.org/downloads)
|
|
|
|
4. Descomprímelo mediante el siguiente comando (tar -zxvf mongodb-linux-i686-<ver>.tgz) donde <ver> es la versión que hayas descargado.
|
|
|
|
5. Por comodidad y para seguir la misma nomenclatura, finalmente cambiamos el nombre a simpelmente "mongodb" mediante (mv mongodb-linux-i686-2.6.4/ mongodb)
|
|
|
|
|
|
|
|
### Instalación de Hadoop
|
|
|
|
1. Configuración de las variables de entorno. Dicha configuración dependerá de si usa bash o tsch.
|
|
|
|
a. Para bash, abre el fichero .bashrc de la raíz ($HOME) mediante vim .bashrc y añade el siguiente código:
|
|
|
|
|
|
|
|
*export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386/
|
|
|
|
*export PATH=$JAVA_HOME/bin:$PATH
|
|
|
|
*export HADOOP_PREFIX=/home/teleco/cdtools/hadoop-2.5.1
|
|
|
|
*export HADOOP_CLASSPATH=$JAVA_HOME/lib/tools.jar
|
|
|
|
|
|
|
|
Remplaza /home/teleco por tu directorio raíz. Si no lo conoces, escribe pwd en una terminal recien abierta.
|
|
|
|
|
|
|
|
b. Para tsch, edita el fichero .cshrc mediante vim .bashrc y añade el siguiente código
|
|
|
|
*setenv PATH $PATH:~/cdtools/apache-maven-3.2.3/bin
|
|
|
|
*setenv JAVA_HOME /usr/lib/jvm/java-7-openjdk-i386
|
|
|
|
*setenv HADOOP_PREFIX /home/teleco/cdtools/hadoop-2.5.1
|
|
|
|
*setenv HADOOP_CLASSPATH $JAVA_HOME/lib/tools.jar
|
|
|
|
De nuevo, remplaza /home/teleco por tu directorio raíz.
|
|
|
|
|
|
|
|
2. Descarga hadoop mediante los siguientes comandos:
|
|
|
|
a. cd cdtools
|
|
|
|
b. wget http://apache.rediris.es/hadoop/common/hadoop-2.5.1/hadoop-2.5.1.tar.gz
|
|
|
|
c. tar -xvf hadoop-2.5.1.tar.gz
|
|
|
|
|
|
|
|
3. Cambia los fichoros de configuración que se encuentran en /etc/hadoop:
|
|
|
|
En fichero etc/hadoop/core-site.xml sustituye la configuración (vacía) por esta:
|
|
|
|
<configuration>
|
|
|
|
<property>
|
|
|
|
<name>fs.defaultFS</name>
|
|
|
|
<value>hdfs://localhost:9000</value>
|
|
|
|
</property>
|
|
|
|
</configuration>
|
|
|
|
|
|
|
|
En el fichero etc/hadoop/hdfs-site.xml sustituye la configuración (vacía) por esta:
|
|
|
|
|
|
|
|
<configuration>
|
|
|
|
<property>
|
|
|
|
<name>dfs.replication</name>
|
|
|
|
<value>1</value>
|
|
|
|
</property>
|
|
|
|
</configuration> |