Hortonworks en un VPS con Ubuntu 16.04

A lo largo de los últimos días hemos estado trabajando en hacer realidad la idea de tener un VPS con una distribución de Hadoop instalada. Después de haber pasado un tiempo trabajando con una máquina virtual en mi ordenador personal, quería experimentar con un entorno más potente que me permitiese trabajar con más datos y a más velocidad.

Finalmente nos hemos decidido por lo siguiente:

  • VPS con 24 GBs de memoria RAM
  • 4 cores a 2,4 GHz
  • Imagen Docker de Hortonworks

hw

Leer Más

De Data Science a Intelligent Apps (I)

Con bastante frecuencia, cuando trabajamos en lo que se suele denominar ‘Analítica avanzada’, solemos centrarnos en el desarrollo de un algoritmo que resuelve un problema. Por ejemplo, un algoritmo que nos recomiende una serie de películas en base al histórico que se pueda tener de la actividad de muchos usuarios.

En estos casos, se suele entrenar el algoritmo y, una vez que la precisión de dicho algoritmo es lo suficientemente buena, se empaqueta para que pueda ser utilizado por desarrolladores (por ejemplo en una web de compra de películas).

Es decir, se establece una frontera entre lo que supuestamente hace un «científico de datos» y un desarrollador web.
Leer Más