Entradas

Mostrando las entradas de septiembre, 2014

El atractivo mundo de BigQuery y los datos abiertos

Imagen
Antes de iniciar la descripción de este pequeño trabajo sobre datos abiertos y el poder de BigQuery, **quiero felicitar  a todos los involucrados en el proceso de liberación de datos, ya que el potencial de análisis que le dejan a la comunidad para análisis cruzados de información es invaluable. También a  +Felipe Hoffa  por su talento y por compartir su conocimiento con la comunidad.  La idea de este análisis es tomar los datos  Descargando los datos desde el portal de datos abiertos Presidencia de la Nación Mexico. http://datos.gob.mx Para este análisis trabajaremos con los datasets de nacimientos del 2008-2013 (6 datasets en promedio csv de 1.3 GB) Si queremos manipular rápidamente estos conjuntos de datos, lo ideal es usar el poder de Compute Engine y la conexión de estos equipo ultra rápida.  Entonces desde una VM de Compute, descargo los archivos. Comando: wget http://www.dgis.salud.gob.mx/descargas/datosabiertos/sinac_2008.zip Luego tendremos q