ONG en el estado de México

El estado de México está integrado por 125 municipios, de acuerdo con información del Instituto Nacional de Geografía e Informática (INEGI).

Por su parte el Registro Federal de Organizaciones de la Sociedad Civil reporta que existen ONG’s registradas en 102 municipios y que no hay organizaciones registradas en los restantes 23, lo que implica que existen organizaciones de la sociedad civil en el 81.6 de municipios de la entidad.

Con estos datos elaboré el mapa siguiente que muestra en verde los municipios donde existen OSC y en amarillo aquellos donde no hay organizaciones registradas.

EdoMexMpiosConOSC

Con la información obtenida se puede identificar cuantas OSC existen por cada municipio y es interesante observar que 77 municipios cuentan con menos de 11 organizaciones, en 9 municipios tienen presencia de 12 a 33 OSC, en otros 11 municipios hay entre 34 y 61 organizaciones de la sociedad civil, en 4 municipios se registraron entre 62 y 163 OSC y de ahí hay un salto enorme al municipio que registra el mayor número de organizaciones: 306.

Así, tenemos que los municipios con mayor número de organizaciones son:

Nezahualcóyotl: 306

Naucalpan de Juárez: 163

Toluca: 143

Ecatepec de Morelos: 138

Tlalnepantla de Baz: 97

Esta información puede observarse en el mapa siguiente.

EdoMexOSCxMpiosAdemás es curioso observar que los municipios en donde existe el mayor número de OSC registradas están alrededor del Distrito Federal, a excepción de Metepec; y que los municipios donde no existen OSC registradas son los que están más lejanos Toluca, la capital de la entidad.

Si lo deseas aquí puedes descargar el archivo de datos de las OSC en el estado de México y el archivo con la información de OSC por municipio; los dos están en formato csv separado por comas con el conjunto de caracteres utf8.

@oliveraherbert

Liberar tablas de datos de archivos PDF

TabulaHasta hace poco extraer texto de un archivo PDF era complicado, pero extraer una tabla de datos era un vedadero dolor de cabeza.

Hace un par de semanas tuve que extraer información gubernamental de éste tipo de archivos y después de una búsqueda me encontré con Tabula.

Es una herramienta de software libre con la que se puede liberar fácilmente una tabla de datos y guardarla en formato CSV o pasarla a un archivo de Calc en LibreOffice o en cualquier otro programa de hojas de cálculo y lo mejor es que funciona en Linux, Mac o Win.

En su sitio web encontrarás la información necesaria para instalarlo enlas plataformas mencionadas y una breve guía de uso.

Por ahora nos concentraremos en un ejercicio de extracción de datos en unos cuantos pasos.

En Debian abrimos la terminal, vamos a la carpeta donde instalamos tabula y usamos el siguiente comando: java -Dfile.encoding=utf-8 -Xms256M -Xmx1024M -jar tabula.jar

Esto ejecuta Tabula en nuestro navegador y se verá así.

Tabula1Hacemos click sobre el botón Examinar para ubicar el archivo PDF que contiene la tabla a extraer y después uno más en Submit para cargarlo.

Tabula2Tabula4

Ahora, con el mouse seleccionamos las columnas y renglones que queremos liberar

Tabula5 Damos click en el boton verde Download All Data y se inicia el procesamiento de la información y eso es todo.

Tabula6

Ahora podemos copiar los datos en formato CSV o bien descargarlos en un archivo, haciendo click sobre cualquiera de los dos botones azules en la parte inferior izquierda de la pantalla.

Tabula7

Si realizas tareas como estas con frecuencia Tabula es la herramienta indicada.

@oliveraherbert

 

Extracción de tablas de datos de páginas web

TableToolsEn diversas ocasiones tenemos necesidad de extraer información de tablas publicadas en sitios web, actividad que para algunos de nosotros es muy frecuente, sobre todo cuando dedicamos parte de nuestro trabajo a la investigación y análisis de datos desde las organizaciones de la sociedad civil.

Aunque esto parace muy complicado es en realidad algo muy fácil de hacer con la herramienta adecuada.

Para facilitar esta tarea sugerimos utilizar el complemento TableTools2 para los navegadores Firefox o Iceweasel que nos permite copiar estos datos en menos de dos minutos; aunque también permite ordenar, buscar, filtrar, resumir, combinar y comparar tablas html, además de hacer gráficos de las mismas.

Vamos al sitio del complemento y hacemos click sobre el botón Add to Firefox para instalarlo.

Después probamos su uso en una tabla de datos publicada por el Instituto Electoral del Distrito Federal, que contiene los resultados de la elección de diputados del 2012 de mayoría relativa de los 40 distritos que existen en el D.F, en la pestaña condensado por distritos.

Tabla1

Aquí colocamos el puntero del mouse sobre la primera celda de la primera fila (Distrito), hacemos click derecho con el mouse y en la parte inferior del menú que se despliega seleccionamos TableTools2 y después la opción Copiar.

Tabla2

Entonces se despliega otro menú y seleccionamos la primera opción: Copiar como texto delimitado por tabulador, con lo que extraemos los datos y ahora podemos pegarlos en una tabla en un programa de manejo de hojas de cálculo, como nosotros utiloizamos software libre sugerimos el programa Calc de LibreOffice.

Tabla3

Abrimos una hoja de cálculo, seleccionamos la primera celda de la primera fila, hacemos click con el botón derecho del mouse y se despliga un menú, donde verificamos que la opción de separador sea la misma que cuando extrajimos los datos, en este caso la opción  de separador es Tabulador, hacemos click sobre aceptar y listo.

Tabla5

Tenemos ahora en una hoja de cálculo los datos que copiamos de la página web para hacer el análisis que consideremos adecuado.

Tabla6Los invitamos a explorar las otras opciones que nos permite TableTools2 y también a instalar y probar el complemento Table2Clipboard con el que podemos realizar tareas similares.

@oliveraherbert