«Making data webby», las lecciones de Adrian Holovaty

Adrian Holovaty fue uno de los pioneros de los mashups hiperlocales con su proyecto Chicago Crime Maps (designado por el New York Times como una de las mejores ideas de 2005) donde remezclaba las bases de datos públicas de la policía de Chicago sobre tipo, frecuencia y localización de crímenes en la ciudad con los mapas de Google Maps. Fue una de las primeras demostraciones del enorme valor de las bases de datos públicas cuando se utilizan inteligentemente generando visualizaciones que permiten a los ciudadanos obtener información detallada y precisa sobre su entorno urbano y comprender la dinámica socioeconómica de su entorno. Y por supuesto, este proceso se realiza “en Internet”, el entorno natural donde se gestiona la información hoy en día. Holovaty está trasladando ahora su experiencia a un nuevo proyecto y nueva compañía, EveryBlock, financiado por la Knight Foundation (y que el Sydney Morning Herald incluye entre las “10 cosas que cambiarán tu futuro”). EveryBlock será un sitio que agregará información y noticias locales de ciudades y promete que lo hará con una “gran profundidad”.

En Noviembre de 2007 Holovaty habló sobre como utilizar las bases de datos públicas utilizando la web 2.0 en la conferencia Making data webby que presentó dentro del Seminario de Visualización de Datos Aplicada a la Comunicación organizado en el MediaLab-Prado como parte del proyecto Visualizar. En esta charla explicó el enorme potencial que tiene el uso de bases de datos públicos y su explotación para buscar patrones de información utilizando herramientas de visualización. Este potencial se basa en dos conceptos básicos:

  • Serendipia: descubrimientos deseables sucedidos por accidente. Diseñando el entorno de interacción entre datos y usuarios, necesariamente surgirán usos interesantes sin necesidad de planificarlos de modo estricto.
  • Navegabilidad de los datos (“Data browseability”); algo que la gente desea y espera (“people want it, people expect it”) y que es imprescindible para lograr los “descubrimientos accidentales”.

Para lograr estos dos objetivos, la mitad de la batalla, en palabras de Holovaty, es conseguir datos estructurados. En este ámbito los periodistas y los medios cuentan con una enorme oportunidad dado que, en cierta forma, un periodista y un medio son básicamente recolectores de datos (”data collector”). Así, la principal ventaja competitiva de los medios reside en que recogen información, la verifican y se la proporcionan a la gente. La tragedia es que no han explotado las oportunidades que les proporciona esta actividad. En este sentido, Holovaty criticaba que el periodismo tradicional (trasladado a Internet) no use el hiperenlace para enriquecer las noticias con información complementaria relevante, como por ejemplo, enlazar una noticia de un delito con otras de delitos del mismo tipo o que han ocurrido en el mismo área geográfica. Para corregir estos problemas es necesario estructurar los datos, para lo que ofrece tres lecciones: 

Lección 1: Estructura tus datos, incorpora metadatos, por que “everything has structure”. Por ejemplo, la razón del éxito de Flickr es la estructura que proporciona a “sus datos” (o sea las fotografías): quien hizo la fotografía, donde se hizo, con que cámara, donde, su tamaño, los colores…

Leción 2: Todos los datos tienen estructura. Ejemplos:

  • delitos: donde, cuando, quien (el delicuente, el policia)…
  • deportes, donde el periodismo ha puesto más esfuerzo en estructurar los datos.
  • propiedad inmobiliaria: localización, precio, usos…
  • obituarios: en las esquelas de los periódicos aparecen muchos “metadatos” (edad, causa, superviiventes, familia, …).
  • bodas y nacimientos, que en muchos países y ciudades aparecen como breves noticias en la prensa local y suelen aparecer acompañados de metadatos similares a los de los fallecimientos.

Lección 3: Dale a tus datos “el tratamiento”. Esta sería la parte más sencilla, una vez estructurados los datos, para hacer los datos “webby”:

  1. Lista los campos de la base de datos.
  2. Identifica conceptos clave (selecciona los campos que aportan información relevante).
  3. Divide tus campos en intervalos, por ej., selecciona los intervalos de tiempo en que agregas tus datos o las unidades espaciales.
  4. Genera páginas web con listados para cada unidad o intervalo en que divides tus campos (en 3) e incluye enlaces permanentes para los conceptos (permiten referenciarlos en otros sitios, por ejemplo blogs) para generar dos propiedades: linkability y bookmarkability.

De este modo, los datos serán reutilizables de un modo sencillo y estandarizado por parte de otros usuarios (generando nuevos valores) y se optimizará su posicionamiento en los buscadores.

5 comentarios

  1. ¿No te parece que las tres lecciones que extraes podrían reducirse a dos: 1. estructura tus datos con metadatos y 2. trata esa información?
    Me pregunto si los periodistas no han explotado las posibilidades que tienen como recolectores de datos por falta de formación o de tiempo.

  2. ¿No te parece que las tres lecciones que extraes podrían reducirse a dos: 1. estructura tus datos con metadatos y 2. trata esa información?
    Me pregunto si los periodistas no han explotado las posibilidades que tienen como recolectores de datos por falta de formación o de tiempo.

  3. Que los datos tienen estructura, me parece muy fuerte. Los hechos tienen condiciones de contorno que diferencian a unos de otros y estos contornos, si son estructurables, generando datos estructurados, llegando al caso por caso. Ejemplo: 50 muertos, 29-feb-2007, provincia de Salamanca;
    16 edad avanzada, 3 tráfico, 6 en hospitales de los cuales, 3 tabaquismo, 1 cáncer, 1 postoperatorio, 1 infarto; .. incluso la suma superior a 50 pues pueden darse varios motivos] La epidemiología, sobretodo en USA, es excelente y un desastre en España y Europa en general.
    En cualquier caso, …
    ¡Salud!

  4. Félix, efectivamente estas «leciones» podrían organizarse y presentarse de otras formas, y entiendo que Holovaty mantuvo su segunda leción como tal para recalcar la importancia de la estructura y que ésta puede encontrarse en cuaqluier serie de datos. Respecto a por que no se hace esto habitualmente, yo creo que en general es una mezcla de ambas cuestiones, lo cual además es lógico: si algo no se va a hacer, no es «rentable» o eficaz formar a gente en esas herramientas. Por tanto, lo primero que se necesitaría es que los medios entendiesen las posibilidades que les abren hacer que sus datos sean «webby», y eso supondría un cambio de modelo de negocio en muchos casos.
    Que los daos tienen estructura me parece una obiviedad desde un punto de vista de gestión de la información. esto no supone que la estructura por si sola incorpore la interpretación ni mucho menos. Pero, si no disponemos de datos estructurados, difícilmente podremos analizarlos de un modo objetivo y utilizarlos, como otro elemento más, en el análisis Y7o kla toma de decisiones.

  5. Hola:
    navegando por la red he visto tu blog, me he parado para descansar y lo he explorado, me gusta mucho. Ahora continuo mi viaje. Cuando quieras ven a ver mi blog.
    Ciao.

Responder a µßio Cancelar

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.