principales de distribución de datos • Legislación y licenciamiento • Conceptos avanzados de Open Data • Principales fuentes de datos abiertos para el desarrollo
utilizados, reutilizados y redistribuidos libremente por cualquier persona. Hay diversas variaciones de la definición en relación con el concepto de libertad, dependiendo de quién sea el encargado de recopilar, de almacenar y de publicar los datos.
de datos públicos con un valor incalculable. Es por ello que para el beneficio de todas y todos (administraciones, ciudadanía, empresas, academia, movimientos sociales) éstos deberían ser liberados. Además deberían serlo por una cuestión tan básica como reconocer quién es el dueño o con qué fondos se han producido.
Gobierno Abierto (transparencia y participación) • Mayor eficiencia de las administraciones públicas • Investigación e innovación • Generación de una nueva economía • Nuevo conocimiento mezclando datos • y muchos otros que ni conocemos
donde una organización publicará todos sus datos para ser consultados y reutilizados por otros entes (ya sean personas o programas informáticos). Los portales de datos, al contrario que otros portales web, están enfocados en el dato como unidad semántica básica y fundacional del mismo.
diversa forma y por ello son independientes de una herramienta concreta/ Diferentes son los estándares de datos que se usen para la publicación del contenido, los mecanismos de publicación y cierta homogeneización de buenas prácticas detectadas y ya asumidas por la comunidad.
y permitir opciones avanzadas de la misma así como mecanismos de búsqueda facetadas. Publicar La publicación debe ser simple, bien estructurada y que aporte toda la información necesaria.
data.gov.uk • Gobierno Estados Unidos: data.gov • Unión europea: data.europa.eu • Gobierno de Australia: data.gov.au • Gobierno de España: datos.gob.es • Banco Mundial: data.worldbank.org • FAO Stats: fao.org/faostat
datos son un conjunto de reglas que definen la forma en la que se almacenan y definen los datos. • Al hacer públicas dichas reglas se posibilita que todas las personas puedan conocerlas y con ello usarlas. Si se da un proceso global, puede que dicho formato de datos se estandarice al expandirse y afianzarse su uso. • Los formatos de datos hacen referencia a los tipos de ficheros de datos en el que se almacenan. No se está haciendo referencia en ningún caso a las bases de datos. • Son normalmente formatos de tipo texto, legibles por cualquier software de edición de texto pero a veces mejor procesado con software específico para facilitar su comprensión.
los últimos años • Desarrollado por Microsoft para su software de hojas de cálculo Excel • Distribución en formato tabla bidimensional • Permite guardar código y estilos además de datos • La popularidad de las hojas de cálculo han hecho tremendamente popular este formato • No es recomendable su uso por ser privativo
separados por comas (o tabuladores en formato TSV) • Distribución en formato tabla bidimensional • Alternativa abierta al formato XLS • Solo permite almacenar datos • Amplio uso en el almacenamiento de datos • Suele llevar una primera fila de definición de campos (cabecera)
de marcado ampliamente usado • Permite jerarquías o niveles de profundidad (estructura arbórea) • xHTML está basado en XML • Se considera tanto human-readable como machine-readable • Se basa en etiquetas (apertura y cierre) completamente configurables • Puede contener o estar basado en una gramática en formato DTD • Estándar abierto de la W3C (Consorcio de la World Wide Web)
es el lenguaje de la web • El uso masivo de Javascript ha popularizado este formato • Se basa en {clave: valor} • Permite jerarquías o niveles de profundidad (estructura arbórea) • Bajo coste de almacenamiento (en comparación con XML) • Estándar abierto
Basado en JSON • Permite definir una serie de características geográficas • Además permite almacenar elementos no geográficos como puntos y polígonos • Estándar abierto
un modelo de intercambio de datos en la Web • Extiende el sistema relacional de la Web, usando URIs para nombrar las relaciones entre elementos (y sus elementos en sí) • Modelo de tripletas • Diferentes serializaciones: Turtle, RDF/XML, JSON-LD, RDFa • Estándar abierto
Sector Público (2003/98/EC). • Ley 19/2013, de 9 de diciembre, de Transparencia, Acceso a la Información Pública y Buen Gobierno. Gobierno de España. • Leyes autonómicas de transparencia y reutilización de información. ◦ Andalucía (1/2014 de 24 de junio)) ◦ Comunitat Valenciana (2/2015 de 2 de abril) ◦ y otras • Ordenanzas municipales de transparencia.
• Conjunto de funciones y definiciones sobre un protocolo • Permite de forma relativamente sencilla integrar datos de unas aplicaciones en otras permitiendo así obtener unos niveles bastante altos de interoperabilidad entre sistemas • Puede tener mecanismos de autenticación y versionado
REST API son las más populares dentro de los diversos tipos de API que existen, o al menos las más comunes en servicios digitales existentes por su facilidad de uso • Se basan en el protocolo HTTP usado en la Web para ofrecer documentos con hipertexto (HTML) • Consta de una serie de puntos de acceso para los diferentes métodos • Ej.: curl https://api.github.com/search/repositories?q=ckan
refiere a la inclusión de etiquetas RDF en atributos de los elementos HTML • Muy usado para introducir metadatos semánticos en la Web • Otra alternativa: Microdata
la interoperabilidad entre catálogos de datos publicados en la Web • Básicamente su misión es describir conjunto de datos • Esto promueve el descubrimiento y facilita que las aplicaciones consuman metadatos de diversos catálogos de datos de forma automatizada • Basado en XML • Respaldado por el W3C • Está ampliamente extendido en los portales de datos • Ejemplos de uso en www.w3.org/TR/vocab-dcat/#basic-example