hierba en el campo.y todo lo que comen es procesado y desechado en forma de heces. Dichas heces son depositadas en el campo, el cuál las utiliza como nutriente para generar más hierba y por ello generar más alimento para las vacas. Las aplicaciones informáticas consumen datos para su funcioamiento y al final generan más datos que serán consumidos por ellas mismas o por otras apliaciones para generar más datos.
reutilizados y redistribuidos libremente por cualquier persona. Hay diversas variaciones de la definición en relación con el concepto de libertad, dependiendo de quién sea el encargado de recopilar, de almacenar y de publicar los datos.
publicos con un valor incalculable. Es por ello que para el beneficio de todos (administraciones, ciudadanía, empresas) éstos deberían ser liberados. Además deberían serlo por una cuestión tan básica como identificar quién es el dueño o con qué fondos se han producido.
(transparencia y participación) • Mayor eficiencia de las administraciones públicas • Investigación e innovación • Generación de una nueva economía • Nuevo conocimiento mezclando datos • ...
dato es la forma en la que se encapsulan los mismos. • Se definen una serie de reglas conocidas por todos de forma que hacen que se estandarice y se expanda su uso. • No nos referimos a las bases de datos. • Son normalmente formatos de tipo texto.
Desarrollado por Microsoft para su software de hojas de cálculo Excel • Distribución en formato tabla bidimensional • La popularidad de las hojas de cálculo han hecho tremendamente popular este formato • No es recomendable su uso por ser privativo
de valores separados por comas (tabuladores) • Distribución en formato tabla bidimensional • Alternativa abierta al formato XLS • Amplio uso en el almacenamiento de datos • Suele llevar una primera fila de definición de campos
de marcado ampliamente usado • Permite jerarquías o niveles de profundidad • xHTML está basado en XML • Se considera human-readable como machine-readable • Se basa en etiquetas (apertura y cierre) completamente configurables • Puede contener o estar basado en una gramática en formato DTD • Estándar abierto
es el lenguaje de la web • El uso masivo de Javascript ha popularizado este formato • Se basa en {clave: valor} • Permite jerarquías o niveles de profundidad • Bajo coste de capacidad (en comparación con XML) • Estándar abierto
un modelo de intercambio de datos en la Web. • Extiende el sistema relacional de la Web, usando URIs para nombrar las relaciones entre elementos (y sus elementos en sí). • Modelo de tripletas. • Diferentes serializaciones: Turtle, RDF/XML, JSON-LD, RDFa. • Estándar abierto
de funciones, definiciones y protocolos. • Permite de forma relativamente sencilla integrar datos de unas aplicaciones en otras, facilitando así la consecución de unos niveles altos de interoperabilidad entre sistemas. • Puede disponer mecanismos de autenticación y versionado.
son las más populares dentro de los diversos tipos de API que existen (o al menos las más comunes en la web) por su facilidad de uso. • Se basan en el protocolo HTTP usado en la Web para proporcionar documentos hipertextuales. • Consta de una serie de puntos de acceso para los diferentes métodos. • Ej.: curl https://api.github.com/search/repositories?q=ckan
datos abiertos (como en general en la Web) nos encontramos con datos o información que no proporcionan niveles altos de cumplimiento de las especificaciones de datos abiertos. Por desgracia esta práctica es muy común en los portales de datos abiertos como mecanismo aglutinador de enlaces a otras webs en donde ya se encontraba dicha información que se pretende liberar. Para rescatar esa información tenemos que hacer uso de una técnica artesanal como es la del WebScraping.
para extraer datos/información de páginas web. • Se genera un automatismo que permite de forma autónoma recopilar una serie de elementos que cumplen un determinado patrón. • Usaremos Python como lenguaje de programación ya que es muy fácil manejar HTML en dicho lenguaje. • Hay librerías muy potentes como por ejemplo Scrapy pero por su sencillez y potencial educativo usaremos BeautifulSoup.