Upgrade to Pro — share decks privately, control downloads, hide ads and more …

NYPL Labs - Semana del Libro Digital

NYPL Labs - Semana del Libro Digital

Presentación de tres proyectos de NYPL Labs en la Segunda Semana del Libro Digital de la Biblioteca Nacional de Colombia

7aff8f547184534da3ca2e14e63a68a8?s=128

Mauricio Giraldo

November 14, 2014
Tweet

Transcript

  1. mauricio giraldo arteaga @mgiraldo NYPL Labs

  2. None
  3. hola

  4. mi nombre es mauricio

  5. None
  6. sistema de bibliotecas de investigación y circulación que sirve a

    Manhattan, Bronx y Staten Island en New York
  7. None
  8. None
  9. None
  10. None
  11. None
  12. None
  13. NYPL Labs

  14. None
  15. None
  16. None
  17. voy a hablar de tres proyectos

  18. What’s on the menu? Stereogranimator Building Inspector

  19. What’s on the menu? menus.nypl.org

  20. None
  21. None
  22. None
  23. None
  24. None
  25. 40,000+ menús ! OCR no funciona ! información estructurada

  26. None
  27. None
  28. 17,000+ menús 1,300,000+ platos

  29. None
  30. None
  31. None
  32. curatingmenus.org de @katie_rawson y @trevormunoz

  33. Stereogranimator stereo.nypl.org

  34. None
  35. 40,000+

  36. None
  37. None
  38. None
  39. None
  40. None
  41. None
  42. None
  43. None
  44. ¿se podrá hacer en el navegador?

  45. ¿se podrá hacer en el navegador?

  46. None
  47. prototipo

  48. None
  49. None
  50. (los sistemas de control de versiones son clave)

  51. None
  52. None
  53. None
  54. None
  55. ¿podrían crearse anaglifos?

  56. None
  57. None
  58. None
  59. None
  60. ¿cómo explorar 40k+ fotos?

  61. None
  62. None
  63. 20,000 imágenes “remezcladas” en 72 horas ! 96,000 visitantes únicos

    ahora incluye fotos de la Biblioteca Pública de Boston y Flickr
  64. Building Inspector buildinginspector.nypl.org

  65. La Gran Migración de Geodatos

  66. una aventura en tres actos y un prólogo y un

    epílogo
  67. prólogo

  68. The Lionel Pincus and Princess Firyal Map Division

  69. None
  70. None
  71. None
  72. None
  73. None
  74. None
  75. 500,000+ mapas 20,000+ libros & atlas

  76. None
  77. None
  78. None
  79. None
  80. None
  81. año

  82. calles año

  83. uso calles año

  84. uso calles nombre año

  85. material uso calles nombre año

  86. material uso calles nombre clase año

  87. material uso calles dirección nombre clase año

  88. material uso calles dirección pisos nombre clase año

  89. material uso calles dirección pisos nombre clase año claraboyas

  90. material uso calles dirección pisos nombre clase año claraboyas jardines

  91. material uso calles dirección pisos nombre clase ubicación año claraboyas

    jardines
  92. planta material uso calles dirección pisos nombre clase ubicación año

    claraboyas jardines
  93. planta material uso calles dirección pisos nombre clase ubicación año

    claraboyas jardines
  94. para varias décadas desde los 1800s para 1950, toda ciudad

    en los EEUU con más de 2,000 habitantes había sido levantada
  95. datos atrapados en un formato antiguo

  96. queremos todos los datos

  97. ¿pero, para qué?

  98. citysdk.waag.org/buildings

  99. citysdk.waag.org/buildings

  100. NYU Stern / Imaginaria3D

  101. NYU Stern / Imaginaria3D

  102. maps.google.com

  103. maps.google.com

  104. None
  105. datos

  106. todo empieza con una fotografía

  107. None
  108. pero es “solamente una foto” pero que está a un

    clic de distancia
  109. None
  110. queremos todos los datos

  111. geo-referenciación o: “que cuadre en Google Maps”

  112. None
  113. None
  114. *esto es una simulación. el proceso real es complejo. consulte

    su matemático de confianza.
  115. None
  116. None
  117. vectorización o: “dibuje las plantas de los edificios”

  118. None
  119. None
  120. maps.nypl.org/warper

  121. None
  122. None
  123. datos hechos a mano, artesanales, localmente producidos

  124. 500,000+ mapas 20,000+ libros & atlas

  125. 500,000+ mapas 20,000+ libros & atlas* *imagine cuántas páginas tiene

    un atlas
  126. en el orden de docenas de millones de plantas si

    solo contamos New York
  127. None
  128. ~120k plantas producidas en tres años por empleados y voluntarios

    y esto solo para Manhattan y Queens en 1953
  129. None
  130. va a tomar una eternidad primero va a estar terminado

    el Metro de Bogotá
  131. tiene que haber una mejor manera

  132. acto i: háganse los polígonos

  133. no encontramos apoyo de empresas privadas

  134. None
  135. ¿podemos automatizarlo?

  136. None
  137. ¿qué? @mgiraldo

  138. None
  139. None
  140. None
  141. None
  142. github.com/NYPL/map-vectorizer

  143. None
  144. None
  145. None
  146. None
  147. esto es suficientemente bueno para NYPL

  148. None
  149. None
  150. None
  151. None
  152. None
  153. 66,056 plantas producidas en un día para un atlas de

    Manhattan de 1859
  154. acto ii: el vectorizador se pone a prueba

  155. None
  156. None
  157. None
  158. None
  159. None
  160. None
  161. múltiples inspecciones para cada ítem y dejar que el consenso

    surja por sí mismo
  162. validación de plantas o: “díganos si el vectorizador hizo bien

    su trabajo“
  163. ¿será que a alguien le interesa verificar polígonos? atlas de

    aseguradoras no son los más interesantes
  164. None
  165. buildinginspector.nypl.org

  166. github.com/NYPL/building-inspector

  167. None
  168. None
  169. None
  170. None
  171. un mes después…

  172. None
  173. None
  174. None
  175. None
  176. 420k+ clasificaciones* 70k+ polígonos ! consenso: ~84% SI, 7% AJUSTAR,

    9% NO *una “clasificación” es un SI/NO/AJUSTAR por una persona para un polígono
  177. al parecer si están dispuestos… nosotros — a los inspectores

  178. al parecer si están dispuestos… nosotros — a los inspectores

  179. act iii: el regreso del inspector

  180. planta material uso calles dirección pisos name clase ubicación año

    claraboyas jardines
  181. divide y vencerás

  182. planta material uso calles dirección pisos name clase ubicación año

    claraboyas jardines
  183. None
  184. tres nuevas tareas por ahora… en realidad queremos t-o-d-o

  185. planta material uso calles dirección pisos name clase ubicación año

    claraboyas jardines
  186. chequeo

  187. chequeo SI

  188. chequeo SI dirección color

  189. chequeo SI AJUSTAR dirección color

  190. chequeo SI AJUSTAR dirección color ajustar

  191. chequeo SI AJUSTAR dirección color ajustar

  192. chequeo SI AJUSTAR dirección color ajustar *plantas marcadas como “NO”

    van al cielo
  193. chequeo SI AJUSTAR dirección color ajustar *plantas marcadas como “NO”

    van al cielo
  194. ajustar

  195. ajustar

  196. dirección

  197. dirección

  198. color

  199. color

  200. 865k+ clasificaciones por persona: promedio 600 — media 100

  201. chequeo SI AJUSTAR dirección color ajustar

  202. chequeo SI AJUSTAR dirección color ajustar para 80k+ polígonos 77k+

    5k+ 42k+ 26k+
  203. epílogo

  204. consenso de dirección y formas o: ¿cómo saber si quedó

    bien dibujado?
  205. bit.ly/nypl-consensus

  206. consenso de dirección

  207. None
  208. None
  209. None
  210. None
  211. None
  212. None
  213. None
  214. None
  215. ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡

  216. ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡

  217. ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡

    ﹡ + +
  218. 246 246 246 414 246 414 414 246 414 414

    414 ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ + +
  219. 246 246 246 414 246 414 414 246 414 414

    414 ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ + +
  220. 246 414 + +

  221. None
  222. None
  223. consenso de forma

  224. None
  225. None
  226. None
  227. None
  228. None
  229. None
  230. None
  231. ﹡ ﹡

  232. ﹡ ﹡ ﹡

  233. ﹡ ﹡ ﹡ ﹡

  234. ﹡ ﹡ ﹡

  235. ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡

    ﹡ ﹡ ﹡ ﹡ ﹡
  236. ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡ ﹡

    ﹡ ﹡ ﹡ ﹡ ﹡
  237. + + + + + + +

  238. + + + + + + +

  239. + + + + + + +

  240. + + + + + + +

  241. + + + + + + +

  242. + + + + + + +

  243. + + + + + + +

  244. + + + + + + +

  245. None
  246. None
  247. None
  248. None
  249. None
  250. None
  251. None
  252. los datos se pueden bajar

  253. los datos se pueden bajar en GeoJSON 100% reciclable

  254. None
  255. None
  256. fotografía

  257. fotografía ↓

  258. fotografía ↓ geo-referenciación

  259. fotografía ↓ geo-referenciación ↓

  260. fotografía ↓ geo-referenciación ↓ vectorización

  261. fotografía ↓ geo-referenciación ↓ vectorización ↓

  262. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección

  263. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓

  264. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓ chequeo /

    ajuste / color / dirección
  265. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓ chequeo /

    ajuste / color / dirección ↓
  266. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓ chequeo /

    ajuste / color / dirección ↓ consenso
  267. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓ chequeo /

    ajuste / color / dirección ↓ consenso ↓
  268. fotografía ↓ geo-referenciación ↓ vectorización ↓ inspección ↓ chequeo /

    ajuste / color / dirección ↓ consenso ↓ publicación de datos
  269. no es el fin

  270. None
  271. menus.nypl.org stereo.nypl.org buildinginspector.nypl.org

  272. mauricio giraldo arteaga @mgiraldo NYPL Labs diapositivas en: bit.ly/nypl-bnc imágenes

    de: NYPL digital collections - Wikimedia Commons
 Christopher Cannon - Flickr user wallyg Giphy - J.R. Eyerman gracias