= zu groß für übliche Datenverarbeitung • z.B. Common Crawl: ca. 150 TB pro Monat • Data Science = Mathematik, Statistik + Informatik, Hacking Skills + Domänenwissen • Kann/soll hierbei die Bibliothek unterstützen? Sind dies unsere typischen Benutzer? Bibliothek …
computergestützte Verfahren Text-Mining Information Retrieval Bildverarbeitung Informationsextraktion … Bild-Digitalisate Volltexte … Wieviel Infrastruktur soll die Bibliothek hier aufstellen und wann beginnt die Forschungsarbeit? Kooperative Projekte? Bibliothek
psychologische Tests, … Mit welchen Maßnahmen kann die Bibliothek die Forscher bei der „Datenlast“ optimal unterstützen? Bibliothek datenzentriert datenorientiert datenlastig Big Data, Data Science Digital Humanities Fokus hier
(börsennotierte Unternehmen) • Nur gedruckte Bände (bis 2000) • Ab 1956 regelmäßig • Ab 1870 mit Unterbrüchen und unter unterschiedlichen Namen • Adressinformationen, Finanz- und Bilanzzahlen, Vorstand, Aktionäre, Beteiligungen, …
schwierig möglich • Kleine Teile der Daten wurden für die Auswertung in verschiedenen Forschungsprojekten (wiederholt) abgetippt • Mehrfacharbeit • Nur bedingt replizierbare Forschungsergebnisse • gezwungen auf kleiner Stichprobe zu arbeiten • Kann man hier nicht zentral eine Infrastruktur aufbauen?
man die Finanz- und Bilanzdaten der Robert Bosch GmbH für die letzten 5 Jahre? • Um einen Business Plan zu erstellen, benötigen Sie statistische Daten über mobiles Bezahlen. • Wo gibt es statistische Daten zu Beschäftigungsquoten von 55-64 Jährigen in der EU?
• Relationen zwischen Publikationen und Forschungsdaten aufzeigen im Katalog oder Repositorium InFoLiS Projekt Webclip (Bib.Kongress 2016): „Click here for research data“
Ludwig, Jürgen (19. August 1985) https://commons.wikimedia.org/wiki/File:Bundesarchiv_Bild_1 83-1985-0819- 017,_Gotha,_Forschungsbibliothek,_Handschriftenlesesaal.jpg CC-BY-SA 3.0
Washington, Seattle • seit Januar 2015: Data Science Studio (davor Lesesaal) • öffentlicher Raum (ca. 450m2) – für kollaborative Forschung – offene Arbeitsumgebungen – casual seating – kleine ruhige Konferenzräume
your data and your code and get some technical help in data management, predictive analytics, software engineering, or visualization“ • Ansprechpartner: (mit Sprechzeiten) • Incubator (datenlastige Forschungsfragen im Team bearbeiten über 10 Wochen mit Unterstützung) + Community Seminar (wöchentlich) + Workshops
2013): Graph representing the metadata of thousands of archive documents, documenting the social network of hundreds of League of Nations personals. CC-BY- SA. https://commons.wikimedia.org/wiki/File:Social_Network_Analysis_Visualization.png