Mit 7 Mio. Produkten verwaltet die Shopping24 GmbH den größten Datenbestand im Bereich Mode & Wohnen in Deutschland. Für ihre Long-Tail-Produktsuchen und angebundenen Kooperationspartner werden die Produktdaten gezielt produziert. Sie werden über eine API oder als individualisierte Datenfeeds zur Verfügung gestellt. Beim Architekturschnitt waren schnelle Durchlaufzeiten und eine Elastizität der ETL-Prozesse wesentliche Kriterien. Der Vortrag zeigt die wesentlichen Erfolgsfaktoren des Architekturentwurfs, z.B. uniforme, atomar geschnittene ETLProzesse, uniforme Java/Spring/Tomcat-Architektur, ein kanonisches Datenmodell sowie die klare Trennung von Datenbanken mit unterschiedlichem fachlichen Anreicherungsstand. Der Vortrag zeigt auch, wie das Einziehen einer neuen Technologie wie MongoDb oder Hadoop alleine der Fachlichkeit nicht zuträglich ist.