Implementierungen Sun (Rainbow Falls aka Niagara 3), Fujitsu SPARC64, IBM Power7, Intel (Nehalem-EX), AMD (Magny-Cours) Technologien für die nächsten zwei Jahre Wohin fährt der Zug? Agenda 2010-04-21 3 / 26
IT) machen jetzt alle Special Purpose CPUs, GPGPUs traut sich keiner in großem Stil weiterhin höhere Integration kleinere Strukturen, mehr Funktion im Microcode (z. B. Dezimal-Unit in IBM Power oder Crypto-Units in Sun Oracle Niagara) Wie gut war die Kristallkugel? 2010-04-21 4 / 26
Implementierungen Sun (Rainbow Falls aka Niagara 3), Fujitsu SPARC64, IBM Power7, Intel (Nehalem-EX), AMD (Magny-Cours) Technologien für die nächsten zwei Jahre Wohin fährt der Zug? Agenda 2010-04-21 5 / 26
256 threads/sockets (!) Fläche ~ T2+, aber ca. 30% mehr Wärme → clock speed? verbesserte Crypto und Floating Point Unit „balanced distribution of hot spots“ → gleichmäßige Erwärmung „glueless node-to-node interconnect“ → # interfaces 2010-04-21 7 / 26
Transistoren zu VII, aber nur 1/3 Wärme Erweiterungen für HPC Labor: 128 GFLOPS/socket TOP500 3. Platz in 1995 Ziel: HPC bis 10 PetaFLOPS TOP500 1. Platz: ~6 PetaFLOPS HPC-Systeme mit eigenem 3D Torus (> 100.000 nodes) Venus in Oracle-Systemen → ?? 2010-04-21 10 / 26
2 „tightly linked“ Cores teilen sich Ressourcen → Erweiterungen im Power Management → 32nm SOI mit „high-k metal gate“ „Bobcat“ → low-power, < 1W soll möglich sein → „90% of today‘s mainstream performance in less than half of the silicon area“ → 2011, überwiegend in Notebooks und mobile devices 2010-04-21 20 / 26
Implementierungen Sun (Rainbow Falls aka Niagara 3), Fujitsu SPARC64, IBM Power7, Intel (Nehalem-EX), AMD (Magny-Cours) Technologien für die nächsten zwei Jahre Wohin fährt der Zug? Agenda 2010-04-21 21 / 26
→ weniger „Hitzedichte“ kleinere Strukturen, 22nm voraussichtlich in 2011 niedrigere Core-Spannungen → durch chemische Prozesse bei Halbleiterherstellung → „dynamische“ Stromaufnahme abhängig von Last, bis zu 800% verbesserter Wirkungsgrad Signal-Noise-Ratio wird bei kleiner Core-Spannung schlechter → „resilient“ circuits kleinere Netzteile/Akkus, Abfangen von Lastspitzen mit Super Caps → jetzt 65W max auf ca. 12...13W möglich 2010-04-21 23 / 26
Betriebssystem / Applikation muss Multicore und Manycore unterstützen. Cloud braucht viele billige, einheitliche Systeme/CPUs. Performance über Parallelität ähnlich HPC. Virtualisierung wird umfangreicher unterstützt werden (müssen). Immer kleinere Strukturgrößen lassen mehr und mehr Funktionen direkt auf dem Die zu. Mobile Devices und Industrieanwendungen verlangen nach leistungsfähigen, strom- und platzsparenden CPUs. 2010-04-21 24 / 26
http://www.ibm.com/developerworks/blogs/page/powerarchitecture Ars Technica Jon Stokes http://www.arstechnica.com/ The Register Ashlee Vance u. Timothy Prickett Morgan http://www.theregister.co.uk/ Wikipedia http://en.wikipedia.org/ Quellen 2010-04-21 25 / 26