ARCHIV 1999-2006

ARCHIV :: # 616

Was steckt hinter den GHz-G4s?

Das Geheimnis der neuen PowerMacs (Update)

Autor: kai - Datum: 30.01.2002

Tja, jetzt sind sie da, die neuen PowerMacs! Wie vorausgesagt ohne Firewire2, USB2 oder DDR-RAM (Wahrsagerkugel, kaum gebraucht billig abzugeben!), und trotzdem hat Apple irgendwas gemeines daran gemacht ausser den Takt zu erhöhen und mehr Peripherie reinzupacken! Ach ja, 700 Ä billiger sind sie auch noch geworden, hab ich das schon erwähnt?
Apples Homepage erzählt vollmundig irgendwas von "quantum increase in processing power" und "ultraefficient new system architecture", und selbst wenn man die überschäumenden Marketingversprechen mal aussen vor lässt, so können sie damit nicht einfach nur den um 133 MHz erhöhten Takt meinen!

Was steckt also dahinter? Technisch interessierte Mac-User zerbrechen sich gerade die Köpfe, und es kristallisiert sich immer mehr heraus, daß die Verbesserungen allein auf dem Prozessormodul stattgefunden haben, dort aber nicht schlecht.
(Anmerkung: Das hier ist nichts neues, denn daß GBit-Ethernet und Firewire direkt am Controller hängen war ja vorher schon so!)

Zuallererst müssen wir unseren Blick auf die CPUs richten. Kurz nach der Apple-Pressemeldung hat Motorola ihre Webseite aktualisiert. Dort kann man unschwer erkennen, daß wir es mit dem MPC7455 zu tun haben. Dieser wird zwar endlich in SOI gefertigt, jedoch immer noch im alten 0.18 Mikron-Prozess. Ob das nun wirklich der vielzitierten Apollo ist, weiß nur Motorola selbst, vorher wurde der Apollo jedoch unter der Bezeichnung 7460 gehandelt, und von 0.15 Mikron für den Apollo war auch die Rede!
Was hat Motorola geändert? Zum ersten sieht es so aus, als hätten wir wieder unser MERSI zurück, nachdem der 7450 statt dem MERSI des 7400/7410 nur das für Multiprocessing schlechter geeignete MESI bot (Hallo Intel! ;-). MERSI erlaubt bessere Inter-Chip Kommunikation als MESI und Zugriff der Chips auf die Caches der anderen, außerdem lassen sich mehr als zwei Chips gleichzeitig nutzen (Nicht daß Apple diese Option jemals in Betracht ziehen würde!). Dies ist eine Theorie von mir, die leider noch auf wackeligen Füssen steht, aber das ist das, was ich aus dem "additional enhancement" "Full symmetric multiprocessing (SMP) support" des Motorola Specsheets zum 7455 (und 7545) rauslese!
Die CPU selbst ist intern dieselbe geblieben, gleicher Aufbau, gleiche Anzahl an Units etc. Was verwundert, ist der relativ zu den alten Modellen stark gestiegene Dhrystone 2.1-Wert beim 7445/55, er hat 474 Punkte mehr, als er nach der reinen Taktskalierung gegenüber dem 7450/51 haben sollte! Angesichts der gleichgebliebenen Architektur kann ich mir das nur dadurch erklären, daß dieser Integer-Benchmark vom besseren Cache profitiert!
Kommen wir zum Sahnestückchen, dem L3-Cache: Wie einigen sicher aufgefallen ist, haben wir zwar immer noch 2MB, aus SRAM wurde aber DDR-SDRAM und statt 200MHz Cache-Takt gibt's jetzt 500!
Nun stellen sich folgende Fragen: Warum nicht mehr Cache, wenn dynamisches DDR-RAM doch zigmal billiger ist als statisches RAM? Und warum überhaupt DRAM als Cache, die nötigen Refresh-Zyklen müßten den MHz-Gewinn doch mehr als auffressen? Die Antwort gibt dieses PDF von Motorola: In Kapitel 3.7.9 findet sich der Schlüssel des Geheimnisses, denn bei Apple hat sich wohl schlicht und einfach ein Fehler auf der Homepage und in der Pressemeldung eingeschlichen, denn es handelt sich hier anscheinend nicht um das bekannte DDR-SDRAM sondern um das für Caches neue DDR-SRAM, also Dual Data Rate Statisches RAM (Bei Motorola heisst das "MSUG2 dual data rate SRAM"!)
Tja, und so löst sich das Rätsel der "ultraefficient new system architecture"! Apple hat unterm Strich fast nichts geändert am Gesamtdesign, aber die kleinen ƒnderungen, die sie gemacht haben, werden sich glaube ich heftigst v.a. auf den Multiprozessorbetrieb auswirken (der grob fünfmal so schnelle 3rd Level Cache (500MHz * 2 (Double Data!) = 5 * 200MHz) wird natürlich auch in normalen Anwendungen kräftig reinhauen)! Die Ergebnisse des ersten Tests der MacWelt scheinen diese Theorie zu bestätigen: 40 Sekunden in einem Cinema 4D Testrendering für den alten Dual 800 MHz, 25 (!) Sekunden für den Dual 1GHz! Grob doppelt so schnell bei einem Viertel mehr Takt!
Ich bin jedenfalls höllisch gespannt, wie sich diese Maschine in Tests mit weiteren Multiprozessor-nutzenden Programmen wie Photoshop, AfterFX, Final Cut Pro etc. schlagen wird!
Alles in allem sind die neuen G4 tolle Maschinen, keine Offenbarung, aber doch mehr als wie ursprünglich befürchtet einfach nur mehr MHz, und mit den zu erwartenden Taktsteigerungen in den nächsten Monaten sollte sich erstmal gut leben lassen!

Update 1: Hier gibt's ein paar erste Benchmark-Ergebnisse! 21.8 im Cinebench Raytracing (Multi-CPU) ist ein guter Sprung nach vorne!

Update 2: Der Cache scheint mit den 500 MHz schon das DDR miteinzubeziehen, ist also effektiv nur mit 250 MHz getaktet! Immer noch 2.5 mal so schnell! Ausserdem profitiert Dhrystone wohl nicht vom L3-Cache, sondern passt wie's aussieht komplett in den L1-Cache, somit muss der Grund für den Zugewinn hier ein anderer sein!

Kommentare