ARCHIV 1999-2006

ARCHIV :: # 2453

G5-Cluster in Ton und Bild

British Windows Media Corporation und Schwachsinn auf Slashdot

Autor: kai - Datum: 13.10.2003

BBC World hat einen Bericht über den G5-Cluster in Virginia gebracht (Artikel hier (ACHTUNG CAMINO-USER! Nicht klicken, sonst muss man Camino-Task abschiessen weil er hängt!)). Schönen Dank an Leser Mickel für den Video-Link in einem auf dem Mac betrachtbaren Format! Dank auch an die BBC dafür, dass sie nicht nur Windows Media-exklusiv ist sondern auch noch sinnigerweise WM8 mit WM9-Audiospur einsetzt, so dass es auf dem Mac weder mit VLC, Mplayer noch mit (igitt) Windows Mediaplayer mit Sound funktioniert! Hierfür ein Nixchecker-Sonderaward.
Der Bericht ist recht interessant, beinhaltet aber nichts, was der interessierte Mac-Fan nicht schon wüsste.

Das findet Slashdot scheinbar nicht, und hat prompt daraus eine reisserische und in weiten Teilen komplett falsche Meldung gemacht, dass der Cluster real 17.6 TFLOPS erreichen und somit auf Platz 2 kommen würde.
Erstens ist 17.6 TFLOPS das ganz klar der theoretische Rpeak-Wert, den wir hier schon vor nem Monat ausgerechnet hatten. Realwert (welchen Slashdot im Vergleich zu Platz 3 zitiert) ist Rmax, welcher durch Linpack ermittelt wird. Und darüber wissen wir leider immer noch gar nix!
Zweitens waren zur Deadline am 1.Oktober wohl nicht die Linpack-Werte einzureichen sondern nur der Cluster und seine Spezifikationen per se, damit er überhaupt in der Top500 berücksichtigt wird. Linpack selbst kann wohl soweit ich das herausfinden konnte bis kurz vor der Supercomputer Conference Mitte November gefahren werden, denn die Linpack-Scores müssen extra geschickt werden und sind nicht explizit unter den Anforderungen für "Submissions" gelistet.
Drittens sind Apple nicht die einzigen, die Supercomputer bauen und somit auch nicht die einzigen, die Mitte November neu einsteigen. Selbst wenn wir nur Rpeak vergleichen und der "Big Mac" (inoffizieller Name von Virginia Tech für den Cluster) in der momentanen Liste somit auf Platz 3 landen würde: IBMs ASCI Purple z.B. wird sich definitiv davorsetzen, falls IBM die erste Ausbaustufe wie geplant dieses Jahr geschafft hat. Ich würde sagen wenn das Ding in die Top5 kommt können wir schon sehr zufrieden sein, denn OS X ist im Vergleich zu den anderen verwendeten Unices ein absoluter Newcomer und kann somit auch noch nicht so wie diese auf maximale Supercomputer-Performance optimiert sein. Die extrem kurze Zeit erlaubte auch keine so grossartigen Optimierungen von Apple..
Wo Slashdot bei der BBC irgendwo Real-Streams entdeckt haben will ist fraglich, werden wir wohl auch nie herausfinden, denn der Link ist auch noch falsch.

Update: Sogar Heise plappert jetzt ohne zu prüfen den Slashdot-Unsinn nach! Sehr schwach, Recherche 6! "Der Supercomputer erzielte beim Linpack Benchmark einen Wert von 17,6 TFlops" Soso, Heise, von Linpack steht aber nichts bei der BBC! Nur auf Slashdot, das ihr allerdings natürlich mit keinem Wort erwähnt! Aber selbst bei Slashdot steht nur "Assuming the performance figure accurately reflects the LINPACK score", was bei euch plötzlich zum Faktum mutiert! Aber zu Heises Glück haben wir ja schon das Deutschland-Monopol auf schlechten Journalismus inne! ;-)

Kommentare

rmp stream

Von: mattin | Datum: 13.10.2003 | #1
meinten die den hier? [Link]

Noch eine Ungereimtheit im BBC-Artikel

Von: Rüdiger Goetz | Datum: 13.10.2003 | #2
Hallo,

Aus dem BBC-Artikel:


> Arguably Virginia Tech has revolutionized the world of
> Supercomputing with a simplistic setup that can be
> duplicated around the globe by other institutions.

Ehm, solche Cluster gabs schon vorher, selbst mit Macs (da war mal weas mit PowerMAc G4 ich gleub in Spanien) und unter Linux ist dies mittlerweile ein "alter Hut" (z.B. die diversen Beowurlf-Cluster.

Mag sein, dass die alle nicht diese Pertormance erreichen (was noch zu beweisen wäre), aber Cluster mit min. 500 Linux-PC gab nun wirklich schon vorher und werden auch in den Top-500 gelistet.

Was aber bei dem "Hype" um Cluster übersehen wird, ncith alle Probleme lassen sich gut in kleine und weitgehend unabhängige Tasks zerlegen. Aber nur dann kann eine Cluster seine Performance ausspielen.
Anderfalls warten die einzelnen Rechner im wesentlich darauf aktualsierte Daten von anderen zu bekommen.

In solchen Fällen sind Hochleistungs-CPUs (egal ob Vector-CPU oder nicht) und SMP-Systeme und auch NUMA-Systeme besser geeignet, aber eben auch teuerer.

Bis dann

R"udiger

Also wenn der G5...

Von: Kai (MacGuardians) | Datum: 13.10.2003 | #3
..kein "Hochleistungs-Chip" ist, dann weiss ich nicht was! ;-)

Im übrigen soll Infiniband schon fast die Latenz von SGIs ccNUMA-Systemen erreichen, Thyl hat da mal was kommentiert, 150ns oder so.. Das wär schon extrem gut!

P.S.: Update!

Hochleistungs-CPU

Von: Rüdiger Goetz | Datum: 13.10.2003 | #4
Hallo,

Ich dachte da eher, an CPUS der POWER4/5-Kategorie, die neuen wohl nie mehr gebauten Alpha-CPUs und aufwärts! CPUs, wie sie dann nur in SuperComputern verbaut werden. Zum Beispiel eben Vector-CPUs.

Bis dann

R"udiger Goetz

@R"udiger

Von: AppleKing | Datum: 13.10.2003 | #5
Hmm nochmal zum mitschreiben, der PPC970 ist ein POWER4 mit abgespecktem Kern und dafür mit Altivec.. Das einzige was der POWER4 kann ist das man bis zu 4 CPU-Kerne zusammensteckt und das als eine CPU ansieht.. Ergo wenn der G5 kein Hochleistungschip ist, dann weiss ich auch nicht.. Er hat übrigens auch einige nette Funktionen, wie das Wurzelziehen.

bald ist es sowieso vorbei mit hochleistungschips

Von: mattin | Datum: 13.10.2003 | #6
[Link] bald ist es sowieso vorbei mit hochleistungschips :))

Wieso???

Von: Käpt'n Kabelbruch | Datum: 13.10.2003 | #7
es wird immer eine Steigerung geben. Allerdings glaube ich auch, dass die Transistordichte irgendwann nicht mehr weiter zu steigern ist. Das wäre doch mal DIE Gelegenheit für Intel, dem Golf unter den Prozessoren einen FSI-Motor zu spendieren. Dasselbe gilt natürlich auch für AMD: Russpartikelfilter für den Astra Diesel!!!

Euer Dodge-Viper-like-Prozessorfreund

@AppleKing

Von: Rüdiger Goetz | Datum: 13.10.2003 | #8
Hallo,

Ich weiss und ich hab mich noch mal in den top-500 umgeguckt.

1. Der PPC 970 ist ein in einigen wesentlichen Punkten kastiriert (z.B. weniger Cache siehe auch eine der letzten c'ts). Deshalb sind die SPEC-Werte des Power4 und vor allem des Power4+ auch ein gutes Stück besser. Und der Power5 wird noch mal ne Menge zulegen. Und AltiVec (wie auch ISSE1) bringt sehr wenig an dieser Stelle (keine double precision)

2. Du hast insofern recht, als nahezu alle Firmen offenbar die Entwicklung von Hochleistunsg-CPUs, die 2-x mal schneller sind als Desktop-CPUs eingestellt haben. Vermutlich weil sich mit Desktop-CPUs billige Cluster bauen lassen, die in vielen Fällen eine ähnlich Performance bringen.

3. Ich bleibe dabei, das es eine Reihe von Anwendungen gibt, in denen Cluster ungünstig sind und Maschinen mit weniger CPUS, die aber entsprechend schneller und auch durch schnell Bus-artige-Connections verbunden sind, besser sind.
Scheinbar sind die Kosten für solche System im vergleich zu Cluster aber mittlerweile zu hoch, als das es dafür noch einen Markt gäbe.

4. @Kai. Latenzen sind beim Verschalten von CPUs nicht alles. Wenn z.B. in einer Molekulardynamik-Simulation pro simultiertyem Zeitschritt einige zig MByte durch die Gegend schaufeln musst, ist es besser diese gleich in einem Speicher zu haben (MMP-Systeme) oder wenigstens mit hohen Bandbreiten angebunden zu haben.

Bis dann

R"udiger

Und noch eines, der Power 4 hat schon einige Jahre auf dem Buckel. Nach ca. 1-2 Jahren holen die Desktop-CPUs typischerweise die Workstation-CPUs ein. Wenn man die Entwicklung (die ja immer in gewissen Schüben erfolgt) "ausmittelt" bleibt ein Vorsprung der Workstation/Server-CPUs bestehen.

Und darüber gab es ja noch CPUs, die speziell für MMP-Systems und Supercomputer gebaut werden.

@Rüdiger 3.

Von: Thyl | Datum: 13.10.2003 | #9
Glaube ich nicht. Der Earth-Simulator verwendet Vektor-CPUs, die neuen Crays, soweit ich weiss auch, und geradde habe ich ein Buch über die NSA gelesen, demzufolge dort nach einer längeren Phase mit Cray und Konsorten wieder eigene Chips entwickelt werden. Also, es gibt noch immer CPUs in dieser Klasse, und der Bedarf (von Leuten, die auch zahlen können) war nie besonders groß.

GROASARTIG!

Von: AppleKing | Datum: 13.10.2003 | #10
R"udiger ist mein Held! Danke für die ausführliche und fundierte Erklärung!

BBC Bericht sagt nix über

Von: Michael | Datum: 13.10.2003 | #11
die FP leistung aus. Zumindest nichts gemessenes. Wenn ich das richtig verstanden habe, dann wird diese Leistung maximal erwartet.

Habe noch nirgends von realen Meßwerten gelesen!

Aber warten wirs ab, es ist halt gut für Apple, wenn überhaupt ein Supercomputer mit Ihren Rechnern realisiert wird. Und es wäre noch besser, wenn er sich unter die Top 500 qualifizieren würde (Top10 wäre Mega!).

Das gibt halt gute Publicity, ist nichts neues an sich, aber für Apple schon!!

Michael

Noch mal top[500

Von: Rüdiger Goetz | Datum: 13.10.2003 | #12
Hallo,

Eines spricht aber für apple, bzw. IBM. Wenn ich richtig gezählt habe, wäre der G5-Cluster unter den
top 5 der mit den wenigsten CPUs, nämlich 2200. Alle anderen haben zum Teil deutlich mehr, ausser dem Linux-Xeon-Cluster mit 2304CPUs. Anderseits sind die CPUs in den anderen Cluster (ausser beim alles in den Schatten stellenden Earth Simulator) schon etwas in die Jahre gekommen. Hier wird ja gerade von IBM auch neues erwartet.

@Thyl. O.K. NEC baut für den Earth-Simulator noch spezielle CPUs. Aber alle anderen an der Spitze der Top500 scheinen Cluster oder MMP-Systeme mit "Standard-CPUs" zu sein.
Mag sein, dass da wieder was ganz an der Spizte nachkommt, die Klasse zwischen Vektor-CPU u.ä. einserseits und Desktop-CPU anderseits scheint aber so anch und nach auszusterben. Der Alpha wird eingestellt, HPPA auch. MIPS hat den Anschluss verloren. Itanium kommt nicht in die Huffe. Einzig IBM scheint mit dem Power5 nachzulegen.

Letztlich ist das aber für uns alle von Nachteil, da all die schicken Techniken, die heute Desktop-CPUs schnell machen (Pipelining bei vektor-CPUs abgeguckt, HyperThreading, gabs wohl vorher schon bei Alpha, wenn ncith noch woanders. schnelle große Cache-Interfaces bei MIPS, HPPA und anderen, gute FPUs: IBM Power, MIPS, HPPA, etc., Registerrenaming, von SPARC, Diese Aufzählung soll weder vollständig noch immer den ersten nennen, sondern den, frühsten von dem ich weiss.).
Wenn diese CPU-Klassen aussterben, wer treibt dann die CPU-Entwicklung noch an? Intel?
Intel war in den letzten Jahren wirklich gut im Übernehmen und f[r den Desktopmarkt Verfügbarmachen, vom im HighEnd-Markt etablierten Technologien. Aber echt neues haben sie nur mit EPIC beim Itnaium und da läufts nicht so. Also woher sollen die Ideen kommen und wo sollen sie ausprobiert werden, wenn nciht bei den sher teuren aber eben acuh schnelleren Workstation- (und höher) -CPUs.

@AppleKing: War das jetzt ironisch?

Bis dann

R"udiger

Und noch einmal tp500

Von: Rüdiger Goetz | Datum: 13.10.2003 | #13
Hallo,

Für alle die mal selbst in den Top500 schmöckern wolln, hier der Link zu www.top500.org und zur aktuellen Top500-Liste selbst.

Bis dann

R"udiger

Und ein DELL Cluster kostet 38M$

Von: Terrania | Datum: 14.10.2003 | #14
Und ist immer noch nicht schnell genug:
[Link]

Einfach mal schauen ...

Aaarrrghh!!!

Von: Kai (MacGuardians) | Datum: 14.10.2003 | #15
"Compare that to Virginia Tech's $5.2M Apple/Mac OS X cluster that achieves 17.6 Tflops,"

AAaaah!!! Amoklauf!!! Slashdot-Quatsch erobert die Welt!

Korrektur: Dave Schroeder Schwachsinn erobert die Welt!

Von: Kai (MacGuardians) | Datum: 14.10.2003 | #16
MacNN und Slashdot ist beides vom selben ahnunglosen Helden!

die schwachmaten krone hat aber wieder mal..

Von: mattin | Datum: 14.10.2003 | #17
der spiegel inne: [Link]