| | | Gut zu wissen: Hilfreiche Tipps und Tricks aus der Praxis prägnant, und auf den Punkt gebracht für WORKSTATIONs | | | | Lenovo und Anaconda kündigen Zusammenarbeit im Bereich KI an, eine Pressemitteilung
|
Autor
|
Thema: Schon Erfahrungen mit Hyperthreading (4442 mal gelesen)
|
qdriver79 Mitglied Dipl.-Ing.
Beiträge: 146 Registriert: 20.09.2007
|
erstellt am: 01. Apr. 2010 15:54 <-- editieren / zitieren --> Unities abgeben:
Hallo Forengemeinde! Wie sind denn die Erfahrungen so mit den neuen Xeons (55er und 56er Serie) ? Bisher hab ich die Erfahrung machen müssen, daß bei einigen Tools (CFD) das Hyperthreading eher Nachteile bringt. z.B. 8 Kerne mit Hyperthreading minimal langsamer als 8+8SMT ... Wie sind so die Erfahrungen allgemein mit den neuen Xeons? Habe leider momentan nur beim CFD Tool einen ausreichenden Lizenzstatus, um wirklich mal 8 oder 16 Threads parallel laufen lassen zu können. Würde mich interessieren, wie das bei anderen Sachen so aussieht. Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
RSchulz Moderator² Head of CAD, Content & Collaboration / IT-Manager
Beiträge: 5541 Registriert: 12.04.2007 @Work Lenovo P510 Xeon E5-1630v4 64GB DDR4 Quadro P2000 256GB PCIe SSD 512GB SSD SmarTeam V5-6 R2016 Sp04 CATIA V5-6 R2016 Sp05 E3.Series V2019 Altium Designer/Concord 19 Win 10 Pro x64
|
erstellt am: 01. Apr. 2010 16:20 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Zitat: Original erstellt von qdriver79: Wie sind denn die Erfahrungen so mit den neuen Xeons (55er und 56er Serie) ? Bisher hab ich die Erfahrung machen müssen, daß bei einigen Tools (CFD) das Hyperthreading eher Nachteile bringt. z.B. 8 Kerne mit Hyperthreading minimal langsamer als 8+8SMT ...
Also ich kann eigentlich nur von der Core i7-Serie sprechen, die aber der gleichen Technologie entspricht. Hierbei konnte ich durchweg einen Performancegewinn, wenn auch einen eher geringen, mit aktiviertem Hyperthreading messen. Funktionsweise Hyperthreading Zitat: Original erstellt von qdriver79:
Wie sind so die Erfahrungen allgemein mit den neuen Xeons? Habe leider momentan nur beim CFD Tool einen ausreichenden Lizenzstatus, um wirklich mal 8 oder 16 Threads parallel laufen lassen zu können. Würde mich interessieren, wie das bei anderen Sachen so aussieht.
Soweit ich das weis, beziehen sich derartige Lizenzrichtlininien immer auf CPU´s und nicht auf Threads. Demnach benötigt man, für ein Programm, welches per CPU-lizenziert ist, auch "nur" bei einem Quadcore eine 4Kernlizenz, egal ob bei diesem HT aktiviert ist oder nicht. Alles in allem kann ich sagen, dass die Core i-Reihe in allen Bereichen ziemlich "rockt". ------------------ MFG Rick Schulz Nettiquette (CAD.de) - Was ist die Systeminfo? - Wie man Fragen richtig stellt. - Unities
Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
Leo Laimer Ehrenmitglied V.I.P. h.c. CAD-Dienstleister
Beiträge: 26122 Registriert: 24.11.2002
|
erstellt am: 01. Apr. 2010 16:37 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Habe keine neueren Kenntnisse zu diesem Thema, aber: Die Lizenzierung von Software kann recht unterschiedlich sein. Die meisten Midrange-CAD's die ich kenne vergeben bzw. benötigen eine Lizenz pro PC, also kann man pro Arbeitsplatz die Software beliebig oft starten und Aufgaben erledigen lassen - wenn die Software samt Arbeitsweise damit glücklich wird, was z.B. bei Inventor nur bedingt der Fall ist (könnte bei neueren Windows-versionen besser sein). Beim Rendern im Inventor Studio (und nur genau da) werden aber brav alle verfügbaren CPUs und Cores genutzt, mit ziemlich gut skalierenden Ergebnissen. Ich verwende auch Ansys DesignSpace, und da kann das Programm pro Lizenz strikt nur 1x gestartet werden. ------------------ mfg - Leo Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
qdriver79 Mitglied Dipl.-Ing.
Beiträge: 146 Registriert: 20.09.2007
|
erstellt am: 01. Apr. 2010 20:29 <-- editieren / zitieren --> Unities abgeben:
Wie gesagt, ist sehr unterschiedlich von der Lizenzierung her ... ProMech nutzt alles was da ist, das CFD Tools die wir nutzen sind wirklich pro Thread lizenziert ... Bei Ansys Classic und Workbench ist es soweit ich weiß auch nur so, daß maximal 2 CPU Kerne unterstützt werden ... für mehr braucht man zusätzliche Lizenzoptionen ... Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
pharao68 Mitglied Informatiker
Beiträge: 24 Registriert: 17.08.2006 DELL Precision 490 TcEng 2005 SR1/2007 NX6
|
erstellt am: 27. Apr. 2010 16:41 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Hallo Grundsätzlich ist erst mal der Begriff "Hyper-Threading" zu klären: Gemäss Wikipedia: "Hinter Hyper-Threading oder SMT allgemein steht die Idee, die Rechenwerke eines Prozessors besser auszulasten, indem man die Lücken in der Pipeline mit Befehlen eines anderen Threads möglichst gut auffüllt. Solche Lücken können zum Beispiel entstehen, wenn ein Prozess oder Thread durch einen Cache-Miss auf den Hauptspeicher warten muss. Hier kann dann mittels Hyper-Threading ein zweiter Prozess oder Thread „eingeschoben“ werden und somit parallel laufen." Gemäss Intel soll Hyper-Threading einen Geschwindikeitsvorteil von bis zu 35% bringen. Wie sagt man so schön: wer gut lügen kann, geht in den Verkauf! Wie die Definition erklärt, geht es um parallel ablaufende Prozesse. Werden nun Prozesse eingeschoben, müssen diese erst wieder abgearbeitet werden, bis der vorangehende Prozess wieder drann kommt was zu massiven Wartezeiten führen kann.
Da wir künftig auf Xeon 6-Core CPUs arbeiten werden haben wir uns entschieden Hyper-Threading zu deaktivieren. So wird jeder Prozess auf einem eigenen Core ausgeführt. Grüsse
Patrick PS: Hoffe, konnte etwas zur Verwirrung beitragen.... Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
lumen Mitglied Dipl.-Verkehrsing.
Beiträge: 352 Registriert: 20.09.2007 AMD PhII 945 C3 3,0GHz, 4 GB DDR3-1333, FX580 (191.78) S2411W, win7 x64 Pro mobile: Vaio TT21WN/B (win7 x86) AutoCAD 2002-2010 MS Office 2007, Visio, Project, OneNote Adobe Creative Suite 4 Design Premium
|
erstellt am: 28. Apr. 2010 11:37 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Moin, das konntest du tatsächlich, denn den Sinn, HT zu deaktivieren, kann ich nicht nachvollziehen. Es sei denn man hat kein win7. Ein Rechenkern in der CPU zeichnet sich durch 2 Sachen aus: Exklusives Rechenwerk und exklusiver Cache. Bei SMT wird ein zweites Rechenwerk an den Kern rangepappt und das nutzt den vorhandenen Cache. Deshalb sind es auch nur logische Kerne, keine physikalischen. Intel hat sich den Spaß beim P4 ausgedacht, weil die µOps anfällig für abreißende Datenströme waren. Das angedachte SIMD-Konzept ging nicht auf, daher die grob gesagt zweite Wasserleitung die weiterarbeitet, wenn die andere grad Stau hat. Deine Vermutung, bei SMT würde der Prozess nicht auf einem Kern laufen, ist daher irreführend. Wenn es keinen expliziten Grund wie ein altes Windows gibt, dann würde ich das SMT wohl eher mal aktiviert lassen. ------------------ Man verwächst mit seinen Aufgaben ... Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
Michael 18111968 Ehrenmitglied V.I.P. h.c. F&E & CAD
Beiträge: 4893 Registriert: 25.07.2002 Pro/E WiFi3 M180 & Mechanica Pro/Intralink 3.4 M040 Inneo StartupTools 2009 HP XW4600 Edition CAD.de Win XP x64 & Fx3700 HP XW9300 Win XP x64 & Fx3400/3450
|
erstellt am: 28. Apr. 2010 14:33 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Zitat: Original erstellt von lumen: denn den Sinn, HT zu deaktivieren, kann ich nicht nachvollziehen. Es sei denn man hat kein win7.
Bisher war ja noch nicht von Windows 7 die Sprache, drum hilft mein Einwurf vielleicht zum ursprünglichen Thema: Mir ist bei Benchmark-Messungen verschiedener Workstations für Pro/Engineer Wildfire2 aufgefallen, dass Pro/E mit aktiviertem Hyperthreading nachvollziehbar(!) langsamer war als ohne - vielleicht macht ja grade jemand Pro/E-Benchmarks und kann das mal für uns mit einer aktuellen Pro/E-Version verifizieren (vielleicht auch noch mit Win XP gegen Win 0.7)!? ------------------ CAD.DE macht Spaß! Wichtige Links für noch mehr Spaß: Richtig Fragen - Nettiquette - Suchfunktion - System-Info - Unities Wichtige Links für noch mehr Spaß mit Pro/Engineer: 7er-Regel - Abstürze - Konfiguration - Stammtisch Guten Morgen - und falls wir uns nicht mehr sehen - guten Nachmittag, guten Abend und gute Nacht! (Truman Burbank in "Die Truman-Show") Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
lumen Mitglied Dipl.-Verkehrsing.
Beiträge: 352 Registriert: 20.09.2007 AMD PhII 945 C3 3,0GHz, 4 GB DDR3-1333, FX580 (191.78) S2411W, win7 x64 Pro mobile: Vaio TT21WN/B (win7 x86) AutoCAD 2002-2010 MS Office 2007, Visio, Project, OneNote Adobe Creative Suite 4 Design Premium
|
erstellt am: 29. Apr. 2010 11:34 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Ja, deshalb schrieb ich ja, dass es schon Gründe geben kann. Einer ist das Betriebssystem, selbst Vista hatte mit mehr als 8 Kernen schon Sorgen. Zum anderen ist es die Anwendung, auch Cinebench hatte im Test ein paar Probleme. Es ist durchaus denkbar, das Pro/E in der Kombination mit XP/Vista die Threads quer über alle Kerne würfelt und irgendwie mit dem HT noch mehr quer schießt. Win7 ordnet die Threads deutlich besser einem Kern zu, da ist das halt eventuell nicht so auffällig. Wenn man sowas als Problem hat, darf man natürlich das HT mal deaktivieren und testen. Alles legitim. Wenn man dann natürlich feststellt, dass HT nicht gut ist, muss man sich im Gegenzug aber auch fragen, wieso man es bezahlt hat. ------------------ Man verwächst mit seinen Aufgaben ... [Diese Nachricht wurde von lumen am 29. Apr. 2010 editiert.] Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
pharao68 Mitglied Informatiker
Beiträge: 24 Registriert: 17.08.2006 DELL Precision 490 TcEng 2005 SR1/2007 NX6
|
erstellt am: 30. Apr. 2010 08:18 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Hallo Auch wir haben Benchmarktests gemacht, allerdings mit NX. Auch wir sind zu dem Ergebnis gekommen, dass NX mit HT, je nach Funktion/Modul, "langsamer" bis "wesentlich langsamer" ist. HT mag seine Berechtigung gehabt haben, als die CPUs noch nicht so viele Kerne hatte. Ich vermute jedoch eher, dass es für Intel praktischer war HT drin zu lassen und so Altlasten mitzuschleppen. Ich glaube nicht, das Intel seine CPUs immer von Grund auf neu designed... Grüsse
Patrick
Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
pharao68 Mitglied Informatiker
Beiträge: 24 Registriert: 17.08.2006 DELL Precision 490 TcEng 2005 SR1/2007 NX6
|
erstellt am: 30. Apr. 2010 13:13 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Hallo Da es tatsächlich Leute gibt, welche sich durch meinem ersten Beitag verwirrt fühlten, hier einige Erklärungen. Meine Quelle: Wikipedia.de! Hyper-Threading Hinter Hyper-Threading oder SMT allgemein steht die Idee, die Rechenwerke eines Prozessors besser auszulasten, indem man die Lücken in der Pipeline mit Befehlen eines anderen Threads möglichst gut auffüllt. Solche Lücken können zum Beispiel entstehen, wenn ein Prozess oder Thread durch einen Cache-Miss auf den Hauptspeicher warten muss. Hier kann dann mittels Hyper-Threading ein zweiter Prozess oder Thread „eingeschoben“ werden und somit parallel laufen. Softwareseitig verhält sich eine CPU mit Hyper-Threading wie ein symmetrisches Multiprozessor-System – die Aufteilung der hereinkommenden Daten auf den freien Raum erzeugt zwei logische Prozessoren (im HT-Jargon siblings genannt), die vom Betriebssystem mittels klassischer Multiprocessing-Verfahren verwaltet werden können. Ist das Betriebssystem also bereits (S)MP-fähig, bedarf es keiner Anpassung, um Hyper-Threading grundlegend nutzen zu können. (S)MP Ein Symmetrisches Multiprozessorsystem (SMP) ist eine Multiprozessor-Architektur, bei der zwei oder mehr identische Prozessoren einen gemeinsamen Adressraum besitzen. Dies bedeutet, dass jeder Prozessor mit derselben (physikalischen) Adresse dieselbe Speicherzelle oder dasselbe Peripherieregister adressiert. Die meisten Mehrprozessorsysteme heute sind SMP-Architekturen. Eine SMP-Architektur erlaubt es, die laufenden Prozesse dynamisch auf alle verfügbaren Prozessoren zu verteilen – dagegen muss beim asymmetrischen Multiprocessing jeder CPU eine Aufgabe fest zugewiesen werden (z. B. führt CPU0 Betriebssystemaufrufe und CPU1 Benutzerprozesse aus), da nicht alle Aufgaben auf jedem Prozessor durchgeführt werden können. Es gibt aber auch Anwendungendomänen (z. B. Regelungstechnik mit harten Echtzeitanforderungen), bei denen eine statische Zuordnung der Prozesse auch auf einer SMP-Architektur vorteilhafter ist. Zugegeben: mag sein, das HT in gewissen Fällen tatsächlich eine Leistungssteigerung von bis zu 35% bringen kann, dazu müssen aber auch mehrer Programme bzw. Prozesse gleichzeitig laufen. In der Regel laufen bei uns neben NX lediglich noch 2 bis 3 Programme und natürlich zahlreiche Systemprozesse. Schliesslich hängt es jedoch davon ab, wie die entsprechende Software programmiert wurde.
Meine Behauptung: dass Gro der Applikationen unterstützt HT nicht! Diese Funktion bleibt einigen High-End Applikationen vorbehalten, welche jede Ressource nutzen welche Ihnen zur Verfügung steht. Wird dennoch HT aktiviert, wird der Nutzen durch den zusätzlichen Verwaltungsaufwand wieder zunichte gemacht... Daher meine Empfehlung: es sollte jeder selbst testen, was es Ihm im speziellen bringt, ausser es ist bekannt, dass die Applikation(en) ausdrücklich HT nutzen/unterstützen.
Grüsse
Patrick
Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
lumen Mitglied Dipl.-Verkehrsing.
Beiträge: 352 Registriert: 20.09.2007 AMD PhII 945 C3 3,0GHz, 4 GB DDR3-1333, FX580 (191.78) S2411W, win7 x64 Pro mobile: Vaio TT21WN/B (win7 x86) AutoCAD 2002-2010 MS Office 2007, Visio, Project, OneNote Adobe Creative Suite 4 Design Premium
|
erstellt am: 30. Apr. 2010 18:40 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
Als Informatiker hat man zwar auch Hardware soweit ich weiß, aber das hier ist eher Software. Nicht der Prozessor übernimmt die Verteilung auf die Kerne, sondern der Scheduler mit seinen Zeitscheiben. Auch dazu sollte man eine Vorlesung gehabt haben soweit ich weiß. Der Prozessor bietet sich gegenüber dem System mit all seinen Kernen an, er entscheidet nicht über die Nutzung der Ressourcen. Der Scheduler im Windows operiert nach simplen Zeitscheiben. Die älteren Systeme bis win7 schauen schlichtweg, ob ein Prozess wartet und welcher Kern als nächstes Zeit hat. Daher kam es im Taskmanager immer zur Auslastung aller Kerne, weil der eine Prozess über alle Kerne verteilt wird. Der Prozess bzw. Kern muss also ständig seine Ergebnisse zurück in den Cache schreiben und an einen anderen Kern weitergeben. Der muss erst die Pipeline füllen und das Spiel geht weiter. Diese Latenz erzeugt Leistungseinbrüche, konnte man schon unter XP durch ruckelende Spiele auf Dual Cores beobachten. Dort nagelte man den Prozess händisch an einem Kern fest. Bei Win7 ist das nicht mehr so, das System versucht den Prozess auf einem Kern zu halten und sortiert die anderen Prozesse um. Dadurch entfällt die Latenz und die Anwendung läuft besser. Auch das kann man gut im Taskmanager beobachten, idR wird nur ein Kern bei einer Single-Thread-Anwendung genutzt und nicht mehr zufällig alle. Deshalb schrieb ich ja, dass es wichtig ist, welches System benutzt wird. Bei mehr als 8 Kernen ist Win7 Pflicht, da hat schon Vista Probleme. Auch Features wie Turbo Boost benötigen eher win7, weil auch sie darauf angewiesen sind, dass nur ein oder 2 Kerne arbeiten während der Rest schläft. Werden ständig alle Kerne benutzt, können Sie nicht in die Schlafmodi wechseln und das System funktioniert nicht. Wie viele Prozesse dabei im Gesamtsystem laufen ist erstmal unerheblich, sind sowieso mehr als Kerne vorhanden sind. Das Betriebssystem kümmert sich schon um die Zuordnung. Zitat: HT mag seine Berechtigung gehabt haben, als die CPUs noch nicht so viele Kerne hatte. Ich vermute jedoch eher, dass es für Intel praktischer war HT drin zu lassen und so Altlasten mitzuschleppen. Ich glaube nicht, das Intel seine CPUs immer von Grund auf neu designed...
Tschuldigung, nochmal editieren. HT wurde bei den C2D-Prozessoren entfernt, es hängt auch davon ab, welches Team an einem Prozessor arbeitet. Also ob USA oder Israel. Es ist jedoch eine Kostenfrage. SRAM in den Caches braucht viel Waferfläche und ist teuer, die Rechenwerke hingegen nicht. Es ist also schlichtweg billiger die paar Transistoren der Rechenwerke anstatt einen eigenen Kern (Rechenwerk + Cache) in Silizium zu gießen. Somit ist eine Leistungssteigerung mit wenig Einsatz möglich. ------------------ Man verwächst mit seinen Aufgaben ... [Diese Nachricht wurde von lumen am 30. Apr. 2010 editiert.] [Diese Nachricht wurde von lumen am 30. Apr. 2010 editiert.] [Diese Nachricht wurde von lumen am 30. Apr. 2010 editiert.] Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
schulze Ehrenmitglied V.I.P. h.c. CAD/CAE Manager
Beiträge: 2312 Registriert: 26.03.2001
|
erstellt am: 04. Mai. 2010 18:01 <-- editieren / zitieren --> Unities abgeben: Nur für qdriver79
>>das konntest du tatsächlich, denn den Sinn, HT zu deaktivieren, kann ich nicht nachvollziehen Moin, lumen. Es gibt durchaus Anwendungen, bei denen der Hersteller ausdrücklich empfiehlt, HyperThreading auszuschalten. Moin, qdriver Du redest von ANSYS - hast Du Dir deren Empfehlungen mal angeschaut? Intel Hyper-Threading/SMT Hyper-Threading is now called Simultaneous multithreading or SMT. Customers are recommended to leave SMT enabled on their systems but not over-subscribe physical cores for parallel simulations. While some improvement is possible, the extra performance from the virtual threads is not cost-effective and incommensurate with the additional license costs (which are per process)." Basically, if a section of the CPU core is not being used it tries to run a second task on these sections. For example, if one process only needs to do floating point operations while another only needs to do integer operations they can run both concurrently. For FLUENT, there is no consequence to performance if it is turned off. If SMT is on, and you run 16x (instead of 8x; assuming dual cpu quad-core nodes), you can get an additional 20% or so (compared to 8x) improvement. This is not recommended since you only get 20% more for 2x licenses (license is per process). in this scenerio, leave SMT on and run 8 way. This is the recommended approach. ------------------ R.Schulze Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
qdriver79 Mitglied Dipl.-Ing.
Beiträge: 146 Registriert: 20.09.2007
|
erstellt am: 25. Mai. 2010 11:53 <-- editieren / zitieren --> Unities abgeben:
Hallo, RSchulz Ich nutze ANSYS nicht mehr, weiß es nur noch von früher (damals gab es SMT aber noch nicht) ... Is ja schon gut, wenn ANSYS bzw. Fluent überhaupt einen Vorteil aus SMT ziehen kann, allerdings stehen bei deren Lizenzmodell Kosten und Nutzen wirklich in keinem Verhältnis zueinander ... qdriver Eine Antwort auf diesen Beitrag verfassen (mit Zitat/Zitat des Beitrags) IP |
| Anzeige.:
Anzeige: (Infos zum Werbeplatz >>)
|