amiga-news ENGLISH VERSION
.
Links| Forum| Kommentare| News melden
.
Chat| Umfragen| Newsticker| Archiv
.

amiga-news.de Forum > AROS und Amiga-Emulatoren > Abeits des freudigen ereignises (64Bit JIT in WinUAE), [ - Suche - Neue Beiträge - Registrieren - Login - ]

-1- [ - Beitrag schreiben - ]

04.12.2015, 08:12 Uhr

L-ED
Posts: 391
Nutzer
Grüße in die Runde

Seit kurzem existiert auch eine 64Bit JIT Emulation (endlich, wer hatte daran noch geglaubt)! :)

In dem Zusammenhang bzw. eher eines aufgeflammten review/reloaded Projektes was bissel zeitgleich gefallen, mir eine seltsame Anomalie aufgefallen (die vermutlich schon sehr lange vorhanden?)!

Es scheint als würden beim compilieren irgend ungünstige Parameter gesetzt, die welche die mögliche Performance auf AMD FX Prozessoren erheblich drücken (vergleichsweise). Wenn an dem was dran sein könnte, wäre die nächste Frage ob da wer Draht zum Autor hätte und drauf aufmerksam machen könnte (ideal jemand mit Programmier kenntnis, wegen selber .. aka direkterer Sprache)?

Da sehr vermutlich keine Absicht dahinter sondern schlicht *Unwissen* drum, im Sinne das zum einen kaum einer mehr so extrem Projekte am schieben wo das erstens überhaupt am auffallen. Zum anderen da vermutlich selber eine andere CPU am nutzen (wahrscheinlich Intel)? ;)

Zum Verifizieren vor Ort 2x FX8 der Vishera Generation (4 und 3,2GHz) und eine Phenom 2 X6 mit 2,7GHz!

Letzterer schlägt beim Raytracing bzw. Scanline mit Cinema 4D 4.1 FP, den 3,2GHz recht deutlich und hängt auch den FX8 mit 4GHz ab! :O Und an dem Punkt Leuten bei mir die Glocken, habe zwar wenig bis im Grunde keine Ahnung vom Programmieren (auf der ebene), aber das da was quer hängen muss ist relativ offensichtlich?

Fürs Plastischere, dieses Frame brauchte:

WinUAE 3.2 64Bit (JIT)
X6 2,7 Ghz = 4:19 Min
FX8 3,2 GHz = 6:36 Min
FX8 4,0 GHz = 5:13 Min

WinUAE 3.2 64Bit (NoJIT)
X6 2,7 Ghz = 4:18 Min
FX8 3,2 GHz = 6:31 Min
FX8 4,0 GHz = 5:12 Min

Jeweils ein und die selbe Konfiguration nebst Amiga Festplatten Verzeichnis! Weitere Interessante Beobachtung, JIT OFF zu nehmen scheint offensichtlich nicht zu funktionieren (BUG)!


PS:
Es ist allgemein bekannt das die FX u.a. eine seichte FPU schwäche haben können, auch gemessen an der Ph2 Generation (speziell noch wenn man sie falsch anspricht, was ich hier vermute). Aber so unter dimensional per-formen die nun auch nicht und abseits von jetzt hier WinUAE ist das auch kaum so nachzuzeichnen. Im Regelfall braucht ein FX der Vishera Generation 200 bis max. 400MHz mehr um mit den Phenom 2 gleich auf und ab da an dann drüber zu kommen (pro Kern Leistung), so zumindest bei meinen eigenen bisherigen Beobachtungen.

Von dem her finde die Werte da oben schon ziemlich auffällig und diverse Konstellationen durchprobiert! Auch mit älteren WinUAE Versionen (allerdings nur als Quick Test).

Ok normal nicht weiter wild und erwarte auch nicht das der Autor mit Begeisterung sich da rein hängt falls es tiefer stecken sollte? Aber wenn es nur irgend ungünstig gesetzte oder vergessene Flags bei den Compiler Parameter, sollte es doch daran nicht scheitern?! :)

[ - Antworten - Zitieren - Direktlink - ]

04.12.2015, 08:57 Uhr

o1i
Posts: 36
Nutzer
@L-ED:

Der 64-bit JIT ist nicht von WinUAE selbst, sondern eigentlich der Aranym JIT.

Zu den anderen Werten kann ich nichts sagen, da ich schon lange aufgehoehrt habe, Prozessorgeschwindigkeiten zu vergleichen. Sind eigentlich alle schnell genug fuer mich ;-).

[ - Antworten - Zitieren - Direktlink - ]

04.12.2015, 09:55 Uhr

Mda
Posts: 87
Nutzer
@L-ED:

> Seit kurzem existiert auch eine 64Bit JIT Emulation (endlich, wer hatte daran noch geglaubt)!

Das 32-Bit-Zeitalter wird auch irgendwann zu Ende gehen. Aus dem Grund wird es auch einen Grund geben, auch 64-Bit anzubieten. Insofern sind/waren die Frage(n) nur: "Wann? Und gibt es dann noch Interesse an Classic-Amiga-Emulation?"

<quote>

Fürs Plastischere, dieses Frame brauchte:

WinUAE 3.2 64Bit (JIT)
X6 2,7 Ghz = 4:19 Min
FX8 3,2 GHz = 6:36 Min
FX8 4,0 GHz = 5:13 Min

WinUAE 3.2 64Bit (NoJIT)
X6 2,7 Ghz = 4:18 Min
FX8 3,2 GHz = 6:31 Min
FX8 4,0 GHz = 5:12 Min

</quote>

D.h., falls mir mein Phenom 2 zu langsam ist, darf ich keinen AMD FX kaufen. Zudem bestätigt es meine damalige Meinung, dass der Phenom 2 eigentlich gut genug war, dass AMD nur AVX hätte hereinfrickeln müssen (viele Anwendungen benutzen es sowieso nicht, WinUAE benötigt SSE2) und eventuell die Performance des L2-Caches und die Größe des L3-Caches zu Intel hätten annähern sollen. Mit kleineren Strukturen und optimierteren Stromsparen wären wohl auch die Hauptprobleme der damaligen K10-CPUs beseitigt worden. Aber komplett auf Mehrkernperformance zu setzen (auf Kosten der Einkernperformance) kam mir damals nicht gesund vor, da Intel in der Regel CPUs mit mehr Kernen bot, als genutzt wurden, und diese pro Kern auch deutlich schneller waren. Da bringt es auch nichts, wenn der AMD-8-Kerner bei diversen Benchmarks und spezieller Software eine Intel-4-Kern-CPU abhängt, wenn zumindest in meinem Fall die wenigsten Anwendungen von einem dritten Kern profitieren. Die günstigeren CPU-Preise (falls überhaupt vorhanden) werden meist durch die höheren Stromkosten und den lauteren Betrieb oder das teurere Dämmen wieder aufgefressen.

<quote>

Es scheint als würden beim compilieren irgend ungünstige Parameter gesetzt, die welche die mögliche Performance auf AMD FX Prozessoren erheblich drücken (vergleichsweise). Wenn an dem was dran sein könnte, wäre die nächste Frage ob da wer Draht zum Autor hätte und drauf aufmerksam machen könnte (ideal jemand mit Programmier kenntnis, wegen selber .. aka direkterer Sprache)?

</quote>

Ich habe zwar keinen Draht zu den Entwicklern, aber im heise-Forum treibt sich einer herum, der wohl dafür (mit)verantwortlich scheint: > http://www.heise.de/forum/iX/News-Kommentare/Retro-Computing-Amiga-mit-WinUAE-3-2-0-emulieren/Re-680x0-mit-64-Bit/posting-23912415/show/
D.h., erreichen wird man ihn so wohl, wenn man auf seine aktuellen Forenkommentare antwortet.

<quote>

Es ist allgemein bekannt das die FX u.a. eine seichte FPU schwäche haben können, auch gemessen an der Ph2 Generation (speziell noch wenn man sie falsch anspricht, was ich hier vermute). Aber so unter dimensional per-formen die nun auch nicht und abseits von jetzt hier WinUAE ist das auch kaum so nachzuzeichnen. Im Regelfall braucht ein FX der Vishera Generation 200 bis max. 400MHz mehr um mit den Phenom 2 gleich auf und ab da an dann drüber zu kommen (pro Kern Leistung), so zumindest bei meinen eigenen bisherigen Beobachtungen.

</quote>

Es kommt auch immer darauf an, wie die Geschwindigkeit zu Stande kommt. Die neueren AMD-CPUs sind in der Regel bei konventionellen CPU- und FPU-Anwendungen ihren Vorgängern unterlegen, profitieren aber dafür wiederum stark von neuen Befehlen und GPGPU-Unterstützung. WinUAE unterstützt m.W. weder GPGPU noch Befehle >SSE2. Im Gegensatz zum Athlon XP ist SSE seit den Athlon64-CPUs auch vernünftig integriert.

Eventuell sind sogar die Parameter richtiger gesetzt als für andere Software.

[ - Antworten - Zitieren - Direktlink - ]

04.12.2015, 13:42 Uhr

L-ED
Posts: 391
Nutzer
Danke Euch für die Infos und he, das es sogar jemand zu sein scheint der Deutsch spricht macht es um so zugänglicher (mal schauen).

Und zum anderen ...

Das ist alles relativ zu betrachten, gehöre zu denen die absolut kein Problem darin haben vielen Kernen auch einen effektiven nutzen abzuringen (eigentlich bis open end wenn es danach und bisweilen geht). Von daher AMD sehr dankbar dafür das sie bei guten Gewissens bezahlbare und halbwegs Potente Acht Kerner schon vor Jahren auf den Markt gebracht!

Wenn wir bei den Beispiel bleiben in dessen Zusammenhang mir die Anomalie die hier gerade Thematisiert aufgefallen. So beliefe sich das in Praxis auf max. 5 Emulierte Amigas für einen Sechs Kerner und 7 für einen Acht Kerner die gleichzeitig gefahren werden könnten (mind. ein Kern sollte immer über bleiben, dazu kommen ggf. noch)!

Wenn es um so intensive Themen geht wie Raytracing oder allgemein Frame Weiterverarbeitung, automatisierte Post-Processing Ziehungen etc. Ist es für unter Retro Umgebungen/Ambitionen nur so überhaupt realistisch noch angehbar. Da heute nicht nur mit viel, viel höhere Auflösungen gearbeitet sondern auch im allgemeinen um einiges mehr an Frames (wenn denn)! Das lässt sehr schnell auch überbordete Potenz von JIT emulierten classic 68k auf gefühlt, nujo lahm aka könnte schneller sein zusammen schmelzen! :sleep:

Und mehr Leistung pro Kern natürlich durchaus gerne angenommen, allerdings nicht zum Preis derer Anzahl (denn hier oder bei so Themen Skaliert es darüber). SMT Threads bei solch Szenarios im übrigen nicht mit zählbar, im Sinne von das sich darüber etwa weitere Amiga Workstations realisieren ließen!

Sinn oder Unsinn eines AMD FX8 vs. Phenom 2 X6 oder irgend Intel 4 Kern Lösungen erübrigt sich darüber in solchen Szenario dann trotz dieser momentan und vergleichsweise desaströsen Ergebnisse im einzelnen. Auch weil dabei noch nicht in/bei der Praxis gewesen in der sich wiederum zeigt das Kerne einfach alles sind (solange sie mindest- Leistung X )! ;)

[ - Antworten - Zitieren - Direktlink - ]

04.12.2015, 14:49 Uhr

Holger
Posts: 8033
Nutzer
Also ohne Referenzwerte ist die Interpretation auch umkehrbar. Vielleicht ist nicht die Ausführung beim FX8 besonders schlecht, sondern die Ausführung auf dem Phenom 2 besonders gut?

Mit ist auch nicht klar, wie relevant die angegebenen nominellen Taktfrequenzen sind. Wenn die Emulation nur ein Kern nutzt, kann dieser natürlich höher getaktet werden, oder? Und da ist beim Phenom 2 mehr Luft nach oben…

--
Good coders do not comment. What was hard to write should be hard to read too.

[ - Antworten - Zitieren - Direktlink - ]

04.12.2015, 16:03 Uhr

L-ED
Posts: 391
Nutzer
Nein, nein das sind Hand justierte/optimierte Systeme und beim X6 und dem kleineren FX8 auf verstärkter Leistung/Watt. Turbo Modus ist bei allen deaktiviert und die angegebenen Taktfrequenzen beziehen sich auf alle Kerne (sprich die sowohl als auch anliegen)!


In dem Zusammenhang vielleicht noch paar Daten, auch weil es am Rande schon mit gestreift und es gerade passend. Aber ohne es ausufern zu lassen mit noch diversen System angaben usw. Man darf aber von ausgehen das sie nicht posten täte wenn nicht in etwa Vergleichbarkeit gegeben gewesen wäre.

Jeweils das gesamt System ohne Monitor und alle Kerne
Von dem X6 auf 2,7GHz habe leider kein direkt wert:
2,8GHz @1,072v CB. 11.5* = 140w / LinX = 154w
2,6GHz @1,024v CB. 11.5* = 131w / LinX = 142w

3,9Ghz @1,472v CB. 11.5* = 250w / LinX = 346w - Temperatur Mauer!
3,8Ghz @1,408v CB. 11.5* = 222w / LinX = 320w
3,7Ghz @1,408v CB. 11.5* = 221w / LinX = 302w
3,6GHz @1,360v CB. 11.5* = 196w / LinX = 260w
3,4Ghz @1,264v CB. 11.5* = 173w / LinX = 226w
3,2Ghz @1,216v CB. 11.5* = 155w / LinX = 203w
3,0GHz @1,184v CB. 11.5* = 147w / LinX = 187w


FX8
4,0GHz @1,296v CB. 11.5* = 181w / LinX = 225w (AVX Version)
3,2GHz @1.024v CB. 11.5* = 114w / LinX = 134w (AVX Version)

4,7GHz @1.520v CB. 11.5* = 311w / LinX = 393w (AVX Version)
4,6GHz @1.472v CB. 11.5* = 270w / LinX = 341w (AVX Version)
4,5GHz @1.440v CB. 11.5* = 255w / LinX = 311w (AVX Version)
4,4GHz @1.408v CB. 11.5* = 232w / LinX = 296w (AVX Version)
4,3GHz @1.408v CB. 11.5* = 228w / LinX = 298w (AVX Version)
4,2GHz @1.360v CB. 11.5* = 208w / LinX = 230w (AVX Version)

*Cinebench 11.5 (jeweils alle Kerne)

Wie zusehen habe noch andere Werte gleich mit bei gegeben nur um aufzuzeigen das so ineffizient schon bereits Vishera nicht mehr gegenüber Phenom 2. Gemeint mehr Takt zu brauchen spielt solange keine rolle solange es bei in etwa gleicher Wattage verbleibt oder gar noch deutlich darunter (obendrein gibt es noch 2 Kerne mehr)! ;) Gleichsam zeigt es aber auch gut auf wo in etwa (+/-), die Peak Grenzen der beiden Generationen (Performance/Watt), der Power Virus LinX es am besten offenbart!

Anders gesagt das mit dem Stromverbrauch und oder Lärmentwicklung ist ebenso alles relativ und ein je nach dem, die hier genannten Systeme sind alle Full Silent (in nicht gedämmten Gehäusen). Was die Geräuschkulisse für die CPU oder NT belangt. Das lauteste sind die Festplatten und beim großen die GFX (wenn mal am daddeln). Also da würde ich nicht solch Mythen aufkommen oder weiter tragen lassen wollen! ;) Speziell nicht wenn die Systeme von jemanden mit entsprechend Zielsetzung und Kenntnis -hintergrund zusammen und aufgestellt. Was sicherlich auch von OEM zu leisten wäre und wenn es sich anders hält ist es vorsätzlich! ^^

[ Dieser Beitrag wurde von L-ED am 04.12.2015 um 17:11 Uhr geändert. ]

[ - Antworten - Zitieren - Direktlink - ]

07.12.2015, 15:40 Uhr

Mda
Posts: 87
Nutzer
Zitat:
[Anders gesagt das mit dem Stromverbrauch und oder Lärmentwicklung ist ebenso alles relativ und ein je nach dem, die hier genannten Systeme sind alle Full Silent (in nicht gedämmten Gehäusen). Was die Geräuschkulisse für die CPU oder NT belangt. Das lauteste sind die Festplatten und beim großen die GFX (wenn mal am daddeln). Also da würde ich nicht solch Mythen aufkommen oder weiter tragen lassen wollen! ;) Speziell nicht wenn die Systeme von jemanden mit entsprechend Zielsetzung und Kenntnis -hintergrund zusammen und aufgestellt. Was sicherlich auch von OEM zu leisten wäre und wenn es sich anders hält ist es vorsätzlich! ^^

Also:

Mir war sogar schon ein Intel-MacMini mit Intel-GMA zu laut. Tagsüber hat man ihn zwar nicht gehört, da die Umgebungsgeräusche deutlich lauter waren. Aber nachts störte dann doch schon der leise Lüfter.
Damit mein AresOne nicht zu laut wird, habe ich z.B. einen Alpenföhn als CPU-Kühler verbauen lassen. Standardmäßig wäre da ein kleinerer Kühler drinnen gewesen, der gezwungen gewesen wäre mit höheren Umdrehungen zu drehen.
Nach NetBurst-Zeiten haben Intel-CPUs i.d.R. eine geringere Abwärme als vergleichbare AMD-CPUs. Da nicht immer die besten Lüfter verbaut werden, müssen dem entsprechend AMD-CPUs geräuschvoller gekühlt werden als Intel-Prozessoren. Je weiter man vom Computer wegsetzt, desto weniger stört es. Ein Pentium-D-PC, den z.B. eine Bekannte von mir hat, läuft z.B. sehr geräuschvoll. Aber alleine schon aufgrund seiner Positionierung kommt da auch nicht mehr viel beim Anwender an.
Der absolute Hammer war der MacMini G4, den ich hatte, bevor man auf die Idee kam MOS darauf zu portieren. In der Regel war er sehr leise. Da lief gar kein Lüfter. Aber zwischendurch musste er die angesammelte Wärme herausstoßen. Das tat er ziemlich laut.

Ein eventueller weiterer Grund, weswegen der Phenom 2 schneller als der FX ist, könnte mit den Caches zusammenhängen.
Als Apple statt des PPC603 den PPC603e verbaute, profitierte besonders die 68k-Emulation dadurch, da weniger auf den langsamereren L2-Cache zugegriffen werden musste. Andere Anwendungen profitierten auch davon, aber nicht in diesem Maße. Der gleiche Effekt wiederholte sich, als es für den Umax Apus doppelt getakte L2-Caches gab. Während alle Anwendungen davon profitierten, profitierte wiederum die 68k-Emulation besonders stark.
Ich weiß jetzt nicht, wie schnell die Caches bei den jeweiligen CPUs sind. Aber falls ich mich nicht irre, hat der FX eine Cache-Stufe mehr als der Phenom 2. Daher dürfte der größte Cache (L3) beim FX wohl auch mit mehr Latenzen laufen als der L2 beim Phenom. Wenn überproportional oft auf die größeren Caches zugegriffen wird, könnte dieses ein Grund sein. Dann müsste der gleiche Effekt aber auch zwischen Core2 und Core-iX zu sehen sein. Der L3-Cache beim Core-iX (zumindest die erste Generation) hat mehr Latenzen als der L2 beim Core2. Da wohl Intel-CPUs in den ersten beiden Cache-Stufen weniger Hits haben als AMD-CPUs, müsste der Effekt dadurch noch größer sein.

[ - Antworten - Zitieren - Direktlink - ]

07.12.2015, 16:18 Uhr

Mda
Posts: 87
Nutzer
Also, dass der Phenom 2 nur 2 Cache-Stufen hat, ist Blödsinn. Da habe ich mich einfach falsch erinnert. Aber lauf Wikipedia hat der FX nur 16 KByte Datencache pro Kern und muss sich die 64 KByte InstCache mit dem anderen Kern auf dem selben Modul teilen. Ich weiß nicht, ob es wirklich so ist, aber es könnte sich auch um einen Dreher handeln. Da Daten des öfteren aus den Registern geholt werden, aber Instruktion nur aus den Caches oder dem RAM, wäre es wohl sinnvoller, pro Kern einen InstCache zu haben, und wenn man schon Caches zwischen verschiedenen Kernen shared, dann doch eher Daten- oder L>=2-Caches. Aber so wie es auf dem Blockdiagramm aussieht, hat der FX wirklich pro Modul nur einen Instruktion Decoder. Dafür sind die L2- und L3-Caches beim FX größer als beim Phenom2.
Zumindest gilt das gleiche wie zuvor vermutete, aber in umgekehrter Weise. Falls die Emulation vom Datencache des Phenom2 (64KB statt 16KB beim FX) überproportional stark profitiert, könnte aufgrund des durchschnittlich höheren Durchsatzes auch die Emulation schneller ablaufen. Ähnlich wie bei Apple die 68k-Emulation überproportional durch 2x16KB L1 zu 2x8KB L1 im Vergleich zu anderen Anwendungen stärker profitiert hat.
Eventuell einfach einmal den Durchsatz bei den einzelnen Cache-Stufen messen.
Ich weiß nicht, wie repräsentativ die Werte sind. Aber das Speicher-Test-Programm auf vielen Linux-Boot-DVD gibt Werte für den Durchsatz der Caches und des RAMs aus.

[ - Antworten - Zitieren - Direktlink - ]

07.12.2015, 21:36 Uhr

L-ED
Posts: 391
Nutzer
Ja möglicherweise wäre und ist das auch schon die Auflösung, betreffs der Caches. Als nicht Programmierer habe dazu nicht den Überblick, ebensowenig wie das dann im Zusammenhang von Emulation und im speziellen dem 68k sich auswirken kann.

Bild: http://www.the-mentors-portale.eu/000/FX-8350(idle).png

Kann nur sagen das abseits dessen die FX der 2then Generation sich alles andere als lahm gegenüber Phenom 2 geben, von daher das ein relativ auffälliges Ereignis für mich ja darstellte. Und mit im Hintergrund das man schon oft gehört und gelesen (sogar in der Wiki), das da des öfteren wohl mehr dran ist mit der Benachteiligung speziell auch von nicht Intel CPUs unter Windows.

Bei einigen kann man durchaus absichtlich unterstellen (ggf. mit Briefumschlag von den Blauen? ^^), bei vielen anderen hingegen ist es schlicht Unwissenheit oder Flüchtigkeit. Ebenso muss man gleichsam sagen das es überwiegend dann bei diesen wo nicht Absicht dahinter zu vermuten, um Sachen geht wo es im Grunde genommen egal und von daher sich keiner die Mühe macht dem nachzugehen oder zu Monieren (wenn der Autor da nicht noch zufällig selber drauf stößt, bleibt es dann auch so)!

Ist hier ja genauso, wer arbeitet denn schon heute noch und wirklich ernsthafter unter WinUAE mit Raytracing oder anders rechen, gleichsam Umfang schweren Themen!? Und abseits dessen es ja ohnehin alles schnell genug und wenn eben, wird es halt mit Anzahl X an Simulierten Amiga Workstations erschlagen/kompensiert. Gemeint auch das Leute mit solch Ambitionen und bisweilen Interessen noch, im Regelfall wohl bereits entsprechend auf und ausgerüstet?

Wobei man hier ja auch Philosophieren könnte, auch in Anlehnung an dem Thread(?), ausm verlinkten Heise. Ob es nicht auch etwas mit Henne Ei zu tun, ich bin mir sicher das es etwa möglich wäre eine fiktive Multicore 68k zu erschaffen/Emulieren und auch in WinUAE zu integrieren. Ebenso per ggf. noch Patch fürs ROM oder OS und wenn Software kommen sollte die direkt dafür geschrieben es auch nutzen könnte? Es wäre ein Umdenken des Thema Amiga an sich und neue Dimension, worüber
auch wieder 68k Programmieren populär und auferblühen könnte.

Die Leistungs- Dimensionen haben und nehmen immer mehr zu und letztendlich ist es doch inzwischen völlig egal bzw. doch eigentlich viel, viel mehr von Vorteil wenn alles virtuell realisiert da es u.a. auch ungemeine bei kostengünstige Flexibilität ermöglicht! :)



PS: zum anderen

Der Trick liegt darinnen entsprechend Kühler und Lüfter zu verbauen, was den großen FX4 mit seinen 4GHZ belangt muss es ganz klar ein wuchtiger sein, aber auch schon was den Phenom 2 X6 bei 3.6GHz (OC alle Kerne), belangte!

Beispiel was beide Komponenten in einem Produkt bereits beinhaltet, aber solche Lüfter gibt es natürlich auch einzeln und kosten nicht die Welt. Habe damit sehr gute Erfahrungen gemacht und verbaue solche nur noch, ob nun Privat oder bei anderen.

Man nimmt also Dinger die perse nicht mehr als @800 U/min und auch an sich als Silent Marke gedacht und ausgeschrieben! Auch weile viele Boards ne erschreckend profan dämliche auto- Lüfterregelung besitzen (egal welche Preisklasse). Wo man per Software oder anders erst nachhelfen müsste, mit solchen Lüftern kann man sich das alles schenken und bekommt trotzdem Ruhe (für im Zweifel also DIE Wahl).

Dazu kann sagen das bei mir* die Mauer bei 200/210 Watt immer lag und liegt, diese können mit dem genannten mitteln für CPUs und bei in Praxis Silent realisiert werden (zumindest für mich sind die nicht mehr wahrnehmbar). Der FX8 bei 4GHZ kann damit auf 60°C gehalten werden und ein X6 bei 3,6GHz auf 68/70°C wenn recht entsinne? Gemeint der wurde schon heißer noch, aber war in seinem Rahmen (wegen breiterer Strukturen hatte der noch eine höhere Temp Toleranz). Und dabei immer halt von Vollast -szenarios geschrieben!

* Gut nun immer für das gesamt System genommen von daher +/-, aber mehr wie 10 max. 20 Watt Schwankung (je nach rest System), dürfte da nicht drin liegen.

[ Dieser Beitrag wurde von L-ED am 07.12.2015 um 21:41 Uhr geändert. ]

[ - Antworten - Zitieren - Direktlink - ]

08.12.2015, 02:36 Uhr

Mda
Posts: 87
Nutzer
@L-ED:

<quote>

Ja möglicherweise wäre und ist das auch schon die Auflösung, betreffs der Caches. Als nicht Programmierer habe dazu nicht den Überblick, ebensowenig wie das dann im Zusammenhang von Emulation und im speziellen dem 68k sich auswirken kann.

</quote>

Ich bin auch kein Programmierer. Aber ich habe das mit der 68k-Emulation damals gelesen.
Daher ist das mit den Caches nur eine Vermutung.

<quote>

Und mit im Hintergrund das man schon oft gehört und gelesen (sogar in der Wiki), das da des öfteren wohl mehr dran ist mit der Benachteiligung speziell auch von nicht Intel CPUs unter Windows.

</quote>

Als damals der Pentium III gegen den Athlon und den K6-2 gekämpft hatte, soll es im damals aktuellen Photoshop zwar ISSE-Unterstützung gegeben haben, aber kein 3D-Now. Die Begründung ging in die Richtung, dass Business-Kunde hauptsächlich zu Intel-CPU-basierter Windows-PC greifen würden. Aber die volle Photoshop-Leistung gab es als erstes auf Apple-Hardware. Während MP-Macs wie der 9600MP oder Daystar Genesi in Genuss von angepassten Filtern kam, war es unter Windows noch eine SingleCore-Geschichte, auch bei den Leuten, die mehrere CPUs unter NT hatten.
Bei einigen älteren Intel-Compilern soll es noch extremer gewesen sein, da wurden gar nicht die Flags für die unterschiedlichen Befehlserweiterungen abgefragt, sondern die Pentium-ID. Da aber außer Intel-CPUs diese keiner hat, wurde dann auf AMD-CPUs, die sogar AVX konnten, eine Code-Weiche verwendet, die nicht einmal SSE konnte, da nicht erkannt wurde, dass die AMD-CPU den gleichen Code wie die Intel-CPUs verwenden durfte. Im Vergleich war dann natürlich die Intel-CPU schneller, da diese durch SIMD-Befehle unterstützt wurde. Die Absicht, die Konkurrenz schlechter darzustellen, möchte ich aber dabei nicht unterstellen. Intel entwickelt die Intel-Compiler i.d.R. für Intel-CPUs und dort haben diese auch die richtigen Code für die entsprechende CPU genutzt.

[ - Antworten - Zitieren - Direktlink - ]

08.12.2015, 10:23 Uhr

Holger
Posts: 8033
Nutzer
Zitat:
Original von L-ED:
… ich bin mir sicher das es etwa möglich wäre eine fiktive Multicore 68k zu erschaffen/Emulieren und auch in WinUAE zu integrieren. Ebenso per ggf. noch Patch fürs ROM oder OS und wenn Software kommen sollte die direkt dafür geschrieben es auch nutzen könnte?


Die Probleme von AmigaOS im Zusammenhang mit SMP wurden an anderer Stelle schon diskutiert, soviel sei hier noch mal gesagt, mit einem einfachen Patch ist es nicht getan. Andererseits willst so etwas ohnehin nicht mit den Standard-Komponenten nutzen, womit wir dann bei der derzeit einzigen Alternative wären, AROS.

Wenn erst einmal AROS/x86 voll SMP-fähig ist, sollte es keine so große Mühe mehr sein, eine SMP-fähige AROS/68k Version zu entwickeln, die auf Deinem hypothetischen emulierten Multicore 68k läuft. Ich bin mir sicher, unter den Usern von FPGA-68k Nachbauten finden sich auch Interessenten für so eine AROS-Version, bzw. könnten Entwickler solcher Hardware sogar Interesse an der SMP-UAE-Version haben, die ideal für’s Prototyping wäre.

--
Good coders do not comment. What was hard to write should be hard to read too.

[ - Antworten - Zitieren - Direktlink - ]

10.12.2015, 05:12 Uhr

L-ED
Posts: 391
Nutzer
Na das lässt ja für die Zukunft hoffen, im Endeffekt hätte schon ziemlich Lust wieder zum Amiga zurück zu kehren, auch nach dem jüngerlich und neusten Eskapaden seitens Microsoft (brauch man denke ich nicht weiter ausführen?).

Gleichwohl mir bewusst das dessen allenfalls eine Illusion sein kann, zumindest für die nächsten 20Jahre weiter? ^^

x86er hat so eine enorme Code Basis mittlerweile, das es schon nötig und möglich sein müsste ein Windows oder Linux System per VM unter AMIGA OS nutzen zu können. Und die Voraussetzung um solches überhaupt mal zu stemmen wäre in die Breite und halt Power, Power und nochmals Power! Mal die Frage außen vor geklammert wie realistisch es dann wäre das sich coder finden die so Emulations- oder VMs Dingels dafür schreiben täten. :look:

Aber Henne <-> Ei = solange es ohnehin unrealistisch solches performant andenken zu können etc.

Wobei ja und richtig, man könnte zunächst ja auch in Linux emigrieren. Problem, damit bin bis heuer nie wirklich warm geworden und an irgendwas scheiterte es bis heute immer (oft auch schon an Hardware X).

Mein Ideal (nen Traum), wäre AMIGA OS nativ und Win X Y Z inner VM bei voller Unterstützung und durchschleifen der Hardware (hier Gaming mit im Auge).

Back to the Roots, wie man so schon sagt, Amiga + OS hatte/habe verstanden fast bis auf den Grund (von selber coden mal abgesehen). Windows bis heute noch nicht mal ansatzweise so weit (ist ja auch nicht gewollt), ist zwar ein Makel und gefällt nicht, aber solange alles rennt OK (muss eben). Und bei Linux es gleich bzw. noch wesentlich stiefmütterlicher (hinsichtlich Kenntnisse). Mit dem Unterschied das me bis heuer die Zeit und Lust fehlte dort so einzuarbeiten und obendrein es halt nicht rannte/rennt (on the fly und out of the box), wie man so eigentlich wollte/will (sozusagen eine KO Situation).

Mal gucken ob der gefühlte Druck groß genug wird ^^

[ Dieser Beitrag wurde von L-ED am 10.12.2015 um 05:14 Uhr geändert. ]

[ - Antworten - Zitieren - Direktlink - ]

10.12.2015, 14:28 Uhr

Mda
Posts: 87
Nutzer
@L-ED:

Zu einem kommt es natürlich darauf an, was man unter Amiga versteht. Unter 68k-Amigas eine x86-Emulation, um Win oder Linux auszuführen, ist nicht sinnvoll machbar. Ich habe von Start-Zeiten von über 30 Minuten auf einem 68040-Prozessor gelesen, um Windows 95 zu laden. Die Win95-Nachfolger sollten noch einiges länger brauchen. Die unter WinUAE emulierten Amigas sind zwar meist schneller als die echten, aber selbst für den Zweck zu langsam und benötigen als Host Windows, welches man eigentlich vermeiden will. Zu Zeiten von PowerMacs gab es gute kommerzielle x86-Emulation in Form von RealPC und VirtualPC. Ich hatte ersteres. Aber wenn ich mich richtig erinnere, unterstützte es keine NT-Kernel. Der VirtualPC-Hersteller wurde irgendwann von MS aufgekauft, und aus der x86-Emulation wurde später eine x86-Virtualisierung, die letztlich dazu benutzt wurde, WinXP in Win7Pro zu starten. Danach wurde m.W. nichts mehr weiter entwickelt. Auf dem Amiga gab es damals auch Lösungen, aber ich meine nicht PPC-basierend. Zudem sind die meisten PPC-Cores langsamer als Mittelklasse-x86-Cores von vor 10 Jahren. Die meiste Software, die in den letzten 10 Jahren entwickelt wurde, dürfte auf der noch langsamereren x86-Emulation auch keinen Spaß machen. Damit bliebe nur noch x86(-Virtualisierung) über. Darauf läuft aber nur AROS nativ und sonst kein anderes Amiga-Derivat. Phönixconsole hatte mit AEROS (x86-basiert) eine Lösung geliefert, die ein Linux startete, um AROS hosted auszuführen. Aus AROS heraus ließen sich Linux-Anwendungen starten und dank Wine ("Wine is not an emulator") ließen sich auch Windows-Anwendungen starten. Aber wie das selbst unter echtem Windows ist, gibt es auch unter Wine Kompatiblitätsprobleme. Die Wahrscheinlichkeit, dass AOS4 irgendwann auf x86 portiert wird, ist eher gering, MOS soll irgendwann auf x86 migrieren und AROS läuft schon auf x86. AROS gibt auch als Hosted und kann unter Win oder Lin gestartet werden. Wenn man AROS hosted auf Linux laufen läßt und zudem Wine installiert, ist man fast an dem Punkt, wo AEROS einmal war. Man kann aber aus AROS heraus keine Linux-Anwendungen starten. Irgendwann soll es einen neuen Kernel geben, der ARIX genannt wird. Worum es sich genau handelt habe ich nicht 100% verstanden. Aber es soll sich um einen Hybrid aus Linux- und Amiga-Kernel handeln. Ich vermute, dass dieser 100% Linux-kompatibel sein wird und dass AROS SMP-Fähigkeit erhält und nativ damit läuft. Bis dahin vergeht aber noch viel Zeit. Eine x86-Virtualisierung direkt auf AROS-Basis ist theoretisch machbar, da aber AROS noch kein SMP beherrscht, liefen alle Anwendungen auf einem Kern, was unter Linux und Windows heutzutage keinen großen Spaß mehr macht. Wine auf AROS zu portieren, wäre wohl theoretisch auch machbar. Aber beide Lösungen wurden wohl soviel Zeit in der Entwicklung veranschlagen und zu langsam laufen, dass es nicht sinnvoll ist, sich damit weiter auseinander zu setzen.

[ - Antworten - Zitieren - Direktlink - ]


-1- [ - Beitrag schreiben - ]


amiga-news.de Forum > AROS und Amiga-Emulatoren > Abeits des freudigen ereignises (64Bit JIT in WinUAE), [ - Suche - Neue Beiträge - Registrieren - Login - ]


.
Impressum | Datenschutzerklärung | Netiquette | Werbung | Kontakt
Copyright © 1997-2019 by amiga-news.de - alle Rechte vorbehalten.
.