[importante] CPUBench2002 new beta...finalmente OUT! :)

Pagina 25 di 42
prima
... 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 ... ultimo
Visualizzazione dei risultati da 241 a 250 su 415
  1. #241
    tebibyte
    Registrato
    May 2001
    Località
    Milano
    Messaggi
    1,500

    Predefinito

    Originally posted by The3DProgrammer



    questa è una faccenda essenziale che avevo intenzione di trattare appena connesso....tu mi dai lo spunto x iniziare :

    allora come sapete i benchmark sono 7: ALU (simulazione database), FPU Single (trasformazione 3D) FPU Double (approssimazione di pigreco) MIPS (no comment ), MFLOPS, oltre a quelli della RAM. Ora il quesito è: Perchè mettere 2 bench x l'ALU, 2 x l'FPU etc? il motivo è semplice. Come credo sappiate nn tutto il codice viene eseguito alla stessa velocità: in particolare, le CPU odierne hanno la tendenza a parallelizzare il + possibile, sia per sfruttare le varie pipeline di cui sono dotate, sia eventualmente le istruzioni SIMD. Non tutto il codice è adatto xò ad essere parallelizzato: spesso (la quasi totalità delle volte ) diviene impossibile cercare di parallelizzare a causa della presenza di salti nel codice, di dipendenze tra i dati, etc etc. CPUBench tiene conto proprio di questo: In particolare, il benchmark 1 (ALU), il benchmark 2 (FPU SP ) e il benchmark 3 (FPU DP ) sono estremamente difficili da parallelizzare (anke se, in particolare nel caso del bench ALU, ho implementato alcune ottimizzazioni per sfruttare al max la velocità della cache ), mentre i benchmark MIPS e MFLOPS sono ESTREMAMENTE adatti ad essere parallelizzati, ed è proprio x questo che passando con qualsiasi CPU (athlon o P4 ) da modalità IA32 a modalità ottimizzata, se ci fate caso, i risultati MIPS/MFLOPS quasi raddoppiano. Capite quindi xkè ho deciso di inserire questi benchmark differenti: per avere una visione + ampia sulle performance che una determinata CPU da con diversi tipi di codice.
    Analizziamo per esempio le differenze di performance che si hanno passando da modalità standard a ottimizzata sul P4 di kikujiro :


    risultati IA32

    Overall Result: 5455 CPUMarks
    ALU Result: 54587 ALUMarks
    ALU Time: 4.937 seconds
    FPU Result (overall): 42293 FPUMarks
    FPU Single Precision Result: 31255 FPUMarks SP
    FPU Single Precision Time: 11.569 seconds
    FPU Double Precision Result: 53331 FPUMarks DP
    FPU Double Precision Time: 12.218 seconds
    MIPS Result: 3523 MIPS
    MFLOPS Result: 2914 MFLOPS


    Risultati SSE2

    Overall Result: 6530 CPUMarks
    ALU Result: 67543 ALUMarks
    ALU Time: 3.99 seconds
    FPU Result (overall): 45429 FPUMarks
    FPU Single Precision Result: 36770 FPUMarks SP
    FPU Single Precision Time: 9.834 seconds
    FPU Double Precision Result: 54088 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 6211 MIPS
    MFLOPS Result: 4969 MFLOPS

    tralasciando il benchmark ALU, che si avvantaggia nn solo delle SSE2 ma anche di alcune ottimizzazioni legate alla cache, notate come i bench FPU SP e DP traggano relativamente poco vantaggio dall'utilizzo delle SSE2: questo proprio a causa del problema di cui vi ho parlato prima (difficoltà nel parallelizzare...i risultati sono +ttosto bassi xkè, come sapete, l'unità FPU x87 standard del P4 nn è velocissima ). I benchmark MIPS e MFLOPS, con l'uso delle SSE2 invece praticamente raddoppiano (circa 80% di guadagno ) a dimostrare che in alcuni campi l'uso delle istruzioni SIMD può incrementare notevolmente le performance offerte. Naturalmente, il discorso è applicabile allo stesso modo alle altre CPU (PIII e K7 ) anke se in maniera lievemente differente, questo xkè le FPU di PIII e K7 sono decisamente + performanti a parità di frequenza dell'unità FPU del P4. In teoria quindi CPUBench2002 dovrebbe fornire buone info riguardanti le prestazioni della propria CPU in vari ambiti. Per quanto riguarda i pesi, i bench ke pesano di + sono quelli ALU, FPU SP e DP (peso 4) seguiti da MIPS e MFLOPS (peso 3) e dai risultati della RAM (peso 1)


    byez
    è vero che la FPU è penalizzata nei P4 ma bisogna anche dire che un P4 con molti Mhz e bus alti sopperisce a questa mancanza. La prova? Questa. Il record di super Pi ottimizzato x la FPU di K7 E pIII.



    e come ben sapete winMe è - veloce di win2k/Xp in superPi.
    P.S. cmq non ho ancora visto il bench ram ALU e FPU bandwith del north di kikujiro. xchè non posti anche quello.

    Ciao

  2. #242
    tebibyte L'avatar di jena.fuck
    Registrato
    Jan 2001
    Località
    qui...->
    Messaggi
    2,550

    Predefinito

    Insomma...nisba new version?

  3. #243

    Predefinito

    Originally posted by kiko

    e come ben sapete winMe è - veloce di win2k/Xp in superPi.
    P.S. cmq non ho ancora visto il bench ram ALU e FPU bandwith del north di kikujiro. xchè non posti anche quello.
    Ciao
    eccoli (cmq li aveva postati poco fa the3dprogrammer in quel post in cui faceva l'analisi dei 'pesi' dei vari bench).. cmq eccoli :

    Overall Result: 6786 CPUMarks
    ALU Result: 70292 ALUMarks
    ALU Time: 3.834 seconds
    FPU Result (overall): 47127 FPUMarks
    FPU Single Precision Result: 37975 FPUMarks SP
    FPU Single Precision Time: 9.522 seconds
    FPU Double Precision Result: 56279 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 6426 MIPS
    MFLOPS Result: 5139 MFLOPS
    RAM ALU Bandwidth (MB/s): 1090 MByte/s
    RAM FPU Bandwidth (MB/s): 1105 Mbyte/s

    ps. ma che intendi per 'versione di superPi ottimizzata per pIII/k7'? io conosco solo la.. standard..
    questo è il superPi a 2.6/580/145 (non mi andava di reboottare e alzare il vcore)



    (mh, pochino)
    cya

  4. #244
    tebibyte
    Registrato
    May 2001
    Località
    Milano
    Messaggi
    1,500

    Predefinito

    Originally posted by kikujiro


    eccoli (cmq li aveva postati poco fa the3dprogrammer in quel post in cui faceva l'analisi dei 'pesi' dei vari bench).. cmq eccoli :

    Overall Result: 6786 CPUMarks
    ALU Result: 70292 ALUMarks
    ALU Time: 3.834 seconds
    FPU Result (overall): 47127 FPUMarks
    FPU Single Precision Result: 37975 FPUMarks SP
    FPU Single Precision Time: 9.522 seconds
    FPU Double Precision Result: 56279 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 6426 MIPS
    MFLOPS Result: 5139 MFLOPS
    RAM ALU Bandwidth (MB/s): 1090 MByte/s
    RAM FPU Bandwidth (MB/s): 1105 Mbyte/s

    ps. ma che intendi per 'versione di superPi ottimizzata per pIII/k7'? io conosco solo la.. standard..
    cmq faccio circa 1min15secs in superPi a 2.7/600/150 (sotto winxp), molto pochino veramente...
    innanzitutto 10x x ottimizzata K7 e PIII intendo che la versione attuale di super Pi che se non sbaglio è del 95 non sfrutta ovviamente le SSE2. Pare che faranno una versione ottimizzata anche SSE2 ma non ne ho la certezza.
    X andare quindi veloce con un P4 in superPi come hai visto c vuole molta banda sulla memoria e Mhz. La tua effettivamente con le DDR @150 è pochina ben inferiore a quella del KT266A a parità di memorie. E ne ero quasi sicuro.
    Quindi RIMM obbligata e salire oltre i 3Ghz ma ad aria la vedo duretta. Tutto questo in fila mi ha fatto capire che le potenzialità c sono ma x sfruttarle bisogna farsi il culo tanto quanto un Xp.
    Cmq spero mi arrivi sta benedetta cpu da provare su questa soltek sono veramente curioso.

    Ciao

  5. #245
    Super Moderatore L'avatar di frakka
    Registrato
    May 2001
    Località
    Casalecchio di Reno (Bo)
    Età
    44
    Messaggi
    23,432
    configurazione

    Predefinito

    Bho! Io i report li creo senza problemi. Piuttosto anche a voi non compare nulla nella schermata riguardante le informazioni sulla mb?

    Questi sono i test sul morgan 1000@1316 (fsb 146):
    1_Generico
    Overall Result: 3446 CPUMarks
    ALU Result: 27020 ALUMarks
    ALU Time: 9.974 seconds
    FPU Result (overall): 35925 FPUMarks
    FPU Single Precision Result: 29379 FPUMarks SP
    FPU Single Precision Time: 12.308 seconds
    FPU Double Precision Result: 42471 FPUMarks DP
    FPU Double Precision Time: 15.342 seconds
    MIPS Result: 2262 MIPS
    MFLOPS Result: 1866 MFLOPS
    RAM ALU Bandwidth (MB/s): 840 MByte/s
    RAM FPU Bandwidth (MB/s): 943 Mbyte/s

    2_3DNow!
    Overall Result: 4304 CPUMarks
    ALU Result: 33140 ALUMarks
    ALU Time: 8.132 seconds
    FPU Result (overall): 44763 FPUMarks
    FPU Single Precision Result: 40569 FPUMarks SP
    FPU Single Precision Time: 8.913 seconds
    FPU Double Precision Result: 48956 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 3477 MIPS
    MFLOPS Result: 2869 MFLOPS
    RAM ALU Bandwidth (MB/s): 1042 MByte/s
    RAM FPU Bandwidth (MB/s): 1029 Mbyte/s

    3_SSE
    Overall Result: 4287 CPUMarks
    ALU Result: 33181 ALUMarks
    ALU Time: 8.122 seconds
    FPU Result (overall): 44365 FPUMarks
    FPU Single Precision Result: 36510 FPUMarks SP
    FPU Single Precision Time: 9.904 seconds
    FPU Double Precision Result: 52219 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 3477 MIPS
    MFLOPS Result: 2869 MFLOPS
    RAM ALU Bandwidth (MB/s): 1035 MByte/s
    RAM FPU Bandwidth (MB/s): 1022 Mbyte/s

    Come vi sembrano?

    Questa è la storia di 4 persone chiamate Ognuno, Qualcuno, Ciascuno e Nessuno. C'era un lavoro importante da fare e Ognuno era sicuro che Qualcuno lo avrebbe fatto. Ciascuno poteva farlo, ma Nessuno lo fece, Qualcuno si arrabbiò perché era il lavoro di Ognuno. Ognuno pensò che Ciascuno potesse farlo, ma Ognuno capì che Nessuno l'avrebbe fatto. Finì che Ognuno incolpò Qualcuno perché Nessuno fece ciò che Ciascuno avrebbe potuto fare.

  6. #246
    Super Moderatore L'avatar di frakka
    Registrato
    May 2001
    Località
    Casalecchio di Reno (Bo)
    Età
    44
    Messaggi
    23,432
    configurazione

    Predefinito

    Ho avuto risultati migliori con l'ottimizzazione per le 3DNow invece che per le SSE. E' la prima volta che capita, anche in 3dmark ho risultati migliori con l'ottimizzazione per P3. Dipende da quella cosa della parallelizzazione di cui parlavate prima?

    Questa è la storia di 4 persone chiamate Ognuno, Qualcuno, Ciascuno e Nessuno. C'era un lavoro importante da fare e Ognuno era sicuro che Qualcuno lo avrebbe fatto. Ciascuno poteva farlo, ma Nessuno lo fece, Qualcuno si arrabbiò perché era il lavoro di Ognuno. Ognuno pensò che Ciascuno potesse farlo, ma Ognuno capì che Nessuno l'avrebbe fatto. Finì che Ognuno incolpò Qualcuno perché Nessuno fece ciò che Ciascuno avrebbe potuto fare.

  7. #247
    tebibyte
    Registrato
    Sep 2000
    Località
    cosenza
    Messaggi
    2,926

    Predefinito

    Originally posted by kiko


    è vero che la FPU è penalizzata nei P4 ma bisogna anche dire che un P4 con molti Mhz e bus alti sopperisce a questa mancanza.
    Ciao

    nessuno lo mette in dubbio, infatti ho solo detto ke a parità di frequenza l'FPU del P4 è decisamente + lenta di quella di PIII/K7

    dimenticavo....risolto il problema del rallentamento (eccessivo ) che si ha sotto win98/ME quando si esegue codice ottimizzato, mi ha fatto impazzire ma ci sono riuscito purtroppo i risultati che otterrete con la new version saranno di qualke cinquantina di punti + bassi ( naturalmente intendo i bench ottimizzati ) ma non fa nulla, vanno benissimo tutti i report che avete fatto finora. tnx per la collaborazione....sarete negli "special thanks" del programma



    byez

    ps. kikujiro, mi faresti un grosso favore se eseguissi i la new version ke metterò online (si spera ) entro stasera sull'XP a 1.8 GHz...


    byez

  8. #248
    tebibyte
    Registrato
    Sep 2000
    Località
    cosenza
    Messaggi
    2,926

    Predefinito

    Originally posted by frakka
    Ho avuto risultati migliori con l'ottimizzazione per le 3DNow invece che per le SSE. E' la prima volta che capita, anche in 3dmark ho risultati migliori con l'ottimizzazione per P3. Dipende da quella cosa della parallelizzazione di cui parlavate prima?

    beh dipende dall'ottimizzazione che si fa....come puoi notare, i risultati ALU (ke NON sfrutta le SSE, è codice standard IA32 ottimizzato da me....solo il codice per P4 contiene delle limitate ottimizzazioni per l'uso delle SSE2 in questo bench) sono identici, l'FPU SP è a vantaggio delle 3DNow!, mentre quello FPU DP delle SSE.....tutto quadra cmq i risultati sono praticamente identici, la differenza è solo di 30 pt



    byez

  9. #249
    pebibyte L'avatar di effector
    Registrato
    Jan 2001
    Località
    Mariano Comense (CO)
    Messaggi
    5,455

    Predefinito the 3d

    mi son perso un po' di cose...a che punto stai?

  10. #250

    Predefinito

    Originally posted by The3DProgrammer

    ps. kikujiro, mi faresti un grosso favore se eseguissi i la new version ke metterò online (si spera ) entro stasera sull'XP a 1.8 GHz...
    byez
    ok np.. spero di trovare il mio amico su ircnet però..
    intanto questi sono dei risultati con la vecchia release su un celeron tualatin @ 1620mhz:

    IA32:
    Overall Result: 4086 CPUMarks
    ALU Result: 32619 ALUMarks
    ALU Time: 8.262 seconds
    FPU Result (overall): 41042 FPUMarks
    FPU Single Precision Result: 33747 FPUMarks SP
    FPU Single Precision Time: 10.715 seconds
    FPU Double Precision Result: 48338 FPUMarks DP
    FPU Double Precision Time: 13.48 seconds
    MIPS Result: 3502 MIPS
    MFLOPS Result: 2889 MFLOPS
    RAM ALU Bandwidth (MB/s): 470 MByte/s
    RAM FPU Bandwidth (MB/s): 452 Mbyte/s

    SSE:
    Overall Result: 4322 CPUMarks
    ALU Result: 33428 ALUMarks
    ALU Time: 8.062 seconds
    FPU Result (overall): 42624 FPUMarks
    FPU Single Precision Result: 37891 FPUMarks SP
    FPU Single Precision Time: 9.543 seconds
    FPU Double Precision Result: 47358 FPUMarks DP
    FPU Double Precision Time: 3.14159 seconds
    MIPS Result: 5244 MIPS
    MFLOPS Result: 4347 MFLOPS
    RAM ALU Bandwidth (MB/s): 455 MByte/s
    RAM FPU Bandwidth (MB/s): 501 Mbyte/s

    cya

Pagina 25 di 42
prima
... 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 ... ultimo

Informazioni Thread

Users Browsing this Thread

Ci sono attualmente 1 utenti che stanno visualizzando questa discussione. (0 utenti e 1 ospiti)

Discussioni simili

  1. eccovi una piccola anteprima di CPUBench2002...
    By The3DProgrammer in forum -= La Piazza =-
    Risposte: 33
    Ultimo messaggio: 16-02-2002, 11:49
  2. finalmente windows xp beta 2
    By simoicm in forum -= Hardware generico =-
    Risposte: 20
    Ultimo messaggio: 04-05-2001, 13:43
  3. Nuova beta per cpuidle 5.6 beta 7
    By dinopc in forum -= Sistemi Operativi Windows e software generale =-
    Risposte: 6
    Ultimo messaggio: 21-04-2001, 13:44
  4. Quanlcuno ha scaricato la nuova beta di cpuidle beta 7?
    By dinopc in forum -= Overclocking e CPU =-
    Risposte: 0
    Ultimo messaggio: 18-04-2001, 16:36
  5. E' uscita la beta ufficiale di Internet Explorer 6 IEX beta
    By rocket in forum -= Sistemi Operativi Windows e software generale =-
    Risposte: 3
    Ultimo messaggio: 25-03-2001, 14:32

Tags

Regole d'invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
nexthardware.com - © 2002-2022