Un test de performance EPIA 1.8G vs Athlon 1.5G

Je vous propose la comparaison suivante réalisée entre la carte Epia 1.8G et mon Athlon 1.5G (1800+) ; Nous avons comparé ces machines en terme de bogomips qui reste quelque chose d’assez subjectif, j’ai donc effectué un test sur ces deux machine à  l’aide de l’outil lmbench3. Le test est plutot long (4 heures) mais il ya beaucoup de résultats. Voici les premiers :

  • athlon | kernel / freq / tlb page / cache line | 2.6.18 / 1513Mhz / 32 / 64o
  • epia… | kernel / freq / tlb page / cache line | 2.6.22 / 1781Mhz / 64 / 64o
  • p4….. | kernel / freq / tlb page / cache line | 2.6.18 / 1700MHz / 55 / 128o

Process, temps en microsecondes (le plus petit est le mieux) :

  • athlon | null call / null IO / open-close / slct TCP / fork / exec prog / sh prog | 0,3 / 0,47 / 4,67 / 35,5 / 205 / 1398 / 8236
  • epia… | null call / null IO / open-close / slct TCP / fork / exec prog / sh prog | 0,1 / 0,31 / 2,42 / 13.0 / 256 / 1173 / 7213

La carte epia offre un gain non négligeable sur l’ensemble des tests, hors mis le fork ; l’exec de programme ou sh peut être faussé par le fait que le filesysteme de l’epia est sur usb. Le kernel plus récent peut aussi jouer en la faveur de l’epia.

Calculs entiers (en nano secondes – le plus petit est le meilleur) :

  • athlon | calculs bits / addition / mult/ div / modulo | 0,69 / 0,02 / 2,83 / 28,9 / 28,2
  • epia… | calculs bits / addition / mult/ div / modulo | 0,56 / 0,02 / 0,61 / 29.0 / 30,1
  • p4….. | calculs bits / addition / mult/ div / modulo | 0,30 / 0,01 / 8,37 / 43,9 / 37,1

Hors mis un point étrange sur la multiplication de l’athlon, les l’epia et l’athlon se valent, la différence de fréquence justifiant les écarts. Le P4 performe en addition / masquage mais se trouve plutôt moyen sur les calculs plus complexes.

Calculs flottant -float- ( en ns – le plus petit est le meilleur) :

  • athlon | calculs addition / mult/ div / bogo | 2,7 / 2,9 / 16,3 / 15,8
  • epia… | calculs addition / mult/ div / bogo | 3,9 / 4,2 / 40,8 / 51,4
  • p4….. | calculs addition / mult/ div / bogo | 2,9 / 4,2 / 25,5 / 25,4

L’unité de calcul en virgule flottante de l’athlon semble beaucoup plus efficace que celle de l’epia surtout pour les divisions.

Calculs flottant -double- ( en ns – le plus petit est le meilleur) :

  • athlon | calculs addition / mult/ div / bogo | 2.72 / 2.74 / 47,5 / 15,6
  • epia… | calculs addition / mult/ div / bogo | 3,90 / 4,47 / 40,8 / 51,4
  • p4….. | calculs addition / mult/ div / bogo | 2,90 / 4,20 / 25,5 / 25,4

Il semble que l’unité de traitement de l’epia calcule en double comme en float (comme le P4) alors que l’athlon optimise certaines partie dans le cas de float. Il est intéressant de prendre ceci en compte lorsque l’on calcul la puissance de calcul par watt par exemple car cet exemple illustre que l’architecture interne du processeur peut avoir un impact fort sur la vitesse de calculs, surtout dans le cas de float/doubles.

Latence des communications ( en microseconde – le plus petit est le mieux) :

  • athlon | context switch / AF UNIX / UDP / RPC-UDP / TCP / RCP-TCP / TCP-CON | 2,18 / 11,6 / 18,0 / 35,1 / 59,0 / 43,2 / 89
  • epia… | context switch / AF UNIX / UDP / RPC-UDP / TCP / RCP-TCP / TCP-CON | 0,90 / 8,55 / 10,7 / 16,5 / 13,2 / 20,1 / 48

On retrouve ici les performance système bien meilleures pour l’epia, mais ceci peut toujours venir du noyau plus récent et compilé spécifiquement pour le processeur.

Latence sur les fichiers ( en microseconde – le plus petit est le mieux) :

  • athlon | 0k create / 0K delete / 10K create / 10K delete / Page Fault | 30,1 / 32,1 / 119,2 / 58,0 / 4,17
  • epia… | 0k create / 0K delete / 10K create / 10K delete / Page Fault | 16,0 / 13,5 / 123,4 / 27,3 / 1,96

Résultat très intéressant car l’epia a un file système sur usb qui, comme nous l’avons vu est peu performant. Malgré tout les performance sont meilleures que sur l’athlon, donc là  encore la performance “système” est meilleure.

Débit avec la mémoire ( en MB/s – le plus grand est le mieux) :

  • athlon | Mmap reread / bcopy libc / bcopy manuel / mem read / mem write | 554 / 240 / 278 / 617 / 385
  • epia… | Mmap reread / bcopy libc / bcopy manuel / mem read / mem write | 601 / 408 / 406 / 565 / 980

Très bons résultats pour l’epia, sauf en lecture mémoire où il est équivalent. La technologie mémoire n’est pas la même : DDR vs DDR2 il n’y a rien d’étonnant à  ce que l’epia performe, et c’est une très bonne nouvelle pour les performances.

Latence mémoire ( en ns – le plus petit est le mieux ) :

  • athlon | cache L1 / cache L2 / Main memory / random | 2.04 / 13.8 / 174 / 422
  • epia… | cache L1 / cache L2 / Main memory / random | 3.36 / 16.2 / 080 / 320
  • p4….. | cache L1 / cache L2 / Main memory / random | 1.21 / 29.2 / 151 / 284

Le cache de l’Athlon semble plus performant mais l’accès hors cache de l’epia est bien meilleur. L’architecture cache du C7 est sans doute moins évoluée (normal si l’on veut consommer moins) mais la techno mémoire plus récente permet un gain qui sera utile. Le P4 offre visiblement un meilleur accès aux cache L1 et à  la mémoire que l’athlon pour une technologie similaire.
En conclusion, l’objet de ce test n’était pas de comparer un Athlon avec un C7, mais plus simplement de comparer ma machine actuelle avec sa future remplaçante. Mon inquiétude était que celle orientée basse consommation d’énergie ait renié sur les performance et que la fréquence indiquée ne soit qu’un leurre marketing. Même si sur certains point on sent bien que l’architecture internet et plus simpliste que sur un composant bien plus gourmand en énergie les résultats, au global sont à  la hauteur de mes attentes.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.