Test:
Dual Opteron 246
Vi har i den senere tid testet flere Opteron-prosessorer, men når alt kommer til alt, er det å teste flere Opteron-prosessorer på én gang det som virkelig er spennende. Vi har satt et par av AMD sine raskeste prosessorer på ett enkelt hovedkort.
Side 1: Innledning
Å kjøre single Opteron-prosessorer er i det lange løp i grunn ikke særlig spennende. Vil man ha et 64-bits basert system, men bare har råd til én prosessor er det Athlon 64 (FX) som er det naturlige valget. Langt på vei kan man si at Opteron-prosessorene er laget utelukkende for flerprosessor-systemer (SMP), og at 100-serien er en prosessor som havner mellom barken og veden.
Hva er egentlig hensikten med å presse inn to eller flere prosessorer på et hovedkort?
I serversammenheng er fordelene ganske åpenbare. Med tanke på at slike maskiner gjerne kan håndtere forespørsler fra et ti- eller hundretalls maskiner på en gang. Når man har to prosessorer, kan de jobbe samtidig med den samme køen av forespørsler. På den måten kan man få unna arbeidet praktisk talt dobbelt så raskt som om man bare hadde hatt én CPU. Man får rett og slett en langt høyere multitaskingsevne, ved at man kan gjøre flere operasjoner på en gang.
En annen måte man kan utnytte flere prosessorer på er å la de samarbeide om en og samme oppgave, og på den måten korte ned tiden det tar å gjennomføre denne oppgaven. Her kommer også servere inn i bildet, men gjerne først og fremst tunge arbeidsstasjoner. Noe av det beste eksempelet som finnes på denne typen oppgaver 3D-rendering. Kanskje du har sett filmer som Animatrix eller Final Fantasy? Begge disse filmene kan sees på som banebrytende ved å viske ut forskjellene mellom ekte film og animasjon. For å få til slik realisme kreves det enormt med detaljer, og enda større mengde regnekraft. La oss for eksempel si at en enkel 3D-scene i en gitt film vil ta 24 timer å rendere med et system med én prosessor, så ville man i praksis nesten halvere tiden med to prosessorer. Videre kan man legge på to prosessorer til, og på den måten få tiden ned til 6 timer, og legger man på enda 4 prosessorer kan denne scenen som i utgangspunktet tok et døgn å rendere, bare ta rundt 3 timer å gjøre ferdig.
Det er dog uansett viktig å huske på at når det gjelder flerprosessorsystemer så må man glemme gammel barneskolelærdom med at 1+1=2. To prosessorer er ikke nøyaktig dobbelt så raskt som én prosessor. Dette forårsakes av flere faktorer, blant annet latency og overhead i administreringen av flere prosessorer. En tommelfingerregel sier at man utnytter 100% av den første prosessoren og 60-80% av hver prosessor man legger på, noe avhengig av hva slags system man bruker.
Det er nå sikkert mange som lurer på hvorfor man da skal fortsette å lese en test av et system som først og fremst er beregnet på servere og tunge arbeidsstasjoner, for du sitter kanskje ikke på noen av delene? For privatpersoner er dual mer en opplevelse enn noe annet. Har man først opplevd å jobbe med en dual-maskin over tid, er det få som ønsker å gå over til single-systemer igjen.
Litt nysgjerrig? Les videre da vel!
En stor takk til AMD som lånte oss CPU og Corsair som har levert minnemodulene til vår Opteron-lab.
Side 2: Ny måte å tenke dual-systemer på
Flere fordeler med SMP
Undertegnede prøvde for en stund siden å forklare en venn hvorfor han burde velge et dual-system fremfor et single-system. Jeg satt derfor i gang WinRAR til å pakke ned en stor menge filer. Deretter åpnet jeg PhotoShop og satt i gang med å kjøre tunge filtre på noen virkelig store bilder. Resultatet var at PhotoShop praktisk talt jobbet upåvirket av at WinRAR slukte ressursene til den ene prosessoren. Uttrykket til kameraten var ikke til å ta feil av: Dette var virkelig noe som imponerte!
Hensikten med flere prosessorer er ikke at du skal tenke på at du sitter med en dual-maskin, men at du skal slippe å tenke på begrensningene på systemet. Det å kjøre full virus-scan og spille "Generals" samtidig er ikke noe problem. Et forsøk på dette på et single-system kan få fatale følger for din suksess i spillet.
Ny måte å tenke dual-systemer på
Vi har i vår tidligere artikkel om Opteron 242 tatt en nærmere titt på hvordan AMD med sin "Hammer"-serie med prosessorer har implementert en helt ny måte å tenke PC på. Det bør da heller ikke komme som noen overraskelse at man også tenker nytt på dual-systemene.

Dette er en noe forenklet skisse av hvordan AMDs forrige dual-implementasjon (760MPX) fungerte. Legg særlig merke til at begge prosessorene må kjempe om én enkelt minnekanal.
Intel har også sin type implementasjon av dual. Grunnprinsippene ser her ganske like ut, men Intel har ikke separate kommunikasjonskanaler for hver prosessor ned til nordsiden av brikkesettet. Dette betyr at begge prosessorene i tillegg til å måtte kjempe om minnebussen, også må kjempe om FSB-en.

Når det gjelder dual Opteron-systemer må vi gå litt mer inn på prinsipper, fordi det finnes flere forskjellige typer implementeringer av dual Opteron. Hovedpoenget er at prosessorene i langt større grad kommuniserer direkte mellom seg i mellom. Dette prinsippet i seg selv er en svært stor fra tidligere implementasjoner. Dette gjør også at man i prinsippet på en enkel måte kan skalere ut Opteron-systemer med svært mange prosessorer. I tillegg har alle prosessorene i systemet sin egen minnekontroller, som igjen har sitt "private" minne med en egen minnebuss med doble minnekanaler.
Studerer man en slik implementasjon, kan den kanskje høres noe tungvint ut - særlig med tanke på at en prosessor kan ha fylt opp sitt eget minne mens den andre har masse ledig kapasitet. Dette er enkelt løst ved at begge prosessorene kan snakke med hverandres minne hvis det skulle være nødvendig. Dette medfører naturlig nok en liten latency-straff, men med de integrerte minnekontrollerne og HyperTransport-kanalene er dette likevel ikke noe stort problem.
Som en konsekvens av at prosessorene kan snakke med hverandres minne, har enkelte implementasjoner av denne dual-teknologien rett og slett kuttet ut den direkte minnetilgangen til den ene prosessoren. Dette har sine fordeler og ulemper. Ulempen er selvsagt at den ene prosessoren må innom den andre hver gang den etterspør data, og man får effektivt bare halve minnebåndbredden fordi man bare har to i stedet for fire minnekanaler. I praksis har dette dog svært lite å si, og tester utført på konsekvensen av dette viser at straffen i ytelsen er tilnærmet lik null.
Fordelen er først og fremst at det blir langt billigere hovedkort av slikt, og ikke minst at det tar langt mindre plass på hovedkortet. Hvis man skal ha egne dedikerte kanaler til hver prosessor må man ha minnebanker på hvert sitt sted på kortet, og dette tar fort ganske mye plass. Kort med slike implementasjoner er som oftest basert på E-ATX eller større, men hvis man kutter ut tilgangen til den ene prosessoren kan man enklere presse det inn på et ATX-kort.
En annen fordel er at man ikke trenger mer enn to minnemoduler. For å utnytte doble minnekanaler trenger man to minnemoduler, og hvis man skulle hatt to doble minnekanaler ville man naturlig nok hatt behov for 4 eller flere kanaler. Fire minnemoduler høres kanskje ikke så ille ut, men med tanke på at man trenger ECC/REG-moduler for å få et Opteron-system til å fungere blir det ganske ille. Vi fant i skrivende stund ingen DDR333 ECC/REG-moduler på mindre enn 512 MB, og skal man ha fire av disse blir det fort svært dyrt!
Som man også kan se på bildet over så er arkitekturen på Opteron-systemene klargjort med egne dedikerte PCI-Express-kanaler. Dette er enda ikke implementert i noen løsninger, men det vil neppe gå mange månedene før vi kommer til å se at PCI-Express kommer til å innta markedet med full storm.
Side 3: MSI K8T Master2
MSI K8T Master2

Vi har i første om gang tatt en nærmere
titt på hovedkortet MSI K8T Master2, som er basert på
VIA
K8T800-brikkesettet. Dette kortet er trolig det som er
det mest aktuelle for entusiastmarkedet med tanke på
at det er relativt rimelig og ikke minst at det følger
vanlig ATX-standard, noe som betyr at man kan bruke nesten
et hvilket som helst vanlig kabinett.

Ser man på utgangene på kortet ser man at det rent funksjonsmessig er svært strippet. Mange vil trolig reagere kraftig på at det bare er to USB-porter og ingen utganger for lyd. Det er heldigvis ikke noe å bekymre seg over. Kortet leveres med en egen bracket med to ekstra USB-porter og ut/inngang for lyd. Kortet er også utstyrt med en Gigabit LAN-løsning, noe som vi i aller høyeste grad ønsker velkommen. Det vi derimot savner er FireWire-støtte.

Kortet er utstyrt med VIA sin nyeste sørside, VT8237, og implementert i dette finner vi støtte for både P-ATA og S-ATA. Selve kortet er utstyrt med to P-ATA og to S-ATA-kontakter på kortet, og selvsagt mulighet til å kjøre RAID. Til bruk i servere kan man riktignok savne integrerte SCSI-løsninger, men særlig Raptor-løsningene fra Western Digital gjør savnet for SCSI langt mindre. Støtte for SCSI kan uansett monteres.
Det som derimot er et stort savn er 64-bit PCI-slotter. Dette er nærmest en absolutt nødvendighet på high-end workstation/server-kort. Dette begrenser blant annet muligheten til å utnytte SCSI på en god måte.

Kortet kommer bundlet med to CPU-kjølere. Dette er riktignok med to vidt forskjellige patenter og festemetoder. Viften på den ene kjøleren er langt mindre enn den andre, og spinner med noe høyere hastighet. På denne måten har MSI på en glimrende måte klart å kaste inn vifter med forskjellig frekvensområde rent lydmessig, noe som gjør at oppfattelsen av støyen blir langt høyere. Dette er vi ikke særlig glad for.
Årsaken til at man har lagt med to forskjellige kjølere er at den ene prosessorsokkelen sitter uvanlig nær AGP-slotten, og den ene viften er derfor designet på en måte slik at man øker avstanden mellom selve ribben og skjermkortet så mye som mulig. Denne løsningen passer riktignok ikke med de ferdigmonterte festeanordningene man finner på kortet, og man må faktisk demontere disse før man kan feste viften. Forøvrig er det ikke mulig å bruke originale Opteron-kjølere på dette kortet fordi MSI har valgt en festeordning med fire skruer, i motsettning til standardløsningen for Opteron med to skruer og et fast sokkelfeste. Hvorfor gjøre det enkelt når man kan lage det vanskelig?
Når det gjelder BIOS-en på kortet
er det noe av det minst inspirerende vi har sett noen gang.

Dette var alle innstillingsmulighetene kortet
hadde for minnet. Det er f.eks. ikke mulig å stille
timingen, som CAS, RAS etc. Det er faktisk ikke en gang mulig
se hva som er gjeldende innstillinger i BIOS. Dette er skuffende!

Legg merke til forskjellen i hastighet på CPU-viftene.
Det som derimot er svært positivt er temperaturen og viftestyringen på systemet. Temperaturen på kortet stiger aldri til noe som kan anses som kritisk.
Når man skrur på systemet får man mest lyst til rømme rommet fortest mulig. Støyen er nærmest uutholdelig, og minner svært mye om støynivå man kan oppnå med U1 serverrack, for de som har opplevd noe slikt. Etter ca ett minutt skjer det derimot noe svært positivt: Støyen fra kabinettet faller markant, og det blir nesten stille. Da er det viftestyringen på kortet som finner ut at prosessorene ikke blir noe særlig varme, og da er det ingen grunn til å kjøre hastigheten på viftene på fullt. Vi har under testingen av dette systemet enda ikke opplevd at hastigheten på viftene skrus opp igjen - heldigvis.
Side 4: Testoppsett
DDR333 vs DDR400
Opteron er i utgangspunktet utstyrt med en minnekontroller som støtter DDR333-minne. Dette er riktignok "kun" en offisiell støtte, og det er kjent at støtten for DDR400 vil komme så snart DDR400 ECC/REG-moduler blir bedre tilgjengelig (disse fantes ikke ved lanseringen av Opteron i april i år).
Vi forsøkte å putte et par DDR400
ECC/REG-moduler inn i testsystemet for å se hvordan
det reagerte på noe slikt.

Reaksjonen fra systemet var kontant: DDR400 fungerte uten noen form for problemer. Dessverre var det ikke mye glede vi fikk av å gå over til DDR400 fremfor DDR333 fordi timingen på disse modulene var langt dårligere enn det som DDR333-modulene klarte. Resultatet var at vi tidvis opplevde et ytelsestap ved å bruke DDR400 fremfor DDR333. Som en konsekvens at vi ikke kunne presse timingen i BIOS, fikk vi heller ikke sett hvordan systemet ville yte med bedre timing. Vi har derfor benyttet DDR333-minnehastighet i denne testen.
Testsystem
|
Testkonfigurasjon
|
|
|
Maskinvare
|
|
|
Hovedkort
|
MSI K8T Master2
ASUS SK8N (nForce3) ASUS A7N8X Deluxe rev 2.0 (nForce2) Intel D850EMV2 (i850E) (P4 3,06) ABIT IC7-G Canterwood Intel referanse i875 Canterwood |
|
Prosessor
|
AMD Athlon 64 FX-51
(2,2 GHz) DDR400
AMD Opteron 246 2,0 GHz DDR333 AMD Opteron 242 1,6 GHz DDR333 AMD Athlon XP 3200+ Barton 400 MHz FSB Pentium 4 3,06 GHz HT 533 MHz FSB Pentium 4 3.0 GHz 800 MHz FSB |
|
RAM
|
2 x 256 MB Corsair
XMS3200 DDR SRAM CL 2 TwinX
Samsung PC1066 RDRAM (2x256 MB) 2 x 512 MB Corsair PC2700 DDR ECC REG 2 x 512 MB PC3200 REG |
|
Skjermkort
|
NVIDIA GeForce4 Ti4400
|
|
Harddisk
|
7200 rpm ATA100
|
|
Programvare
|
|
|
Operativsystem
|
Windows XP Professional
SP1
|
|
Applikasjoner
|
CPUMark99
SiSoft Sandra 2003 Comanche 4 3DMark2001 SE Build 330 UT2003 ScienceMark 2.0 Cinebench 2000 Lame 3.91 Aquamark Super Pi PC Magazine Winstone Virtual Dub/DivX PS: Sjekk ut vår benchmark-guide for mer informasjon og nedlastning av testprogramvare. |
|
Drivere
|
K8T:
VIA Hypervision 4-in-1 v4.49 nForce3: nForce2 All-in-one v2.45 nForce2: nForce2 All-in-one v2.02 i845/i850: Intel Application Accelerator v2.2 Intel Chipset Utility 4.0.1003 Felles: Detonator 43.45 |
Det er helt sikkert noen som kraftig vil reagere på at vi i denne testen ikke benytter en del Linux-tester, særlig i forbindelse med serverapplikasjoner. Som vi har sagt før så jobber vi med å utarbeide testrutiner for Linux, men for at dette skal blir gode tester, vil det ta noe tid.

Som vi ser fra CPU-Z blir prosessorene korrekt gjenkjent, og vi ser at begge prosessorene er tilstede. FSB-en ligger litt over standard frekvens, noe som betyr at begge prosessorene blir klokket 4,7 MHz høyere enn det de egentlig skal være.
Vi nevner også at vi tidligere har gjort et forsøk på å sette en Opteron 146 i spann med Opteron 246 i denne artikkelen.
Side 5: Ytelse - syntetisk
Ytelse - syntetisk

En av de mer spennende aspektene ved Opteron, og ikke minst dual-opteron er responstiden for minnet (latency), altså tiden det tar fra prosessoren sender en forespørsel til minnet til den får svar på sin forespørsel.
Som vi nevnte tidligere har ikke MSI K8T Master2
direkte tilgang til minnet for mer enn én prosessor,
og den andre prosessoren må gå gjennom den andre
prosessoren for å få tilgang til minnet. Dette
medfører en liten forsinkelse siden man får et
ekstra skritt å gå. Vi ser resultatet av denne
forsinkelsen i forhold til et single Opteron-oppsett, men
det er likevel en særdeles lav tid sammenlignet med
andre systemer. Legg særlig merke til forskjellen i
forhold til et system med to Athlon MP 2800+ på et hovedkort
basert på 760MPX.

Når det kommer til rå minnebåndbredde ser vi at resultatet også er identisk med et Opteron 246-system.
Her er det også svært spennende å se på økningen i båndbredde i forhold til 760MPX. Vi har tidligere nevnt at 760MPX gjør det dårlig i spill mye grunnet den dårlige minnebåndbredden, og sammenligner vi med dual Opteron 246 så ser vi at båndbredden er nesten tre ganger så høy. Legger vi på at latencyen som vi så på over også er langt bedre på Opteron så kan vi se en antydning til at Dual Opteron 246 virkelig også kan ha noe for seg i spill.
Side 6: Ytelse - syntetisk (forts)
Ytelse - syntetisk (forts)

I SiSoft Sandra 2003 ser vi igjen den enorme forskjellen i minnebåndbredde mellom Opteron og Athlon MP. Sandra har riktignok fått fram det handikappet K8T har med ekstra latency ved at hver prosessor ikke har egne kanaler, noe som gjør at båndbredden på Dual Opteron 246 ligger ganske betydelig langt bak singel Opteron 246.

Når det gjelder syntetisk CPU-ytelse er de rene dual-systemene totalt overlegne, selv om Pentium 4-prosessorene med sin Hyper-Threading prøver å yppe seg litt.

SiSoft Sandra har nå også kommet i en 2004-versjon, hvor man skryter av å ha full støtte for AMD64-instruksjonene. Vi sammenlignet 2003 og 2004-versjonene både med Windows XP og Windows XP 64 Bit Edition build 1069 (ikke den samme versjonen vi brukte i Athlon 64 FX-51-testen). Som vi ser besitter disse 64-bits-prosessorene et betydelig ubrukt potensial.

I den syntetiske CPUMark 99 kommer dual-systemene ikke særlig godt ut, først og fremst grunnet manglende SMP-støtte i denne testen. Resultatet er uansett helt i toppsjiktet.
Side 7: Ytelse - Applikasjonsbasert
Ytelse - applikasjonsbasert

I 3DMark 2001 får systemet for første gang bevist at det virkelig har overkommet mesteparten av problemene med båndbredde som 760MPX-brikkesettet har besittet, og vi ser at dual Opteron 246 yter helt på høyde med singel-versjonen. En liten negativ forskjell er det riktignok, men den er ikke betydelig.

Det man først og fremst bør legge merke til er hvilken økning Raytracing med to prosessorer gir. En økning på 70% er i aller høyeste grad noe man ønsker velkommen når man driver med 3D-animasjon. Legg også merke til at denne typen oppgaver er noe som også Pentium 4 får en betydelig boost av hvis man har Hyper-Threading aktivert, men forskjellen er ikke i nærheten av så stor som med to fysiske prosessorer.

KribiBench er en 3D-benchmark som i utgangspunktet er optimalisert for Pentium 4. Her tar dual Opteron en gedigen ledelse, særlig i Office-testen, med en ytelsesbedring på 91% i forhold til én enkelt Opteron 246!

ScienceMark 2.0 er svært CPU-intensivt, og bryr seg fint lite om minnetilgangen. Som et resultat av dette ser vi at Athlon MP 2800+ kommer svært bra ut av denne testen, og viser styrken til denne plattformen innenfor svært CPU-aktive prosesser.

SuperPi er ikke optimalisert for dual-systemer, og vi ser et lite ytelsestap i forhold til single-systemet.
Side 8: Ytelse - applikasjoner
Ytelse - applikasjoner

Vi begynte i vår test av Athlon 64 FX-51 å bruke en patch utgitt av Microsoft slik at Windows Media Encoder skulle gjenkjenne egenskapene til enkelte prosessorer korrekt. Dette gav en betydelig forbedring i resultatet for Multimedia Content Creation 2003. Når vi installerte denne patchen på dette dual-oppsettet så ville ikke denne testen gjennomføres på korrekt måte, og vi fikk kun resultater uten patchen installert. Vi har derfor besluttet å droppe bruken av denne patchen i alle tester frem til denne blir en del av Winstone-installasjonen. Som vi ser blir et dual Opteron 246-system ganske overlegent i Multimedia-testen, mens resultatet i Business Winstone er ganske skuffende. Dette kommer først og fremst at Business-testen ikke bruker programmer som optimalisert for flere prosessorer.

Lame er ikke dual-optimalisert, og heller ikke særlig avhengig av båndbredde. Resultatet er at forskjellen mellom et single- og dual-system blir lik null. Det er likevel viktig å huske på at man med et dual-system i langt høyere grad kan holde på med andre oppgaver samtidig når man gjennomfører en slik koding i full hastighet.

Valget av VirtualDub til DivX-encoding er trolig ikke det beste med tanke på DivX-encoding, med tanke på at dette programmet ikke er optimalisert for SMP slik som f.eks. XMPEG. Resultatet er at forskjellen mellom dual og single blir ikke-eksisterende.

Når vi nå går over på spillene så ser vi igjen hvilke enorm forskjell det har blitt i ytelsen på slike applikasjoner på denne nye dual-plattformen i forhold til gamle 760MPX. Det er rett og slett bare å ta av seg hatten for dette.

Vi ser igjen at dual Opteron gjør det glimrende i spill. Av en eller annen grunn gjorde faktisk Opteron-systemet det her bedre enn Athlon 64 FX-51. Siden det her er skjermkortet som legger inn den største begrensningen antar vi at dette rett og slett er unøyaktigheter i testprogrammet, men det kan også nevnes at det brukes et annet brikkesett.

Også i Unreal Tournament ser vi at dual-systemene holder helt følge med singel-systemene når det gjelder ytelse. Legg særlig merke til forskjellen ned til dual Athlon MP 2800-systemet.
Side 9: Overklokking
Overklokking
Dual-oppsett har aldri vært den typen systemer som har vært mest glade i overklokking, men vi gjennomførte likevel et lite forsøk for å se hvor langt vi kunne presse systemet.

208,5 MHz var det høyeste vi kom før vi møtte på en uoverkommelig vegg av ustabilitet. Det skal da uansett nevnes at 207,5 MHz var det høyeste vi kom med et helt stabilt system.
Denne overklokkingen på 4% har naturlig nok ikke den helt store innvirkningen på ytelsen på systemet, men vi klarte i det minste å øke vårt resultat i CPUMark 99 fra 155 til 165 poeng :-)
Konklusjon: Overklokking av dual-systemer er ikke måten å oppnå svært høy ytelse uten at man i stor grad er villig til å lirke på kravene til stabilitet.
Side 10: Konklusjon
Konklusjon
Dette er et system undertegnede har ventet på siden jeg for første gangen satte mine hender på et dual-system. En PC med flere prosessorer som samtidig yter godt i spill. Dual Opteron er rett og slett en "dream come true" for alle hardware-fantaster med god råd. Når Windows 64-bit med tid og stunder også blir lansert, vil dette bli en enda mer ettertraktet løsning.
Dual Opteron er et system med få, om noen, større svakheter, og har man penger nok så er det ingen vi ikke kan anbefale å kjøpe noe slikt til, enten det gjelder bedrifter eller privatpersoner.
Problemet er uansett prisen, iallfall så lenge vi snakker om privatpersoner. Opteron 246-prosessorene koster i skrivende stund 8-9000 kroner per stykk. I tillegg koster hovedkortet godt over 2000 kroner, da har man enda ikke kommet til minne som også blir noen tusenlapper. Det blir fort mye penger av slikt!
Vi konkluderer med at dette er et vanvittig morsomt leketøy, men som for de fleste dessverre forblir en uoppnålig drøm. Et alternativ kan selvsagt være å prøve å se om man kan bruke et par 100-serie-prosessorer i dual, eller kanskje satse på de litt lavere klokkede Opteron-prosessorene.
Men det er likevel håp: Innen nyåret kommer så vil trolig nye Opteron-prosessorer komme seg inn på markedet, og da samtidig presse prisen på dagens prosessorer noe ned, slik at prisen på et dual Opteron system går fra "vanvittig dyrt" til "dyrt".
|
+
|
| + Meget
god ytelse i alle typer applikasjoner + Gode multitaskingsegenskaper + Blir ikke spesielt varm |
|
-
|
| - Sv&;rt
dyrt - Uortodoks kjøleløsning - Tidvis støyende |
