Val á örgjörva eftir verkhlutverkum: Virtúalískan, AI, hávaxtareikningur (HPC) og gagnagrunnar
Virtúalískan og skýja-verkhlutverk: Fjöldi kjarna, PCIe-línur og inntak/úttakshraði
Þegar kemur að velja örgjörva (CPU) fyrir virkni í vélrænum umhverfum og skýjauppsetningar er raunveruleg þörf á að finna góða jafnvægi milli fjölda kjarna og inntaks/úttaksgetu sem þeir bjóða upp á. Fleiri kjarnar hjálpa örugglega til við að setja fleiri vélrænar vélar (VM) á eina líkamlega vélinn, þar sem hver vélræn vél þarf sínar eigin útreikningsþráða til að keyra slétt. En hér er staðurinn þar sem hlutirnir geta farið úrskeiðis ef við erum ekki varkár. Aðeins að hafa margar kjarnar er ekki nóg ef móðurplatan hefur ekki nægilega PCIe 5.0-línu í gegnum sig. Flestir nútíma vélræn stýrikerfi (hypervisor) krefjast í raun að minnsta kosti 128 línum til að meðhöndla bæði hröð NVMe-gagnageymslukerfi og GPU-tengingar samtímis. Án viðeigandi inntaks/úttaksbandbreiddar munu notendur taka eftir þeim óþægilegu dvalatímum sem koma upp á þegar þeir reyna að flytja vélrænar vélar um. Og ekki skyldum við gleyma minnisrásunum heldur. Að velja átta-rásaruppsetningu gerir allan muninn þegar keyrt er áþreifandi gagnagrunnsforrit samhliða venjulegum reikniverkum, þar sem það kvarðar á því að mismunandi ferlar berjist ekki um takmarkaðar auðlindir.
AI- og HPC-verkhlutir: Latens í einum þráð, minnisbandbreidd og hröðun á FP64/INT8
Þegar kemur að AI-þjálfun og þessi erfðu HPC-vinnuverk, leggja þau í raun mismunandi álag á örgjörvur. Samhliða vinnuskipulagningin notar örugglega vel fyrir sér margkjarna uppsetningar, en það er samt annað stórt vandamál sem tengist einstrengja dvalatíma og sem er mjög mikilvægt fyrir fyrirvinnsluferli. Tökum til dæmis BERT-gerðirnar – ef hver kjarni tekur lengri tíma en 3 nanósekúndur að svara, minnkar hópavinnsla um rúmlega 22%. Og ekki byrjið að tala við mig um minnisbandbreidd. Munurinn á kerfum er ótrúlegur. Keyrið nokkrar HPC-símulatorkenningar og horfið hvað gerist: þessi vélar með 850 GB/s bandbreidd vinna gegnum reikninga á vökvaeiginleikum tvöfalt hraðar en þær sem eru takmarkaðar við 400 GB/s. Sérstakar FP64-einingar hjálpa mjög við vísindaleg módelldráttartölvuverk, en INT8-aðgerðir eru frábærar til að gera ályktunarvinnuverk fljótari. Framleiðendur sem sleppa þessum eiginleikum muna að AI-þjálfun þeirra taki um 40% lengri tíma samkvæmt MLPerf-prófunum. Slíkur tímaafsláttur safnast hratt saman í rannsóknamiðlum þar sem hver klukkustund telur.
Viðskiptagagnagrunnar: Af hverju er ECC-stöðugleiki, skyndiminnisstærð og minnisbúnaðarlatensí miklu mikilvægri en fjöldi kjarna
Þegar kemur að viðskiptagagnagrunnum er stöðugleiki miklu mikilvægri en einfaldur hraði. ECC-minni spilar lykilhlutverk í því að koma í veg fyrir þá ósýnilegu gagnatillaganir sem við sjáum aldrei á undan. Hugsum bara um hvað gerist þegar ein bita snýst í minnisgeymslunni. Samkvæmt rannsóknum frá Ponemon árið 2023 getur þessi tegund villu leitt til mjög mikilla endurheimtusjóða, um það bil 740.000 dollara. Stór L3-minnissvæði með að minnsta kosti 60 MB geta minnkað biðtíma því þau halda algengum gögnum rétt á sjálfum chipsinu. Þetta gerir OLTP-fyrirspurnir um það bil 30% hraðari en í kerfum með minni minnissvæðum. Og hér er eitthvað áhugavert sem enginn vantar: að bæta of mörgum örgjörvukernum í kerfið getur raunverulega hælt því niður. Próf í MySQL sýndu að tölvur með 32 kernum tóku um það bil 15% lengri tíma til að klára viðskipti en vélar með aðeins 24 kernum, allt vegna þessara ákaflega óþægilegu NUMA-vandamála. Fyrir alla sem vinna með rauntíma-gagnagreiningu er miklu mikilvægri að fá minnisviðbrögð undir 80 nanósekúndur en einfaldlega telja fjölda kerna sem eru inni í örgjörvunum.
Gagnvirkt og tæknilegt starfsbyrjun: Myndvinnsla, myndskurður og ímyndun
3D-myndvinnsla og vísindaleg ímyndun: Ímyndun með Threadripper Pro, Xeon W og EPYC – raunveruleikar á afköstum
Að búa til háskilvörðu 3D-myndræningar og keyra flókna vísindaleg staðfesta ákvarðar í raun margvirkni tölvuhringa á marka þeirra. Vinnustöðvaforritunarhringar þurfa að finna fín jafnvægi milli fjölda kjarna sem þeir innihalda og hversu hratt gögn ferðast í minni. AMD Threadripper Pro stendur út hér með áberandi uppsetningu á 64 kjarna og stuðning við fjórar rásir af DDR5-minni. Fyrir þá sem vinna með staðfestur sem byggja á endanlegu frumugreiningu er mikilvægt að halda góðri FP64-aðstöðu. 12-rása minniskerfi EPYC-forritunarhringsins lækkar bottlháls um rúmlega 43% miðað við kerfi með aðeins átta minnirásir. Þegar kemur að geislastöðvunaraðgerðum hefur Threadripper Pro áframhaldandi áfrýjun vegna stærri L3-minnisupploga. Á hinn bóginn heldur Intel Xeon W-raðin fast á sviði einþræðra CAD-forrita þar sem snjallheit er mikilvægst. Flest hugbúnaðarforrit sem nota líkamsfræðilega myndræningu skala beint við fjölda tiltækra kjarna, sem þýðir að að fara yfir 32 kjarna verður næstum nauðsynlegt ef listamenn vilja minnka myndræningartíma frá nokkrum klukkustundum til aðeins mínútna. Hitastjórnun er einnig stór áhyggjuefni. Þegar lengri reikningsferli í sjálfgefinn vökvastreymi eru keyrðir getur hitasafnun alvarlega takmarkað hvað þessi öflug kerfi geta gert með tímanum, svo væskukæling er ekki lengur bara kynnlíkleg, heldur er hún í raun nauðsynleg fyrir alvarlega vinnustöðvauppsetningar.
Myndbandaredigering og -kóðun: Áhrif Quick Sync, AVX-512 og sameinaðrar minniskerfisarkitektúru á val á örgjörvum
Núna í dag leggja flest myndbandaredigeringarstillingar mikla áherslu á að fá sléttar rauntíma forskoðanir en einnig á að hræða þær langu útsetningarferli. Taktu til dæmis Quick Sync-tækni Intel – hún gerir því mögulegt fyrir grafíkkort (GPU) að vinna H.265-kóðun, sem þýðir að útsetning á 4K-tímabilum tekur um 70% minna tíma en ef aðeins hugbúnaðarsamþætting væri notuð. Þegar unnið er með flókin litagráðubreytingar og þessi frábæru LUTs (litakort) geta AVX-512 skipanir í Xeon W örgjörvum unnid miklar magn af litagögnunum í einu, með því að vinna fulla 512-bit tölur á hverjum tímaskrefi. Sameinuð minniskerfisarkitektúra verður líka mjög mikilvæg, sérstaklega þegar unnið er með stór 8K RAW-skjöl. Þessi uppsetning fjarlægir í raun allan þann óþægilega dreginn sem kemur upp þegar gögn þurfa að ferðast fram og til baka milli mismunandi minnisvæða. Og hér er eitthvað sem verkstæðibyggjar gætu viljað halda í huga...
- Tvöfaldar CPU-stillingar bæta sjaldan við myndskurð vegna NUMA-dvalatíma
- Vinna með H.266/VVC-kóða krefst stuðnings við háþrótta hröðun
- 128 GB eða meira DDR5 ECC-minni kvarðar að myndir falli ekki út við skurð á margföldum myndavélum
Vinna með ProRes RAW krefst varanlegs minnissveiflumáts sem er hærra en 100 GB/s – mikilvæg mælitala þar sem PCIe 5.0-línur Threadripper Pro útperforma keppinautana.
CPU-eiginleikar fyrir fyrirtækjastig sem tryggja áreiðanleika og öryggi
ECC-minni, örvaða byggð öryggskerfi (AMD SME / Intel SGX) og staðfesting á fjörulýsingum
Fyrir fyrirtækjastöðvar þarf örgjörvinn sérstakar eiginleika til að koma í veg fyrir að gögn verði skemmd eða verði fyrir öryggisþreatum. Taktu til dæmis ECC-minnið, sem finnur þessi ákveðnu bita-afvíggingarvilla þegar gögn eru unnin. Þetta er mjög mikilvægt í sviðum eins og fjármálamódelun eða erfðafræðirannsóknir þar sem jafnvel ein reikningarskekkja getur fært allt úr leit. Þá eru til þessi örvaöryggisráðstafanir eins og AMD minnisdulkóðun og örvaöryggisútfærsluumhverfi Intel. Þær setja upp veggja á örvaáskiptavídd til að halda óvænnum forritum úti án þess að hægja of mikið á framkvæmd. Smjörvöruskerfisforritið (firmware) leikur líka hlutverk sitt með því að athuga hvort allt ræsist rétt hverju sinni sem tækið er ræst, sem heldur fólki frá því að breyta BIOS-stillingum. Þegar allir þessir tæknilausnir vinna saman mynda þeir það sem sumir kalla þrír greinar af varnarkerfi fyrir fyrirtæki sem þurfa steinfastan stöðugleika. Raunverulegar prófunar sýna um 35–40% lækkun á krössum við þungar minnisnotkunaraðgerðir, auk þess að það hjálpar fyrirtækjum að uppfylla reglugerðir í mjög stjórnuðum atvinnugreinum.
AMD vs. Intel CPU-bilun fyrir fyrirtækjastöðvar
Virkni kjarna: Þegar CPU með fjölda kjarna minnkar viðkvæmni í samhliða verkefnum
Þótt örgjörvusamsettar örgjörvur veiti útstæðu framleiðslu fyrir samhliða verkefni, eins og myndgerð eða vísindaleg reikninga, þá geta þær oft skort á viðkvæmni í samhliða verkefnum. Rauntímaforrit – svo sem lifandi gögnasýning, CAD-vinnsla eða fjármálamódel – krefjast lágs brúttíma fyrir einn þráð frekar en hár kjarnafjöldi. Þegar fjöldi kjarna fer yfir 24–32 koma fram ýmsir bottlhalsar:
- Skýrsluálag : Stjórnkerfisþráðastjórnun bætir við brúttíma þegar verkefni færa sig milli kjarna
- Hitamörk : Áhrifamikil margkjarnabókstofa veldur hitamælingum sem lækka hraða á hverjum kjarna
- Minnisviðbót : Fleiri kjarnar sem keppa um minnisbandbreidd aukar aðgangsbrúttíma
Samanburðargögn sýna að 64-kjarnavirkar örgjörvur geta verið 15–30% hægar í svarstíðum en 16-kjarnavirkar örgjörvur í viðbragðsástandi. Fyrir fyrirtækjastöðvar sem vinna með blandaða verkhlutverk er jafnvægsskipulag með 16–24 kjarna oftast best til að draga út allt úr bæði samskiptavinnslu og notandavinkluðum svarstíðum – og þannig forðast minnkandi árangur þar sem aukakjarnar standa ónotuðar þegar mikilvægar forskjárverkefni stöðvast.
Efnisyfirlit
-
Val á örgjörva eftir verkhlutverkum: Virtúalískan, AI, hávaxtareikningur (HPC) og gagnagrunnar
- Virtúalískan og skýja-verkhlutverk: Fjöldi kjarna, PCIe-línur og inntak/úttakshraði
- AI- og HPC-verkhlutir: Latens í einum þráð, minnisbandbreidd og hröðun á FP64/INT8
- Viðskiptagagnagrunnar: Af hverju er ECC-stöðugleiki, skyndiminnisstærð og minnisbúnaðarlatensí miklu mikilvægri en fjöldi kjarna
- Gagnvirkt og tæknilegt starfsbyrjun: Myndvinnsla, myndskurður og ímyndun
- CPU-eiginleikar fyrir fyrirtækjastig sem tryggja áreiðanleika og öryggi
- AMD vs. Intel CPU-bilun fyrir fyrirtækjastöðvar