Ажлын ачаалламд тааруулан CPU-ийн сонголт: виртуалжуулалт, ИИ, өндөр гүйцэтгэлт бүтэц (HPC) болон өгөгдлийн сангууд
Виртуалжуулалт ба цахим сүлжээний ажлын ачаалламд: цөмийн тоо, PCIe замууд, оролт/гаралт (I/O) нөөц
Виртуализацийн ба цахим сүлжээний суурин системд процессор сонгохдоо цөөн тооны бүрдүүлэгчдийн хоорондын тааруулалт, ажиллах үүрэг болон оролт/гаралт хүчин зүчний хоорондын зөв харьцааг олох нь үнэнхүү чухал. Илүү олон бүрдүүлэгчдийн тоо нь илүү олон виртуал машин (VM) хүлээн авахыг хангаж, нэг физик хост дээр илүү олон VM-ийг номхон ажиллуулахыг хангадаг, учир нь хүртэлх виртуал машинаа өөрийн бүлгийн боловсруулалтын урсгалыг шаарддаг. Гэт, хүртэлх хандак хүлээн авах газар (материнская плата) PCIe 5.0 интерфейсийн хангалттай тооны зам (lane) үүрдүүлэгчдийн хооронд хүргэж үл чадвал, хамгийн их бүрдүүлэгчдийн тоо чинь хангалтгүй болж, ажиллах үүрэг доройтож, үйл ажиллагаа хоцрогдож магад. Одоогийн үед хамгийн түгээмүүр гипервизор платформуудын ихэнх нь хурдатгасан NVMe хадгалах системүүд ба GPU-холболтуудын хоёулын хамт ажиллахын тулд 128 зам (lane) – ийн доорх хувилбарыг шаарддаг. Хэрэв оролт/гаралт дайралт (bandwidth) хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэгчдийн хооронд бүрдүүлэгчдийн хоорондын холболт хангалтгүй бөлгөөн үүрдүүлэ......
ИИ ба Өндөр гүйцэтгэлт бүтээлд суурилсан ажил: Нэг утасны хоцрогдол, санах ойн нөөц, FP64/INT8 хурдасгал
ИИ-ийн сургалт ба хүнд нөхцөлд хэрэглэдэг ХПК-ийн ачаалалд CPU-ууд дээр үл яснаар өөр төрлийн дарлал үүсдэг. Зэрэгцүүд боловсруулалт олон цөмт тохиргоог тааруулан ашиглахын тулд илт хэрэгцээтэй, гэтэдүүр урьдчилан боловсруулалтын алхамд нь нэг цөмт задлан шинжилхүүн хугацаа чухал үүрэгтэй. Жишээлбэл, BERT загварууд: хэрэв нэг цөм 3 наносекундээс урт хугацаанд хариу өгвөл, навчлагч боловсруулалт 22% замхайрдаг. Мөн санах ойн нөөц хүртээмүйн тухайд мөрөөдлүүр хүлээж бүү сана. Системүүдийн хоорондын зөрүү нь үнэндүүр шударга. Ямар нэг ХПК-ийн симуляци хийж үз: 850 ГБ/с нөөц хүртээмүйтэй машинууд шингэн динамикасын бодлогыг 400 ГБ/с нөөц хүртээмүйтэй машинуудаас хоёр дахин хурдан бодож дуусгаж чаддаг. Шинжлэх ухааны загварлалтын даалгавруудад туслахын тулд тусгай FP64 нэгжүүд үл яснаар хэрэгцээтэй, харин INT8 захианууд инференц ачаалалд илт хүлээж бүү сана. Эдгээр онцгой шинж чанаруудыг орхисон үйлдвэрлэгчдийн ИИ-ийн сургалт MLPerf шалгалаар үзүүрлэх үед 40% урт хугацаа шаардуудаг. Ийм хугацааны алдагдал судалгааны орчинд, хором бүр тооцоотой бөхийнхүүр, хурдан нэмэгддэг.
Гүйлгээний өгөгдлийн сангууд: Яагаад ECC тогтвортой байдал, кэш хэмжээ ба санах ойн хожигдлын хугацаа цөмийн тооноос илүү чухал вэ
Гүйлгээний өгөгдлийн сангуудын хувьд тогтвортой байдал нь ганцхан хурднаас илүү чухал. ECC санах ой нь бидний үүрд харахгүй нууц өгөгдлийн дурсгалын алдаа үүсгэхийг саатуулахад чухал үүрэг гүйцэтгэнэ. Төсөөлөөрүүн, санах ойн хадгаламжид нэг бит өөрчлөгдөх үед юу болох вэ? Понемон-ийн 2023 онд хийсэн судалгааны үр дүнд үүнд холбогдож, ийм алдаа нь сэргээлтийн зардлыг 740 000 доллар орчим хүртэл ихсгэж чадна. Дор хаяж 60 МБ багтаамжтай том L3 кэш нь хүлээлтийн хугацааг бүүр уртасгахын тулд түүнд хэрэглэдэг өгөгдлүүдийг шууд чип дээр хадгалж, OLTP асуултуудын гүйцэтгэл нь жижиг кэштэй системүүдтэй харьцуулж, ойролцоогоор 30% хурдан болж чадна. Бүхнүүд хүлээж буй нэг сонин зүйл: процессорын цөмийн тоог илүүд үүрд хийх нь үйлдлийн хурдыг удаашруулж чадна. MySQL-тэй хийсэн туршилт нь 32 цөмт компьютерүүдийн гүйлгээний баталгаажуулалт нь 24 цөмт машинуудтай харьцуулж, ойролцоогоор 15% уртасгаж чадна — бүүр NUMA-гийн асуудлуудын улмаас. Хүрэлцээний шинжилгээний хувьд санах ойн хариу үйлдлийн хугацааг 80 наносекундээс бага байлгах нь процессор дотор хичнээн цөм байгаа гэдгийг тоолох хүртэл чухал.
Үйлдвэрлэлийн ба техник професионал ажил: 3D дүрслэл, дууны ба видео засварлалт, симуляци
3D дүрслэл ба шинжлэх ухааны симуляци: Threadripper Pro, Xeon W ба EPYC процессоруудын бодит үзүүлэлтүүд
Өндөр чанарын 3D-рендерүүдийг үүсгэх ба нарийн шинжлэх ухааны симуляци хийх нь параллель бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэцтэй бүтэ......
Видео монтаж, коджуулалт: хурдан синхронжуулалт, AVX-512 болон нэгдсэн санах ойн архитектур нь CPU-ийн сонголтод нөлөөлдөг
Өнөөдөр ихэнх видео монтажлах системүүд нь бодит цаг хугацааны урьдчилсан үзлэг хийхэд анхаарч, мөн урт хугацааны экспортын үйл явцыг хурдасгах юм. Жишээ нь Intel-ийн Quick Sync технологи нь GPU-д H.265 кодлолт хийх боломжийг олгодог. Энэ нь 4K цагийн шугамыг экспортлох нь зөвхөн програм хангамжийн render-д итгэхээс 70%-иар бага хугацаа шаардагдана гэсэн үг юм. Хүндэрхэг өнгөний цэгүүд болон тэрхүү шилдэг LUT-үүдтэй ажиллахдаа Xeon W процессоруудын AVX-512 тушаал нь нэг дор маш их хэмжээний өнгөний өгөгдлийг боловсруулж, нэг удаа 512 битийн бүхэл бүтэн хэсгийг боловсруулдаг. Нэгдсэн санах ойн архитектур нь бас маш чухал болж байна, ялангуяа том 8K RAW файлуудыг ашиглахдаа. Энэ нь тухайн өгөгдлийг санах ойн өөр өөр бүс хооронд эргэж эргэж хийхэд тохиолддог харамсалтай хоцролыг арилгадаг. Ажлын станцын үйлдвэрлэгчдэд анхаарах хэрэгтэй зүйл байна.
- NUMA хоцрогдолд холбогдмуйн улмаас хоёр CPU-түүн дээр суурилдаг тохиргоо нь видеоредактируулалтад ховорхон ашиг тарадаг
- H.266/VVC кодекийн ажлын урсгалд харилцан адилтгагч хангамж шаардлагатай
- 128 ГБ-с дээш DDR5 ECC санах ой нь олон камерийн редактируулалт үед кадр хаягдахыг саатуулдаг
ProRes RAW ажлын урсгалд санах ойн тогтвортой нөөц хурд 100 ГБ/с-с дээш шаардлагатай — энэ нь Threadripper Pro-н PCIe 5.0 шугамууд конкурентуудаас давуу талыг илтгэндаг чухал үзүүр.
Надёжност ба аюулгүй байдлыг хангах корпоратив түвшний CPU-н боломжууд
ECC санах ой, харилцан адилтгагч дээр суурилдаг аюулгүй байдлын шийдлүүд (AMD SME / Intel SGX) ба прошиверийн баталгаажуулалт
Корпорацийн ажлын станцүүдийн хувьд CPU-д өгөгдлүүдийн газархан бүтэлдүүлэлт болон аюулгүй бүснүүдийн дайралтад өртөхөөс саакулахын тулд тусгай шинж чанарууд шаардлагатай. Жишээ нь, ECC санах ой — үүн дотор өгөгдлүүдийг боловсронгуйлж байх үед илүүдүүлэлтүүд (bit-flip) алдаануудыг илрүүлдүүг. Энэ нь санхүүгийн загварчлал, геномын судалгаа зэрэг салбарт их чухал, учир нь нэг л бүтэлдүүлтүүд алдаа бүх ёсны үр дүнг үл хүлээж үлдэж болой. Дараа нь AMD-ийн санах ойн нууцлал, Intel-ийн аюулгүй гүйцэтгэл орчин зэрэг харилцан холбоотой хангамжийн аюулгүй бүснүүд байдаг. Түүн дотор харилцан холбоотой хангамжийн түвшинд вирус, малвар зэрэг хохирогч програмуудын оролтыг хаалтаж, системийн хурдыг илүүдүүлэлтүүд бүтэлдүүлтүүд ачаалалд үл хүлээж үлдэж болой. Фирмвэрийн хувьд мөн түүний үүрэг бүхнүүд машин асаах үед зөв ажиллаж байгаа эсэхийг шалгаж, BIOS тохиргоог хүнд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд хүртэмүүд......
AMD vs. Intel CPU-ийн харьцуулалт үйлдвэрлэлийн ажлын бүрдүүлэлтүүдийн хувьд
Үндсэн цөмийн тооны хоолой: Өндөр цөмийн тоотой CPU-ууд интерактив ачаалалд хариуцлагыг бүүр хориглодог
Харин өндөр цөмийн тоотой процесорууд рендеринг юм уса, шинжлэх ухааны бодлогууд зэрэг параллелчилж болох даалгавруудад гайхалтай дамжуулалт үзүүлдэг, гэтгүй интерактив ачаалалд хариуцлагыг нь бүүр хориглодог. Бодит цагт ажиллах програмууд — жишээлбэл шууд өгөгдлийн визуализаци, CAD-ийн зүйлсийг засварлах, санхүүгийн загварчлал — цөмийн тооны хүч бүүр, харин бодит цагт ажиллах нэг цөмийн бүүр хурдны бага латентностьг шаарддаг. Цөмийн тоо 24–32-оос дээш үүрд, дараах хүндрүүлэлтүүд үүсдэг:
- Хуваарилалтын ачаалал : ОС-ийн потокудын удирдлага нь даалгавруудын цөмүүд хооронд шилжих үед латентность үүсгэдэг
- Дулааны хязгаарлалт : Идэвхтэй олон цөмийн хурдасгал нь хурдны бүүр хориглолт үүсгэдэг, түүн дагаад нэг цөмийн хурд бүүр буурдэг
- Санах ойн төлөөлөл : Илүү олон цөм санах ойн нөөц дээрх дамжуулалт хүртэл хүртүүлэлт үүсгэдэг, түүн дагаад хүртүүлэлтийн латентность нь өсдэг
Даалгаврын харьцуулалтын өгөдмүүр нь 64 сүүлд бүхий процессорууд интерактив нөхцөлд 16 сүүлд бүхий процессоруудаас 15–30% ардаа хариу өгдөг гэдгийг илтгэндэ. Холимог ажил ачаалалтай корпоратив ажил станцүүд дээр тэнцвэрт 16–24 сүүлд бүхий конфигураци нь ихэвчлэн зэрэгцүүн боловсруулалт ба хэрэглэгчид чиглүүлсэн хариу өгөх чадварыг хоёуланг нь сонгомтгүй хамгийн сайн тодорхойлдөг — нэмэлт сүүлдүүд идлэд, харин чухал урд дэлгэц дээрх даалгаврууд хойшлогдож, үр дүн бүүр муудаж буй тохиолдолд түүнийг саатуулдөг.
Гарчиг
-
Ажлын ачаалламд тааруулан CPU-ийн сонголт: виртуалжуулалт, ИИ, өндөр гүйцэтгэлт бүтэц (HPC) болон өгөгдлийн сангууд
- Виртуалжуулалт ба цахим сүлжээний ажлын ачаалламд: цөмийн тоо, PCIe замууд, оролт/гаралт (I/O) нөөц
- ИИ ба Өндөр гүйцэтгэлт бүтээлд суурилсан ажил: Нэг утасны хоцрогдол, санах ойн нөөц, FP64/INT8 хурдасгал
- Гүйлгээний өгөгдлийн сангууд: Яагаад ECC тогтвортой байдал, кэш хэмжээ ба санах ойн хожигдлын хугацаа цөмийн тооноос илүү чухал вэ
- Үйлдвэрлэлийн ба техник професионал ажил: 3D дүрслэл, дууны ба видео засварлалт, симуляци
- Надёжност ба аюулгүй байдлыг хангах корпоратив түвшний CPU-н боломжууд
- AMD vs. Intel CPU-ийн харьцуулалт үйлдвэрлэлийн ажлын бүрдүүлэлтүүдийн хувьд