කාර්යභාරය මත පදනම් වූ CPU තෝරාගැනීම: සැබෑ කාලික සංස්කරණය, AI, HPC සහ දත්ත සමූහ
සැබෑ කාලික සංස්කරණය සහ වාතයේ සේවා: කේන්ද්රීය සංඛ්යාව, PCIe සිවිලි, සහ I/O හරහා යන සංඛ්යාත්මක ප්රවාහය
වර්චුවලයිසේෂන් සහ ක්ලවුඩ් සැකසුම් සඳහා CPU තෝරා ගැනීමේදී, අපි ලබා ගන්නා කෝර් සංඛ්යාව සහ ඒවා විසින් සපයන ආදාන/ප්රතිදාන (I/O) හැකියාව අතර සුවිශේෂී සමතුලිතතාවය සොයා ගැනීමට සැබවින්ම අවශ්යතාවක් ඇත. වැඩි කෝර් සංඛ්යාවක් යෙදීමෙන් එක් ශාරීරික සේවාදායකයක් මත වැඩි සංඛ්යාවක වර්චුවල යන්ත්ර (VM) පැක් කිරීමට උපකාරී වේ, මන්ද සෑම VM එකක්ම සුමටව ක්රියා කිරීම සඳහා එහිම ක්රියාකාරී තේමා (threads) කට්ටලයක් අවශ්ය වේ. කෙසේ වෙතත්, අපි සැලකිලිමත් නොවුවහොත් මෙහෙයුම අසාර්ථක විය හැකිය. මාතෘකා පුවරුව (motherboard) හි PCIe 5.0 සිවිලි (lanes) ප්රමාණය ප sufficiently නොමැති වුවහොත්, කෝර් සංඛ්යාව ඉතා වැඩි වුවද එය ප්රයෝජනවත් නොවේ. බොහෝ සමකාලීන හයිපර්වයිසර් (hypervisor) වේදිකා සැබවින්ම NVMe ගබඩා කිරීමේ පද්ධති සහ GPU සම්බන්ධතා යන දෙකම එකවර සැකසීම සඳහා අවම වශයෙන් සිවිලි 128 ක් අවශ්ය කරයි. I/O ප්රවේගය සුදුසු ලෙස නොමැති වුවහොත්, පරිශීලකයන් විසින් VM යන්ත්ර ගෙනයාම උත්සාහ කරන විට අසහනීය විලම්බන (latency) ගැටළු බොහෝ විට දකිනු ඇත. අපි මතක රැඳවිය යුතු වෙනත් කරුණක් නම් ස්මෘති සිවිලි (memory channels) ය. බර දත්ත සමූහ යෙදුම් (heavy database applications) සහ සාමාන්ය පරිගණක කාර්යයන් එකවර ක්රියාත්මක කරන විට 8-සිවිලි සැකසුම යෙදීම සැබවින්ම වෙනසක් සිදු කරයි, මන්ද එය විවිධ ක්රියාවලි අතර සීමිත සම්පත් සඳහා සැටි වීම වළක්වයි.
AI සහ HPC කාර්යභාරයන්: එක්-තේමා විලම්බනය, ස්මෘති පුළුල් පැති, සහ FP64/INT8 වේගවැඩි කිරීම
AI පුහුණුව සහ ඉතා බර කාර්යයන් සඳහා HPC (High-Performance Computing) භාවිතය යුගපත් වශයෙන් සිදු කිරීමේදී, මෙම කාර්යයන් අසල්වැසි වෙනස් වර්ගයේ පීඩනයක් CPU වලට එල්ල කරයි. සමාන්තර සැකසුම බහු-කෝර් සැකසුම් සැකසුම් වල හොඳ භාවිතය සිදු කරයි, නමුත් පූර්ව-සැකසුමේ පියවරවලට තවමත් සැලකිය යුතු ප්රමාණයක් බලපාන එක්-තේමා විලම්බනය (single-thread latency) යනු තවමත් තිබෙන තවත් ගැටළුවකි. උදාහරණයක් ලෙස BERT මොඩල සලකා බලන්න – එක් එක් කෝරයක් ප්රතිචාර දැක්වීමට නැනෝ සෙකන්ඩු 3 කට වැඩි කාලයක් ගත කරන්නේ නම්, සමූහ සැකසුම (batch processing) වේගය පිළිබඳව ප්රතිශතය 22% කින් අඩු වේ. එසේම, ස්මෘති පුළුල් ප්රදේශය (memory bandwidth) පිළිබඳව සිතීමට ඔබ පටන් ගන්නේ නැත. විවිධ පද්ධති අතර වෙනස අතිශයින් විශාලය. සමහර HPC සමූහ සිමියුලේෂන් (simulations) ක්රියාත්මක කර එය නිරීක්ෂණය කරන්න: ගිලා යාමේ ගතික ගණනයන් (fluid dynamics calculations) සඳහා සෙකන්ඩුවට ගිගාබයිට් 850 ක පුළුල් ප්රදේශයක් සහිත යන්ත්රයන් සෙකන්ඩුවට ගිගාබයිට් 400 ක පුළුල් ප්රදේශයක් සහිත යන්ත්රයන් වලට වඩා වේගයෙන් දෙගුණයක් ක්රියාත්මක වේ. විද්යාත්මක ආකෘතිකරණ කාර්යයන් සඳහා විශේෂිත FP64 ඒකක ඉතා ප්රයෝජනවත් වන අතර, INT8 උපදෙස් අනුමාන කාර්යයන් (inference workloads) සැ smoother ලෙස ක්රියාත්මක වීම සඳහා සුදුසුය. මෙම විශේෂාංග අතහැර දැමූ නිෂ්පාදකයන් විසින් MLPerf පරීක්ෂණ අනුව ඔවුන්ගේ AI පුහුණු කාලය ප්රතිශතය 40% කින් වැඩි වන බව සොයා ගත හැක. මෙම වේලා අතිශයින් අඩු වීම පර්යේෂණ පරිසරයන්හි ඉතා වැදගත් වන අතර, එහි සෑම පැයක්ම ඉතා වැදගත් වේ.
ක්රියාත්මක වන දත්ත සමූහ: ECC ස්ථායිතාව, කැෂ් ප්රමාණය සහ ස්මෘති විලම්බනය කේන්ද්ර සංඛ්යාවට වඩා වැදගත් වන්නේ ඇයි
ක්රියාත්මක වන දත්ත සමූහ (transactional databases) සම්බන්ධයෙන්, අධික වේගයට වඩා ස්ථායිතාව ප්රමුඛත්වය ලබයි. ECC ස්මෘතිය (ECC memory) අප කිසිවිටෙක පැහැදිලි නොවන දත්ත විකෘති වීම් (data corruptions) වැළැක්වීමේ විවේචනාත්මක කාර්යයක් සිදු කරයි. ස්මෘති ගබඩාවේ එක් බිට් එකක් පෙරළී යාම (bit flip) සිදු වුවහොත් කුමක් සිදු වේ යන්න සිතා බලන්න. 2023 දී පොනෙමොන් (Ponemon) විසින් සිදු කරන ලද සමහර පර්යේෂණ අනුව, මෙවැනි දෝෂයක් හේතුවෙන් විශාල ප්රතිස්ථාපන වියදම් ඇති විය හැකි අතර, එය ආසන්න වශයෙන් ඩොලර් 740,000 ක් පමණ විය හැකිය. අවම වශයෙන් මෙගාබයිට් 60 ක හැකියාවක් සහිත විශාල L3 කැෂ් (Big L3 caches) වලින් පොදුවේ භාවිතා වන දත්ත සෘජුවම චිපය මත තබා ගැනීම හේතුවෙන් බැඳීමේ කාලය (wait times) අඩු කළ හැකිය. මෙය OLTP විමසීම් (OLTP queries) කුඩා කැෂ් සහිත පද්ධති වලට වඩා ආසන්න වශයෙන් විශේෂයෙන් වේගවත් වීමට (30% කින්) හේතු වේ. එහෙත් කිසිවෙකු බලාපොරොත්තු නොවන ඉතා විශේෂිත කරුණක් තිබේ: වැඩි සංඛ්යාවක සැකසුම් සැකිලි (processor cores) එකතු කිරීම ප්රතිඵලයෙන් කාර්ය සාධනය සෙමින් යාමට හේතු වේ. MySQL සමඟ සිදු කළ පරීක්ෂණ අනුව, 32 කෝර් සහිත පරිගණකවල වෙළඳ සැකසුම් (transactions) සම්පූර්ණ කිරීමට ගත වන කාලය, 24 කෝර් සහිත යන්ත්රවලට වඩා ආසන්න වශයෙන් 15% කින් වැඩි විය. මෙය NUMA ගැටළු (NUMA issues) හේතුවෙන් වේ. සත්ය කාලීන විශ්ලේෂණ (real time analytics) සමඟ සම්බන්ධ වූ ඕනෑම අයෙකු සඳහා, සැකසුම් යන්ත්රය තුළ කෝර් කිහිපයක් තිබේ යන්න ගණන් කිරීමට වඩා ස්මෘති ප්රතිචාර කාලය (memory response times) 80 නැනෝ සෙකන්ඩ් ට අඩු කිරීම බෙහෙවින් වැදගත් වේ.
රචනාත්මක සහ වෛද්යුතික වෘත්තීය කාර්යභාරයන්: රෙන්ඩරින්, වීඩියෝ සංස්කරණය සහ සමූහ අනුකරණය
3D රෙන්ඩරින් සහ විද්යාත්මක සමූහ අනුකරණය: ත්රෙඩ්රිපර් ප්රෝ සහ සියොන් W සහ EPYC කාර්ය සාධනයේ සත්යතා
උසස් තත්ත්වයේ 3D රෙන්ඩර් සාදා ගැනීම සහ සංකීර්ණ විද්යාත්මක සිමියුලේෂන් ක්රියාත්මක කිරීම යනු සමාන්තර සැකසුමේ ශක්තිය අනුව හාඩ්වෙයාරය සීමාව දක්වා පීඩනය කිරීම යි. වර්ක්ස්ටේෂන් සැකසුම් කොටස් (ප්රොසෙසර්) වලට එහි කෝර් සංඛ්යාව සහ මතකය හරහා දත්ත ගමන් වේගය අතර සුවිශේෂී සමතුලිතතාවක් පවත්වා ගැනීම අවශ්ය වේ. AMD Threadripper Pro යනු එහි ඉතා ශක්තිමත් 64 කෝර් සැකසුම සහ DDR5 මතකයේ හතර පෙළ (චැනල්) සහය සමඟ මෙම ක්ෂේත්රයේ විශිෂ්ටතාවය පෙන්වා දෙයි. සීමිත අංග විශ්ලේෂණය (finite element analysis) සම්බන්ධ සිමියුලේෂන් සඳහා වැඩ කරන අයට FP64 කාර්ය සාධනය ස්ථායීව පවත්වා ගැනීම ඉතා වැදගත් වේ. EPYC සැකසුමේ 12 පෙළ මතක සැලසුම මතක පෙළ ට්ටි අටක් පමණක් ඇති පද්ධති සමඟ සැසඳූ විට සීමාවන් පිළිබඳ ගැටළු 43% කින් අඩු කරයි. කිරණ සැකසුම (ray tracing) කාර්යයන් සඳහා Threadripper Pro හි විශාල L3 කැෂ් පිළිබඳ සැකසුම එහි වාසිය ලෙස සැලකිය හැක. එතෙක්, Intel Xeon W ශ්රේණිය එක් තේමාවක් සම්බන්ධ CAD යෙදුම් වල තරමක් ප්රතිචාර ශීඝ්රතාවය අවශ්ය වන විට තවමත් ස්ථායීව පවතී. භෞතික ස්වභාවය මත පදනම් වූ රෙන්ඩරින් සොෆ්ට්වෙයාරය බොහෝ විට ප්රතිචාර දක්වන කෝර් සංඛ්යාව සමඟ සෘජුවම වර්ධනය වේ. එබැවින් කලාකරුවන් රෙන්ඩර් කිරීමේ කාලය පැය කිහිපයෙන් සිට විනාඩි කිහිපයකට අඩු කිරීමට අවශ්ය නම් 32 කෝර් වලින් ඉහළ කෝර් සංඛ්යාවක් භාවිතා කිරීම අත්යවශ්ය වේ. සිසිල් කිරීමේ කළමනාකරණය (තාප කළමනාකරණය) ද විශාල ගැටළුවක් ලෙස පවතී. දීර්ඝ කාලයක් පැවති ගතික ද්රව සිමියුලේෂන් (computational fluid dynamics) ක්රියාත්මක වන විට උණුසුම ඉක්මනින් ඉහළ යාම මෙම බලවත් පද්ධතිවල කාර්ය සාධනය කාලයත් සමඟ සැලකිය යුතු ලෙස සීමා කළ හැකිය. එබැවින් ද්රව සිසිල් කිරීම (liquid cooling) යනු දැන් අතිශයින් අවශ්ය වූ අතිරේකයක් නොව, විශිෂ්ට වර්ක්ස්ටේෂන් සැකසුම් සඳහා අත්යවශ්ය අංගයකි.
වීඩියෝ සංස්කරණය සහ කේතීකරණය: සීපීයු තෝරාගැනීම මත ක්වික් සින්ක්, AVX-512 සහ සමූහිත ස්මෘති සැකැස්ම හි බලපෑම
අද කාලයේ වැඩියෙන්ම භාවිතා වන වීඩියෝ සංස්කරණ සැකසුම් බොහෝ විට සැබෑ කාලයේ සුමට පෙරදසුන් ලබා ගැනීම සහ දීර්ඝ නිර්යාත කිරීමේ ක්රියාවලිය වේගවත් කිරීම යන දෙකම අවධානය යොමු කරයි. උදාහරණයක් ලෙස ඉන්ටෙල් හි ක්වික් සින්ක් තාක්ෂණය සලකා බලන්න — එය යුනිට් විස්තීර්ණ වීඩියෝ සංකේතනය (H.265) කාර්යයන් සඳහා GPU භාවිතා කිරීමට ඉඩ සලසයි. එම නිසා 4K කාල රේඛා නිර්යාත කිරීමට මෘදුකාංග පමණක් භාවිතා කිරීමට වඩා කාලය 70% කින් අඩු වේ. සංකීර්ණ වර්ණ ශ්රේණි සහ ඒ සමඟ යුගෝචිත LUT (වර්ණ සැකැස්ම) සමඟ වැඩ කරන විට, Xeon W සැකසුම්වල ඇති AVX-512 උපදෙස් විශාල වර්ණ දත්ත ප්රමාණයක් එකවර සැකසීමට හැකියාව ලබා දෙයි; එය සෑම චක්රයකදීම 512-බිට් කොටස් සම්පූර්ණයෙන් සැකසීම සිදු කරයි. සමූහිත ස්මෘති සැකැස්ම ද ඉතා වැදගත් වේ, විශේෂයෙන්ම විශාල 8K RAW ගොනු සමඟ වැඩ කරන විට. මෙම සැකසුම සාමාන්යයෙන් විවිධ ස්මෘති ප්රදේශ අතර දත්ත ගෙනයාම සම්බන්ධයෙන් ඇති වන විරස් වෙලා යාම (lag) සම්පූර්ණයෙන් ඉවත් කරයි. තවද, වර්ක්ස්ටේෂන් ගොඩනැගීමේ විශේෂඥයින් සඳහා මෙය සැලකිලිමත් විය යුතු කරුණකි...
- NUMA විලම්බනය හේතුවෙන් වීඩියෝ සංස්කරණය සඳහා ද්විතීය CPU සැකසුම් සාමාන්යයෙන් වාසිදායක නොවේ
- H.266/VVC කේතීකරණ ක්රියාවලි සඳහා හාඩ්වෙයාර් වේගවැඩි කිරීමේ සහාය අවශ්ය වේ
- 128GB+ DDR5 ECC ස්මෘතිය බහු-කැමරා සංස්කරණය සමයේ ෆ්රේම් අතුරුදන් වීම වළක්වයි
ProRes RAW ක්රියාවලි සඳහා ස්ථායී ස්මෘති ප්රවාහ වේගය 100GB/s ඉක්මවා යා යුතු අතර, මෙය Threadripper Pro හි PCIe 5.0 ලේන් තරඟකරුවන්ට වඩා හොඳ කාර්ය සාධනය පෙන්වන ප්රධාන මිනුමකි.
විශ්වසනීයත්වය සහ ආරක්ෂාව සුනිශ්චිත කරන ව්යාපාරික මට්ටමේ CPU විශේෂාංග
ECC ස්මෘතිය, හාඩ්වෙයාර්-ආධාරිත ආරක්ෂාව (AMD SME / Intel SGX) සහ ෆර්ම්වෙයාර් සත්යාපනය
ව්යාපාරික වැඩ ස්ථාන සඳහා, CPU හි විශේෂිත විශේෂාංග අවශ්ය වේ දත්ත විකෘති වීම හෝ සුරක්ෂිතතා තර්ජන වලට ලක් වීම වැළැක්වීම සඳහා. උදාහරණයක් ලෙස ECC ස්මෘතිය (ECC memory) සලකන්න — එය දත්ත සැකසීමේදී අපහසු වූ බිට්-ෆ්ලිප් (bit-flip) දෝෂ සොයා ගනී. මෙය මූල්ය ආකෘතිකරණය හෝ ජෙනෝමික් පර්යේෂණය වැනි ක්ෂේත්රවල ඉතා වැදගත් වේ, මන්ද එක් වරක් වත් වැරදි ගණනය කිරීමක් සම්පූර්ණ ක්රියාවලිය විඛණ්ඩනයට ලක් කළ හැකිය. ඊට අමතරව, AMD හි ස්මෘති සැරැකුම සහ Intel හි සුරක්ෂිත ක්රියාත්මක විශේෂ පරිසර (secure execution environments) වැනි හාඩ්වෙයාර් සුරක්ෂිතතා පියවර ද ඇත. මෙම පියවර මැල්වෙයාර් (malware) වලින් ආරක්ෂා වීම සඳහා හාඩ්වෙයාර් මට්ටමේ බාධා ඉදිකරයි, එමගින් ක්රියාත්මක වීමේ වේගය ඉතා අඩු නොකරයි. ෆර්ම්වෙයාර් (firmware) ද එහි කාර්යභාරය සිදු කරයි — යන්ත්රය සැමවිටම ආරම්භ වන විට සියල්ල සුදුසු ලෙස ආරම්භ වෙනවාදැයි පරීක්ෂා කරයි; මෙය BIOS සැකසුම් වෙත අනවසරයෙන් ස්පර්ශ කිරීම වැළැක්වීමට උපකාරී වේ. මෙම සියලු තාක්ෂණික අංග එකට ක්රියා කරන විට, ඉතා ස්ථායී පද්ධති අවශ්ය ව්යාපාර සඳහා 'ත්රි-ශාඛා ආරක්ෂා ක්රමය' (three-pronged defense system) යනුවෙන් හැඳින්වෙන පද්ධතියක් නිර්මාණය කරයි. සත්ය ලෝක පරීක්ෂණ වලින් පෙනී යන්නේ, ඉහළ ස්මෘති භාවිතය සම්බන්ධ කාර්යයන් වලදී අස්ථායිතාවය (crashes) 35–40% කින් අඩු වී ඇති අතර, ඉතා පාලනය කරන ලද ක්ෂේත්රවල සමාගම් නියම පිළිපදීමට මෙය උපකාරී වේ.
ව්යාපාරික වැඩස්ථාන සඳහා AMD සහ Intel CPU සංසන්දනය
මූලික සංඛ්යා සම්බන්ධ සමතුලිතතා: අධි-මූලික සීපීයු වල ප්රතිචාර ශීඝ්රතාව අන්තර් ක්රියාකාරී කාර්යයන්හි අඩු වීම
උසස්-මූලික සංඛ්යාවක් සහිත සීපීයු විස්තීර්ණ කාර්යයන් සඳහා, උදාහරණයක් ලෙස රෙන්ඩරින් හෝ විද්යාත්මක ගණනය කිරීම් සඳහා, අතිශයින් හොඳ සම්පූර්ණ සැකසුම් හැකියාව සපයයි. කෙසේ වුවද, එය අන්තර් ක්රියාකාරී කාර්යයන්හි ප්රතිචාර ශීඝ්රතාව බෙහෙවින් අඩු කරයි. සත්ය කාලීන යෙදුම්—උදාහරණයක් ලෙස සෘජු දත්ත දෘශ්යීකරණය, CAD සංස්කරණය හෝ මූල්ය ආකෘතිකරණය—අධි-ගතික තනි-තේමා කාර්ය සාධනය අවශ්ය කරයි. එය මූලික සංඛ්යාව වෙත නොවේ. මූලික සංඛ්යාව 24–32 ඉක්මවු විට, කිහිපයක් සීමාවන් ඇති වේ:
- සැලසුම් කිරීමේ බර : කාර්යයන් මූලික වල අතර ස්ථාන හුවමාරු වීම සමඟ කාර්ය පද්ධතියේ තේමා කළමනාකරණය විසින් විලම්බය හඳුන්වා දෙයි
- තාපීය සීමාවන් : අධි-බහු-මූලික වේගවැඩි කිරීම ස්වයංක්රීයව වේගය අඩු කිරීම ඇති කරයි. එය එක් එක් මූලිකයේ වේගය අඩු කරයි
- ස්මෘති සංඝර්ෂය : වැඩි සංඛ්යාවක් සහිත මූලික සීපීයු විසින් RAM ප්රවේගය සඳහා තරඟ කිරීම ස්මෘති ප්රවේශ විලම්බය වැඩි කරයි
සාක්ෂි දත්ත විශ්ලේෂණය කළ විට, අන්තර් ක්රියාකාරී තත්වයන්හිදී 64-කෝර් සැකසුම් යන්ත්රයන් හි ප්රතිචාර කාලයන් 16-කෝර් සමකක් වලට වඩා 15–30% කින් සෙමින් සිදුවන බව පෙනේ. විවිධාකාර කාර්යබහුලතා සමගින් ක්රියා කරන ව්යාපාරික කාර්ය ස්ථාන සඳහා, සමතුලිත 16–24 කෝර් සැකසුමක් සාමාන්යයෙන් සමාන්තර සැකසුම සහ පරිශීලක-අභිමුඛ ප්රතිචාර ශීඝ්රතාවය යන දෙකම හොඳින් සකසා දෙයි— අතිරික්ත කෝර් නිශ්චලව පවතින අතර වැදගත් පෙර පෙන්වුමේ කාර්යයන් අඩා වී යාම වැළැක්වීම සඳහා ඵලදායීතාවය අඩු වීම වළක්වා ගැනීම සඳහාය.
අන්තර්ගතය
-
කාර්යභාරය මත පදනම් වූ CPU තෝරාගැනීම: සැබෑ කාලික සංස්කරණය, AI, HPC සහ දත්ත සමූහ
- සැබෑ කාලික සංස්කරණය සහ වාතයේ සේවා: කේන්ද්රීය සංඛ්යාව, PCIe සිවිලි, සහ I/O හරහා යන සංඛ්යාත්මක ප්රවාහය
- AI සහ HPC කාර්යභාරයන්: එක්-තේමා විලම්බනය, ස්මෘති පුළුල් පැති, සහ FP64/INT8 වේගවැඩි කිරීම
- ක්රියාත්මක වන දත්ත සමූහ: ECC ස්ථායිතාව, කැෂ් ප්රමාණය සහ ස්මෘති විලම්බනය කේන්ද්ර සංඛ්යාවට වඩා වැදගත් වන්නේ ඇයි
- රචනාත්මක සහ වෛද්යුතික වෘත්තීය කාර්යභාරයන්: රෙන්ඩරින්, වීඩියෝ සංස්කරණය සහ සමූහ අනුකරණය
- විශ්වසනීයත්වය සහ ආරක්ෂාව සුනිශ්චිත කරන ව්යාපාරික මට්ටමේ CPU විශේෂාංග
- ව්යාපාරික වැඩස්ථාන සඳහා AMD සහ Intel CPU සංසන්දනය