Разумевање реалности капацитета ССД-а: сирово, корисно и ефикасно
Како претерано обезбеђивање и проширење фирмавера смањују корисни капацитет ССД-а
Бројеви на корпоративним SSD-овима обично се односе на необрађену НАНД складиштењу унутар њих, а не на оно на шта корисници могу заправо приступити. Када произвођачи говоре о прекомерном снабдевању, они одводе око 28% тог простора за ствари као што су прикупљање смећа и функције за изравњавање знојања које одржавају диск без проблем када се баве великим бројем писања. Затим постоји и проширење накнаде узимајући још 7 до 10% за ствари као исправљање грешака, управљање лошим блоковима, и складиштење контролера информације. Све ове расподеле значи да је стварни корисни простор прилично опао. На пример, диск који се оглашава као 1 ТБ ће генерално дати негде око 930 ГБ уместо тога. Ова разлика је веома важна када се планира ИТ инфраструктура. Свако ко се бави базама података или виртуелним машинама зна да конзистентна унос/излаз перформансе није само лепо да имају директно утиче да ли ти споразум нивоа услуге остају нетакнути или се крше током пик времена коришћења.
Ефикасан добитак капацитета ССД-а од компресије и дедупликације у хидрафтарској убрзани
Предприемни ССД-ови данас се боре против губитка капацитета користећи технике хардверске забрзане компресије и дедупликације које се аутоматски дешавају у самом контролеру. Метода компресије ЛЗ4 заиста добро функционише за текстуалне датотеке и уносе у дневници, често смањујући њихову величину за око пола до две трећине. Дедупликација долази у игру када постоје дуплицирани блокови података на различитим виртуелним машинама или сликама контејнера. Када обе технологије раде заједно, стварају такозвани ефикасни капацитет који је заправо 1,5 до 2 пута већи од физичког НАНД складишта. Узмите стандардни 15ТБ КЛЦ ССД на пример, он може ефикасно да складишти до 27ТБ логичких података захваљујући овим оптимизацијама. Видели смо импресивне резултате са базама података за обуку вештачке интелигенције које имају тенденцију да имају много понављања обрасца као што су контролне тачке модела и серије синтетичких података. Ови случајеви показују уштеду простора до 80%, што омогућава коришћење решења за складиштење високе густине за архивирање и стадионисање без значајног утицаја на показатеље перформанси као што су латентност или проток.
Успоређивање капацитета ССД са основним пословним оптерећењима предузећа
SQL базе података: Балансирање густине ИОПС-а, волумена дневника и капацитета ССД-а
Планирање капацитета ССД-а за трансакционе базе података је заиста кључно ако желимо да се носимо са случајним захтевима за ИОПС-ом док управљамо растућим дневницима трансакција. Када се бавите ОЛТП радним оптерећењима са великим оптерећењем писања, ови дневници могу да проузру око 20 до 30% доступног простора за складиштење. Без довољно додатног простора, систем почиње да ради више да би управљао записима, што брже износи SSD и успорава одговоре. Гледајући индустријске стандарде, већини система који обрађују око 50 хиљада трансакција у минути потребно је најмање 1,5 пута више капацитета сирових података само за те дневнике плус простор за буфер и привремене операције базе података. Оставити око 15 до 20% додатних капацитета заправо чини велику разлику. Она одржава стабилну перформансу у периодима заузетosti и продужава трајање трајања дискова. Ово је веома важно јер постоји јака веза између довољно простора за издржљивост и одржавања поузданог рада током времена, посебно у критичним пословним окружењима где је време простора вредно новца.
Виртуализована окружења (вСфера/Хипер-В): Скалирање капацитета по Дензитету ВМ и Снатшот Политика
Када компаније постану виртуелне, они на крају требају много више простора за складиштење због свих тих ВМ-а спакованих заједно, плус сваки гост ОС заузима простор, и не треба ни да ме покренете на снимке које се множе свуда. Већина виртуелних машина треба негде између 40 и 100 гигабајта само за њихов оперативни систем и апликације. Али будите пажљиви на снимке током ажурирања софтвера или резервних копија када употреба меморије може да се удвостручи. Ако у окружењу ради више од 50 виртуелних машина, ИТ људи би вероватно требали да одвоје око четвртине више ССД простора посебно за руководство метаподацима, привременим клоновима и тим досадним фајловима за размену који се акумулирају током времена. Тнак провизионирање помаже да се уштеди простор у почетку, али нико не жели да се касније нађе у изненадном недостатку складишта, па су редовне проверке апсолутно неопходне да би се избегли проблеми са перформансом. За најбоље резултате, упореди колико често се снимају снимке са врстом радног оптерећења са којим се бавимо. Критични производњи системи могу требати савремени снимци, док развојни / тест окружења могу вероватно да избегну са дневним. Овај приступ смањује претерано копирање података без угрожавања наше способности да се опоравимо од проблема када је потребно.
Сервери за складиштење датотека и објеката: превишање метаподатака у односу на захтеве за секвенцијалном протеклошћу
СДС складиштење се дели између управљања метадатама и кретања стварних података када се бавите радним оптерећењем за складиштење датотека и објеката. Системи који се баве великим количином метаподатака, као што су архиве здравствених слика или те масивне збирке правних докумената, често морају да одвоје отприлике четвртину до трећину свог укупног простора само за ствари као што су индексирање датотека, навигација у директори Таквим системима је потребно најмање 15 хиљада IOPS на десет терабајта ако желе брзе одговоре када раде са многим малим датотекама. С друге стране, поставке усредсређене на брзо пролазак података уместо на случајни приступ њима, као што су станице за уређивање видео снимка или дугорочни базери за складиштење података, више брину о брзини директне линије. Они обично морају да одржавају брзине писања од преко 1,5 гигабајта у секунди континуирано. КВЛЦ базирани ССД-ови имају добар финансијски смисао за складиштење оваквих архивских података, али постоји улов који вреди напоменути. Ако се дискови свакодневно препишу на више од три десетине свог пуног капацитета, они се често издржу много пре него што се очекивало.
Изодржљивост и архитектура ССД-а: Зашто капацитет мора бити у складу са радним оптерећењима за писање
Утицај типа ТБВ, ДВПД и НАНД: СЛЦ, ТЛЦ и КЛЦ ССД у производњи
Издржљивост SSD-а зависи од три главна фактора: колико терабајта се може написати (TBW), дневни капацитет писања (DWPD) и врста технологије NAND која се користи унутра. СЛЦ НАНД се држи много дуже од других, обрађује између 50.000 и 100.000 циклуса писања пре него што се избрише. Које су недостатке? Кошта много више новца, због чега то видимо углавном у кеш системима где је брзина најважнија, као што су те високофреквентне платформе за трговање у финансијама. ТЛЦ пронађе средину негде, траје око 1.000 до 3.000 циклуса. То га чини довољно добрим за редовне потребе складиштења предузећа где се читање и писање често дешавају. Затим постоји КЛЦ, који спакује много више података на мање простора и кошта мање по гигабајту. Али ово је улов: не траје толико дуго, око 1000 циклуса максимум. То је довољно добро за ствари које се читају више него што се пишу, као што су резервне датотеке, системски дневници или привремени кеш за веб странице које достављају садржај.
АИ/МЛ обуке: Процена ЦЛЦ-СДС-а са великим капацитетом под одржаним оптерећењима писања
АИ/МЛ обуке наметну јединствено захтевне, трајне обрасце писањачесто укључују понављање уношења, померања и проверке мноштва података од више терабајта. У овим условима, КЛЦ ССД се суочавају са убрзаним хабањем: континуирано писање 24/7 може исцрпити њихов буџет издржљивости за месеце, а не године.
| Тип NAND | Напишите циклусе | Живооспособност за обуку у области АИ/МЛ |
|---|---|---|
| КЛЦ | ~1,000 | Ограничена; погодна само за нивои за стадирање или читање тешке закључке |
| TLC | 1,000–3,000 | Препоручује се за већину обучних радних оптерећења, посебно са прекомерним снабдевањем од 20%+ |
| СЛЦ | 50k100k | Оптимално за фино подешавање модела у реалном времену или складиште функција са малим кашњењем, иако је трошак непохватљив у величини |
Прекомерно обезбеђивање помаже у продужењу животног века КЛЦ-а, али не може да превазиђе фундаментална архитектонска ограничења. За производњу инфраструктуре вештачке интелигенције, усклађивање типа НАНД са очекиваном интензитетом писања - не само потребама у капацитету - је од суштинског значаја како би се избегле непланиране замене, клипови перформанси или ризици интегритације података.