Að skilja raunveruleika gagnageymslumáls SSD: Brátt, Notandi og Virkt
Hvernig yfirveiting og fjármálahönnun minnka notandi gagnageymslumál SSD
Tölurnar sem eru listar á fyrirtækja-SSD-einingum vísa venjulega til óbeinna NAND-gagnageymslunnar inni í þeim frekar en til þess sem notendur geta raunverulega nýtt. Þegar framleiðendur tala um yfirveitingu (over provisioning) þá setja þeir til hliðar um 28% af þessari óbeinna gagnageymslu fyrir hluti eins og ruslsafnun (garbage collection) og jöfnun á slit (wear leveling), sem halda disknum í góðu gangi þegar hann meðhöndlar mikla skrifvirkni. Svo kemur viðbótargögn (firmware overhead) sem tekur aðra 7–10% fyrir hluti eins og villaupplausn, stjórnun á illa virkum blokkum og geymslu stjórnunarupplýsinga. Allar þessar úthlutanir þýða að raunveruleg notaðleg gagnageymsla minnkar nokkuð. Til dæmis gefur diskur sem er auglýstur sem 1 TB venjulega einungis um 930 GB. Þessi munur er mjög mikilvægur þegar áætlað er IT-innviði. Hver sem vinur við gagnagrunna eða vélvistur veit að samfellt inntak/úttak (I/O) framkvæmd er ekki bara kærkomið – það hefur beinan áhrif á hvort þær þjónustusamkomulag (SLA) verði viðhaldin eða brotin á hámarksnotkunartíma.
Ávinningur í geymslumátt á SSD-hard diski vegna þjöppunar og afritunar sem er hrökkvun með hjálp tæknibúnaðar
Í dag berjast fyrirtæka-SSD-einingar gegn getuþroti með því að nota háþróaða samþrýmingu og afkópunaraðferðir sem eru hrökkvadar með vélbúnaði og fer fram sjálfkrafa innan stjórnunarstikunnar sjálfrar. LZ4-samþrýmingaraðferðin virkar mjög vel fyrir textaskrár og skráningar í skráningarskránum og minnkar oft stærð þeirra um um þriðjung til helming. Afkópun kemur að notkun þegar eru tvítekningar á gagnablokum á milli mismunandi vistvélta eða umhulpsmynda. Þegar báðar tækniin vinna saman mynda þær það sem kallað er „áhrifamikil geta“, sem er í raun 1,5–2 sinnum stærri en líkamleg NAND-gagnageymsla. Tökum sem dæmi venjulega 15 TB QLC SSD-einingu: hún getur áhrifamiklar geymt allt að 27 TB af rökhugðum gögnum takmarkalaust vegna þessara valdaraðferða. Við höfum séð áhrifamiklar niðurstöður með AI-þjálfunargagnasöfnum sem hafa oft margar endurtekningar, svo sem líkansathuganir og safn af samþrýmdum gagnagrunni. Í þessum tilvikum hefur verið skilað um plássvinnu upp í 80%, sem gerir það mögulegt að nota gagnageymslulausnir með hári þéttleika fyrir geymslu og undirbúning áður en gagnin eru sett í notkun án nokkurs athyglisverðs áhrifa á ástandsmælingar eins og dvalartíma eða framleiðslu.
Að passa SSD-getu við grunnverkefni fyrir fyrirtæki
SQL-gagnagrunnar: Jafnvægi á milli IOPS-þéttleika, skrárúmstæða og SSD-getu
Að skilgreina SSD-getu fyrir viðskiptagagnagrunna er mjög mikilvægt ef við viljum hafa áframhaldandi getu til að uppfylla eftirspurn eftir handahófskenndum IOPS-gerðum á meðan við stjórnum vaxandi ritunargögnunum. Þegar verið er að vinna með OLTP-vinnusvæði sem krefjast margs af ritunum geta þessi gagnaskrár tekið upp um 20–30% af tiltækri geymslupláss. Ef ekki er skilað nóg auka-plássi mun kerfið byrja að vinna harðar til að stjórna ritunum, sem eyðir SSD-hleðslunni hraðar og minnkar svarhraða. Samkvæmt viðurkenndum íþróttarstaðla þurfa flest kerfi sem meðhöndla um 50.000 viðskipti á mínútu að minnsta kosti 1,5 sinnum meiri grunngetu en grunngögnin sjálf til að taka á móti þessum ritunargögnunum, auk bilunarpláss og bráðabirgðaöflunargagnagrunnsaðgerða. Að skila um 15–20% auka-getu gerir raunverulegan mun. Það heldur áfram hæfri framleiðslu á tíma hámarksálaganna og lengir líftíma diskanna. Þetta er mjög mikilvægt, því það er sterkt tengsl á milli þess að hafa nógu mikla úthaldsgetu og að halda áfram áreiðanlegri rekstri yfir tíma, sérstaklega í mikilvægum viðskiptamálum þar sem óvirkt tími kostar peninga.
Virtúelleg umhverfi (vSphere/Hyper-V): Geta að skala eftir fjölda vélþátta á hverri vél og afritunarstefnu
Þegar fyrirtæki fara á netinu enda þau að þurfa miklu meiri geymslupláss vegna allra þessara virkulegu véla sem eru samanpökkðar, auk þess að hver gestaopertýsingarkerfi tekur upp pláss, og ekki einu sinni tala um myndavörf sem margfaldast alls staðar. Flestar virkulegu vélar þurfa á bilinu 40–100 GB aðeins fyrir stýrikerfið og forritin sín. En varðveita skal við myndavörur í tengslum við hugbúnaðaruppfærslur eða öryggisafritun þegar notkun geymsluplássins getur hækkað upp í tvöfalt. Ef umhverfi hefur yfir 50 virkulegar vélar í gangi ættu IT-aðilar líklega að frágreiða um fjórðung meira SSD-gildi sérstaklega til að meðhöndla myndavarametaupplýsingar, bráðabirgða afrit og þá óþægilegu skiptiskrár sem safnast saman með tímanum. Þunn útbúningur (thin provisioning) hjálpar að spara pláss í upphafi, en enginn vill rekast á skyndilega geymsluskortur síðar, svo reglulegar athuganir eru algjörlega nauðsynlegar til að koma í veg fyrir áhrif á framkvæmd. Til bestu niðurstöðu ætti að samsvara tíðni myndavara því tegund vinnuþyngdar sem við erum að vinna með. Mikilvægar framleiðsluskerfi gætu þurft myndavörur á klukkustundar fresti, en þróunar- og prófunarumhverfi geta líklega nýtt sér daglegar myndavörur. Þessi aðferð minnkar fjölda endurtekinnra gagnatilvísana án þess að skerða möguleikann á endurheimt við vandamál þegar það er nauðsynlegt.
Skrá- og gagnageymsluforrit: Viðbótargögn gegn kröfum um röðuð ákvörðun á framleiðslu
SSD-geymsla er skipt í milli meðhöndlunar á lýsigögn (metadata) og færslu á raunverulegum gögnum þegar unnið er með skrár- og hlutageymslu. Kerfi sem vinna með mikil magn af lýsigögnum, til dæmis myndaskrár í heilbrigðisþjónustu eða mjög stórar safn lagahefðarskjalasafna, þurfa oft að fráteka um fjórðung til þriðjungs af heildarplássinu bara fyrir hluti eins og skráavísitölur, flakk í möppum og stjórnun á því hver hefur aðgang að hvaða gögnum. Slík kerfi þurfa að minnsta kosti 15 þúsund IOPS á hverjar tíu terabætur ef þau vilja hratt svar við vinnumyndum með margar litlar skrár. Á hinn bóginn, kerfi sem leggja áherslu á að færa gögn í gegnum sig hratt frekar en að nálgast þau handahófskennt, svo sem myndskurðarstöðvar eða langtíma gagnageymslupöll, leggja meiri áherslu á beina ferða (straight-line speed). Þau þurfa venjulega að halda ritaflugi yfir 1,5 gigabæti á sekúndu samfellt. QLC-byggðar SSD-einingar eru í raun áskiljanlegar fjárhagslega fyrir geymslu slíkra gagnageymslu, en það er ein skilyrði sem þarf að taka tillit til. Ef diskarnir eru endurrituðir meira en um þrjá tíunda hluta af fullum getu þeirra á dag, þá slitna þeir miklu fyrr en væntanlegt er.
SSD-þolmæti og uppbygging: Af hverju verður geymslumagn að vera í samræmi við skrifunálag
Áhrif TBW, DWPD og NAND-tegundar: SLC-, TLC- og QLC-SSD-ar í framleiðslusamhengi
Þarfnastur SSD-hvítanna er háð þremur aðalþáttum: hversu mörg terabæt (TBW) má skrifa, daglegri skrifgetu (DWPD) og tegund nand-tækni sem notuð er inni í þeim. SLC NAND-geymir eru miklu meira varanleg en önnur, með 50.000 til 100.000 skrifcykla áður en þau slíta út. Aftur á móti kosta þau mikið meira, sem er ástæðan fyrir því að við sjáum þau að mestu leyti í skyndiminnisskerfum þar sem hraði er mikilvægastur, svo sem í þeim kerfum fyrir háfrekvenziskaup í fjármálum. TLC er á miðjum stað, með um 1.000 til 3.000 skrifcykla. Þetta gerir það nógu góða valmöguleika fyrir venjulegar fyrirtækjageymslunotkunarmöguleika þar sem bæði lesnir og skrifningar eiga sér stað oft. Þá er QLC, sem getur geymt miklu meiri gögn á minna rúmmáli og kostar minna á hverju gigabæti. En hér er vandamálið: það er ekki jafn varanlegt, að hámarki um 1.000 skrifcykla. Þetta virkar nægilega vel fyrir hluti sem eru lesnir oftara en skrifaðir, svo sem öryggisafrit, kerfisskráningar eða tímabundin skyndiminni fyrir vefsvæði sem veita efni.
AI/ML þjálfunarskýlur: Mat á áhrifum á QLC SSD með háum getu undir varanlegum skrifálagi
AI/ML þjálfunarskýlur krefjast einstaka, mikilla og varanlegra skrifmynstra – oft með endurtekin inntak, blöndun og athugun á mörgum terabætum stórum gagnasöfnum. Undir þessum skilyrðum er áhrif á QLC SSD aukin: samfelld 24/7 skrifun getur nýtt upp viðhaldsgetu þeirra á mánuðum í stað ára.
| NAND tegund | Skrifarit | Hæfni fyrir AI/ML þjálfun |
|---|---|---|
| QLC | ~1,000 | Takmörkuð; hentar aðeins fyrir stöðvun eða lesi-þungar afleiðingarlag |
| TLC | 1,000–3,000 | Mælt með fyrir flest þjálfunaraðgerðir, sérstaklega með yfirveitingu á 20% eða meira |
| SLC | 50.000–100.000 | Ítarlega hentug fyrir rauntíma aðlögun líkans eða eiginleikasafn með lágri dvalatími, þótt kostnaðurinn sé of háur í stórum skala |
Yfirveiting hjálpar til við að lengja líftíma QLC, en getur ekki komist yfir grundvallararkitekturuskort. Fyrir framleiðslu-AI-undirstöður er nauðsynlegt að samræma NAND-tegundina við búist við skrifþéttleika — ekki aðeins við geymslunotkun — til að koma í veg fyrir óáætlaðar skiptingar, afdrifshneytingar eða hættu fyrir gögnunum.