Przechowywanie danych: trendy na 2021 rok

Materia? Partnera
8 Min

Sposoby przechowywania i transferu danych stale ewoluuj?. W ci?gu ostatniej dekady przeszli?my d?ug? drog?. Post?p i sukcesy w zakresie poprawy pojemno?ci rozwi?za? pami?ci masowej, zwi?kszenia przepustowo?ci, zastosowania sztucznej inteligencji oraz poprawy bezpiecze?stwa danych, który dokona? si? w tym czasie nie da si? z niczym porówna?. Aby lepiej zrozumie? ten skomplikowany, cyfrowy ?wiat danych i to w jaki sposób liderzy bran?y IT wdra?aj? rozwi?zania pami?ci masowej w celu osi?gni?cia celów biznesowych, przygotowali?my pi?? najwa?niejszych trendów, które zdominuj? najbli?sze dwana?cie miesi?cy.

1. Bezpiecze?stwo hierarchicznych baz danych

Bezpiecze?stwo danych, które znajduj? si? zarówno w ruchu, jak i w spoczynku, to krytyczne obszary ochrony danych u?ytkownika w tak zwanym, rozproszonym modelu bazy. Trend ekosystemów hiperskalowych, znajduje si? ca?y czas na fali wznosz?cej, co pozwala na opracowywanie i skuteczne wdra?anie nowych rozwi?za? tak?e dla mniejszych przedsi?biorstw, które mog? nie mie? dost?pu do wymaganej infrastruktury. Coraz wi?cej natywnych aplikacji chmurowych dzia?a w punktach dost?powych lub centrach kolokacyjnych na ca?ym ?wiecie. W zwi?zku z rosn?c? popularno?ci? takiego modelu wspó?u?ytkowania zasobów, staje si? konieczna ochrona danych na ka?dym etapie procesu.

Szyfrowanie danych staje si? coraz bardziej powszechne, a w niektórych bran?ach jest wr?cz obowi?zkowe. Liczne zagro?enia wewn?trzne i zewn?trzne stanowi? ryzyko utraty danych zarówno dla tych znajduj?cych si? w ruchu jak i w miejscu. Dlatego Seagate zaleca jak najszybciej zastosowanie dysków szyfrowanych, aby w przysz?o?ci unikn?? problemów.

2. Szersze wykorzystanie obiektowej pami?ci masowej przez przedsi?biorstwa

Gwa?townie rosn?ca ilo?? u?ytecznych danych sprawia, ?e magazyny obiektowe staj? si? nowym standardem pami?ci masowej. Oferuj? one liczne korzy?ci w porównaniu z tradycyjnymi magazynami plikowymi, m.in. normatywne metadane, skalowalno?? oraz brak hierarchicznej struktury danych. Pami?? masowa dzieli si? na blokow?, plikow? i obiektow?. Pami?? blokowa ma kluczowe znaczenie w wielu aplikacjach, które maj? wysokie wymagania, je?eli chodzi o wydajno??. Pami?? plikowa od lat s?u?y tradycyjnym aplikacjom i zapewnia im niezawodn? infrastruktur?. Pami?? obiektowa skupia si? na nowych aplikacjach dzia?aj?cych w po??czeniu z pami?ci? blokow? w celu zapewnienia skalowalno?ci i wydajno?ci. Ponadto wiele tradycyjnych aplikacji plikowych przechodzi na infrastruktur? obiektow?, aby wykorzysta? skalowalno??, efektywno?? i dost?pno?? danych, jak? zapewnia obiektowa pami?? masowa.

Magazyny obiektowe staj? si? faktycznym standardem pami?ci masowej, szybko zast?puj?c magazyny plików ze wzgl?du na wi?ksz? efektywno?? i skalowalno??. Dane nie podlegaj? hierarchii katalogów i s? przechowywane w ahierarchicznej przestrzeni adresowej, s? przechowywane jako odr?bne obiekty a aplikacje rozpoznaj? odr?bne obiekty danych na podstawie ich unikalnego adresu.

3. Szersze wykorzystanie modu?owo?ci

Cho? pomys? rozdzielenia systemów na niezale?ne jednostki, które mo?na ??czy? z innymi niezale?nymi jednostkami, nie jest nowy, obecnie modu?owo?? jest wprowadzana na szersz? skal? w oparciu o oprogramowanie open source. U podstaw tego trendu le?y Kubernetes, system open source do automatyzacji wdra?ania, skalowania i zarz?dzania aplikacjami kontenerowymi. Open source, to przysz?o?? tworzenia aplikacji, poniewa? umo?liwia znacznie wi?kszej spo?eczno?ci prac? nad problemami, które stanowi? wyzwanie dla wielu bran?.

Dzisiejsze centra danych zmierzaj? w stron? modu?owo?ci, poniewa? u?atwia ona wdra?anie i przesuwanie zasobów bez wst?pnych konfiguracji i konieczno?ci statycznego ustawiania proporcji mi?dzy moc? obliczeniow?, pami?ci? operacyjn? i pami?ci? masow?. Kontenery i Kubernetes s? kluczowymi mechanizmami modu?owo?ci, a wszystkie centra danych, które jeszcze nie korzystaj? z tych technologii, wkrótce zaczn? je wprowadza?.

4. Obs?uga wielowarstwowej pami?ci masowej („gor?ce” dane w pami?ci flash, reszta na HDD)

Wielowarstwowa pami?? masowa to sposób na grupowanie danych w ró?ne kategorie i przypisywanie ich do ró?nych typów no?ników w celu optymalizacji wykorzystania zasobów. Ró?ne kategorie danych mo?na wyró?ni? na podstawie cz?sto?ci u?ycia lub poziomu wydajno?ci. Za przyk?ad mog? pos?u?y? procesory graficzne firmy NVIDIA, które dziel? pami?? na ró?ne poziomy (rejestry, pami?? wspó?dzielona i globalna). Ka?dy poziom ma inne w?a?ciwo?ci. Rejestry cechuj? si? niskimi opó?nieniami i ma?? pojemno?ci?. Pami?? globalna cechuje si? wysokimi opó?nieniami i du?? pojemno?ci?. NVIDIA zapewnia interfejs, który pozwala wykorzysta? wielowarstwow? pami?? i programowa? rozwi?zania zoptymalizowane pod k?tem tej architektury. Podobnie, nap?dy SSD i HDD mo?na traktowa? jako nale??ce do ró?nych warstw.

Dlaczego jest to istotne? System pami?ciowy z?o?ony z samych wysokowydajnych urz?dze? by?by prawdopodobnie dro?szy, ni? to konieczne. A system pami?ciowy z?o?ony z samych urz?dze? o wysokiej pojemno?ci prawdopodobnie nie zapewni?by wymaganej wydajno?ci. St?d bierze si? bie??cy trend dzielenia pami?ci masowej na warstwy: jest to sposób na osi?gni?cie najbardziej efektywnej równowagi mi?dzy kosztami a wydajno?ci?. W zwi?zku z pojawieniem si? nowych technologii (takich jak pami?? SCM) konieczne jest stosowanie architektur, które potrafi? w pe?ni wykorzysta? mocne strony wszystkich klas pami?ci masowej.

W ?wiecie nieograniczonych bud?etów centra danych sk?ada?yby si? wy??cznie z bardzo kosztownych no?ników pami?ciowych, takich jak Intel 3DXPoint. Niestety, realia ekonomiczne wymuszaj? stosowanie hierarchicznej architektury wielowarstwowej, w której „gor?ce” dane s? przechowywane na kosztownych i wysokowydajnych no?nikach, a rzadziej u?ywane dane znajduj? si? na ta?szych no?nikach o wysokiej pojemno?ci. Na szcz??cie oprogramowanie centrów danych coraz lepiej radzi sobie z identyfikowaniem „gor?cych” i „zimnych” danych oraz ich odpowiednim migrowaniem. Centra danych, które jeszcze nie wykorzystuj? zró?nicowanych no?ników do tych celów, albo trac? na wydajno?ci, albo p?ac? wi?cej ni? trzeba za pami?? masow?.

5. Formatywna sztuczna inteligencja

Ro?nie nie tylko tempo tworzenia danych, ale równie? ilo?? danych, które s? u?yteczne. Wskrzesza si? nawet dane archiwalne, poniewa? post?py w dziedzinie sztucznej inteligencji i uczenia maszynowego pozwalaj? u?ytkownikom wydoby? dodatkowe informacje z niegdy? zarchiwizowanych danych. Musimy by? przygotowani na przechowywanie i przetwarzanie jeszcze wi?kszej ilo?ci danych. Formatywna sztuczna inteligencja to sposób na wyci?ganie dodatkowych wniosków z dost?pnych danych. Gartner definiuje formatywn? sztuczn? inteligencj? jako „typ sztucznej inteligencji, która zmienia si? dynamicznie w reakcji na dan? sytuacj?”. Wed?ug IDC, formatywna sztuczna inteligencja to „ogólny termin, którym okre?la si? technologie sztucznej inteligencji i pokrewne rozwi?zania, które mog? dynamicznie si? zmienia? w reakcji na wariancje sytuacyjne”. Formatywna sztuczna inteligencja ma zwi?zek z trendem wielowarstwowo?ci, poniewa? wymaga elastycznej architektury, która mo?e inteligentnie reagowa? na zmiany. Przypu??my, ?e monitorujemy model AI i otrzymujemy sygna?, ?e zacz?? dryfowa?. Mo?emy wówczas u?y? innego modelu, aby wyszuka? odpowiednie dane szkoleniowe w warstwie dyskowej i automatycznie przenie?? je do warstwy flash, aby szkolenie przebieg?o szybciej. Ponadto warstwa dyskowa najprawdopodobniej by?aby magazynem obiektowym, co wpisuje si? równie? w trend obiektowej pami?ci masowej. Korzy?ci to szybko?? (poniewa? dane s? automatycznie przenoszone do szybkiej warstwy) oraz koszty (poniewa? dane mo?na przechowywa? na niedrogich dyskach w ?atwo dost?pnym formacie do czasu, a? b?d? potrzebne).

Ostatnie innowacje w dziedzinie uczenia maszynowego wreszcie uwolni?y od dawna obiecywany potencja? sztucznej inteligencji. Teraz techniki uczenia maszynowego potrzebuj? jeszcze wi?kszych zbiorów danych do wyci?gania jeszcze dok?adniejszych wniosków. Poniewa? trudno przewidzie? przysz?e post?py w uczeniu maszynowym, firmy powinny dzi? zachowywa? tyle swoich danych, ile tylko mog?, aby zagwarantowa?, ?e przysz?e analizy b?d? odbywa? si? przy u?yciu najlepszych mo?liwych danych szkoleniowych.

Udostępnij