Niedawna globalna awaria IT, która wystąpiła w systemie obsługi chmury na ogromną skalę, przypomniała o uniwersalnej prawdzie w technologii: nawet minimalne przestoje i zakłócenia w usługach są nieuniknione. Wywarty wpływ był szeroki, zakłócając świadczenie usług w handlu detalicznym, bankowości, opiece zdrowotnej i innych sektorach, jednak nie była to awaria unikatowa dla jednego dostawcy ani jednej chmury. Ilustruje to, że zakłócenia mogą wystąpić wszędzie: w dowolnym regionie chmury, u dowolnego dostawcy.
Najważniejsze wnioski są jasne: organizacje mogą i muszą przejąć kontrolę, budując odporną architekturę danych, która może dostosowywać się i rozwijać w obliczu ciągłych zmian. W tym wpisie na blogu przedstawimy, jak klienci firmy Cloudera mają unikatową pozycję do zapewniania ciągłości działania dzięki elastyczności naszej przenośnej architektury i narzędziom gwarantującym płynną pracę w trybie awaryjnym oraz odzyskiwanie. Cloudera to jedyna firma obsługująca platformy danych i AI, która wprowadza sztuczną inteligencję do danych w każdym miejscu: w chmurze, centrach danych i na krawędzi sieci.
Odporność danych to zdolność organizacji do wytrzymywania, szybkiego odzyskiwania sprawności po wystąpieniu i minimalizowania wpływu zakłóceń lub awarii związanych z danymi. Jest to proaktywne podejście do zapewniania ciągłości działania, wykraczające poza tworzenie kopii zapasowych lub odzyskiwanie po awarii, w celu zapewnienia, że krytyczne dane zawsze będą:
Dostępne: dostępne dla użytkowników i aplikacji w razie potrzeby (minimalizując cel czasu odzyskiwania lub RTO)
Nienaruszone/dokładne (integralność danych): nieuszkodzone i niezmienione (minimalizowanie celu punktu odzyskiwania lub RPO)
Bezpieczne: chronione przed nieautoryzowanym dostępem, utratą lub kradzieżą
Opracowywanie architektury pod kątem prawdziwej odporności obejmuje dwa podstawowe, połączone ze sobą filary: technologię umożliwiającą przenośność i sprawdzony proces pracy w trybie awaryjnym.
Poleganie na jednym dostawcy, jednej chmurze lub nawet jednym regionie w chmurze stwarza krytyczną lukę w zabezpieczeniach firmy lub pojedynczy punkt awarii. Przerwy w działaniu są powodowane awariami sprzętu, problemami z oprogramowaniem, błędami ludzkimi, klęskami żywiołowymi lub cyberatakami. Celem odporności jest zapewnienie, że gdy jedno środowisko ulegnie awarii, działania operacyjne mogą być płynnie i automatycznie kontynuowane w innym miejscu.
Oznacza to, że konieczne jest zapewnienie możliwości pracy w trybie awaryjnym w dowolnym miejscu — między regionami chmury, między dostawcami chmury, a nawet w samym centrum danych. Operacje biznesowe muszą być kontynuowane, a krytyczne systemy muszą pozostać aktywne, niezależnie od tego, gdzie wystąpiły początkowe zakłócenia.
Technologia może dostarczać funkcji zwiększania odporności, ale sam proces jest niezbędny dla zapewniania z powodzeniem ciągłości działania. Zbyt wiele planów odzyskiwania po awarii jest pisanych raz i rzadko ponownie przeglądanych, nawet mimo ewolucji ludzi i technologii. Dokładnie sprawdzony plan jest dokumentowany, praktykowany i regularnie przeglądany w celu zapewnienia możliwości dalszego działania organizacji w razie awarii. Oto niektóre elementy planu:
Określenie priorytetów obciążeń w celu zapewnienia, że operacje o krytycznym znaczeniu, takie jak przetwarzanie transakcji w handlu detalicznym i zdalny monitoring w służbie zdrowia, mają najniższe poziomy umów dotyczących poziomu usług (SLA) dla celów RTO i RPO.
Zapewnienie redundancji i wysokiej dostępności poprzez ustanowienie możliwości pracy w trybie awaryjnym między środowiskami w celu dalszego wykonywania operacji.
Tworzenie kopii zapasowych krytycznych danych i metadanych oraz ustanawianie zasad przechowywania i zarządzania.
Cloudera to jedyny dostawca platformy danych i sztucznej inteligencji, który zapewnia spójne środowisko chmury dla danych w każdym miejscu. Daje to przedsiębiorstwom swobodę przenoszenia danych oraz obciążeń AI między chmurami i centrami danych — bez utrudnień ani uzależnienia od dostawcy — dzięki czemu nie jest się już związanym z żadną infrastrukturą. W rezultacie organizacje mogą zmniejszyć ryzyko biznesowe, wykorzystując Cloudera do tworzenia architektury pod kątem odporności i utrzymywania spójnych operacji oraz zgodności z przepisami niezależnie od tego, gdzie znajdują się dane.
Platforma Cloudera zapewnia wysoką dostępność i tolerancję na awarie dzięki naszym rozwiązaniom i usługom, takim jak:
Przenośne usługi danych: platforma Cloudera, w tym usługi danych natywne dla chmury i jezioro danych, działają spójnie w dowolnej chmurze (AWS, Azure, Google Cloud) oraz lokalnie na platformie Kubernetes. Dzięki niezależności od podstawowej infrastruktury klienci mogą konfigurować wiele dostępnych lokalizacji, łącząc różne chmury i zasoby lokalne, co znacznie zmniejsza zależność od jednej platformy lub jednego dostawcy.
Dane w ruchu: Cloudera Data Flow, analityka na strumieniu danych Cloudera i Cloudera Streams Messaging umożliwiają klientom przechwytywanie, przetwarzanie i rozpowszechnianie danych w każdym miejscu w czasie rzeczywistym. W przypadku obciążeń krytycznych w czasie rzeczywistym, takich jak wykrywanie oszustw i monitorowanie sieci, potencjalna awaria może mieć znaczący wpływ na biznes. Cloudera zapewnia, że te usługi pozostają wysoce dostępne i mogą być replikowane w różnych środowiskach.
Replication Manager: ten podstawowy komponent Cloudera zapewnia uproszczone podejście do tworzenia kopii zapasowych i odzyskiwania danych. Replikuje nie tylko dane, ale także metadane, krytyczne zasady bezpieczeństwa i zarządzania związane z tymi danymi. Ta replikacja umożliwia łatwą migrację, ciągłą synchronizację i, co najważniejsze, możliwość szybkiej pracy w trybie awaryjnym poprzez promowanie pomocniczego, zreplikowanego środowiska obok podstawowego środowiska operacyjnego przy minimalnej utracie danych.
Open Data Lakehouse: otwarta architektura data lakehouse firmy Cloudera umożliwia bezpieczne zarządzanie danymi i przenośną analizę danych w chmurze zgodnie z podejściem „napisz raz, uruchom wszędzie”. Eliminuje to czas i koszty związane z refaktoryzacją aplikacji lub obciążeń podczas przechodzenia między różnymi infrastrukturami.
Rysunek 1. Cloudera zapewnia dostęp do chmury w dowolnym miejscu dla AI w każdym miejscu
Łącznie te funkcje umożliwiają klientom firmy Cloudera pewne wykonywanie kluczowych obciążeń AI i danych, gwarantując na niemal zerowym poziomie czas przestoju i utratę danych dla najważniejszych procesów biznesowych, nawet w razie awarii infrastruktury.
Dla wielu firm, niedawna awaria była tylko drobnym zakłóceniem. Ale co, jeśli zakłócenie byłoby prawdziwą katastrofą, jak wojna? Mieszczący się w Ukrainie AM-BITS, dostawca rozwiązań informatycznych dla sektora bankowego, telekomunikacyjnego i handlu detalicznego, stanął w obliczu pilnej potrzeby zabezpieczenia i zmigrowania danych swoich klientów o znaczeniu krytycznym po tym, jak zakłócenia geopolityczne zmusiły organizacje do gwałtownego przyspieszenia przechodzenia z systemów lokalnych do chmury. Typowa migracja do chmury może potrwać sześć miesięcy lub dłużej — jest to horyzont czasowy, na który wiele firm nie może sobie pozwolić.
Aby zaradzić kryzysowi utrzymania ciągłości, firma AM-BITS utworzyła nowoczesną, obsługującą wielu użytkowników platformę danych i sztucznej inteligencji opartą na rozwiązaniach firmy Cloudera. Dzięki wykorzystaniu rozwiązania Cloudera Shared Data Experience (Cloudera SDX) firma AM-BITS szybko zapewniła „techniczną bezpieczną przystań” dla zasobów danych swoich klientów, radykalnie skracając czas bezpiecznej migracji danych do chmury o 50%. Ponieważ Cloudera działa bezproblemowo w każdym środowisku, klienci AM-BITS zyskali prawdziwą elastyczność: mogli szybko przeprowadzić migrację do chmury, ale także zachowali opcję przejścia do innej chmury lub przeniesienia danych z powrotem do swojej lokalizacji. Wykorzystując Cloudera, firma AM-BITS przekształciła przenośność w potężne narzędzie zapewniające ciągłość działalności.
Zakłócenia i awarie związane z danymi mogą być spowodowane awariami sprzętu, problemami z oprogramowaniem, błędem ludzkim, klęskami żywiołowymi, cyberatakami i innymi. Bardzo ważne jest, aby organizacje projektowały swoje systemy z myślą o tych punktach awarii i miały plan szybkiego odzyskiwania swoich systemów informatycznych i danych bez większych zakłóceń.
Aby dowiedzieć się więcej o tym, jak można zaprojektować architekturę pod kątem zapewniania odporności z Cloudera, zapoznaj się z naszą listą kontrolną i zasobami dotyczącymi odzyskiwania po awarii lub skontaktuj się z naszym zespołem usług konsultingowych, który może pomóc zaprojektować plan zapewniania odporności.
This may have been caused by one of the following: