Bezpieczne przechowywanie, przetwarzanie i analiza danych w spoczynku
Hortonworks Data Platform (HDP) to rozwiązanie open source do rozproszonego przechowywania i przetwarzania dużych wolumenów danych pochodzących z różnych źródeł. HDP pozwala unowocześnić infrastrukturę IT, zapewnić bezpieczeństwo danych — w chmurze i lokalnych centrach — przy jednoczesnej kontroli kosztów, polepszeniu obsługi klienta i generowaniu nowych źródeł przychodów.
Migracja do Cloudera Data Platform
Wybierz poniżej swoją obecną platformę, aby uzyskać zalecenia dotyczące migracji, a także zasoby dostosowane do Twojego środowiska.
Moja bieżąca platforma:
Najważniejsze zalety i funkcje
HDP pozwala na wykorzystanie kart graficznych (GPU) do zwiększenia efektywności obliczeń modeli uczenia maszynowego i sztucznej inteligencji. Tworzenie puli GPU umożliwia współdzielenie zasobów GPU pomiędzy różnymi aplikacjami co prowadzi do większej efektywności kosztowej. Wspierana jest także izolacja - możliwość przypisania GPU do określonej aplikacji tak, by żadna inna aplikacja nie miała do niego dostępu.
HDP wspiera skonteneryzowany TensorFlow, który, w połączeniu z pulami GPU, ułatwia projektowanie, tworzenie i szkolenie modeli głębokiego uczenia.
HDP zapewnia swobodę pracy w środowiskach hybrydowych i wielochmurowych, bez zależności od poszczególnych dostawców usług chmurowych. Klienci mogą dzięki temu w łatwy sposób tworzyć klastry i zarządzać nimi w dowolnym środowisku chmurowym. HDP to narzędzie niezależne od dostawcy chmury, które automatyzuje proces tworzenia i upraszcza stosowanie big data, przy jednoczesnej optymalizacji wykorzystania zasobów chmury.
Wsparcie dla natywnych systemów plików, takich jak Microsoft ADLS, WASB, AWS S3 i Google Cloud Storage, umożliwia przechowywanie dowolnej ilości danych. Cloudbreak pozwala na łatwą instalację klastrów HDP na infrastrukturze preferowanych dostawców chmurowych.
Hortonworks Data Platform to również większa skuteczność zapytań i krótszy czas oczekiwania na odpowiedź. Hive LLAP, najszybszy silnik Apache Hive, pozwala na jednoczesną pracę wielu użytkowników bez konkurowania o zasoby. Technologia drastycznie przyspiesza zapytania standardowo wykorzystywane w scenariuszach Business Intelligence, takie jak łączenia i agregacje. Poza optymalizacją zapytań, Hive umożliwia także tworzenie pul zasobów, umożliwiając jeszcze bardziej zaawansowane zarządzanie alokacją zasobów.
HDP ma domyślnie włączone transakcje ACID, upraszczając tym samym aktualizację danych w tablicach i realizacje wymogów RODO. Jako baza danych czasu rzeczywistego, Hive pozwala na pracę z procesami wymagającymi niskiej latencji i wysokiej przepustowości, co pozwala na szybsze przetwarzanie większych wolumenów danych.
HDP kontynuuje tradycję bezkopromisowego podejścia do bezpieczeństwa i zarządzania danymi. Warstwa bezpieczeństwa obejmuje pełne wsparcie dla uwierzytelnienia, autoryzacji, odpowiedzialności (przypisania działań do konkretnych osób) i ochrony danych. Zintegrowanie bezpieczeństwa i zarządzania metadanymi pozwala pracownikom ustalać reguły bezpieczeństwa wykorzystując biznesowe klasyfikacje i hierarchie, spójne dla wszystkich aplikacji i procesów w platformie.
Warto wspomnieć, że dodatkowe funkcje platformy umożliwiają szczegółową kontrolę zdarzeń, ułatwiając pracę audytorom. Zarówno oni, jak i użytkownicy, mogą w pełni kontrolować przepływ danych przez ekosystem, a ponadto dzięki tagom zachować kontekst biznesowy wrażliwych danych. Na koniec warto również wspomnieć o funkcji tymczasowego dostępu do zasobów, czyli udzielania użytkownikowi dostępu z ograniczeniem czasowym.