Informacje ogólne
Szybko i łatwo wdrażaj szeroką gamę narzędzi do analityki w chmurze publicznej.
Cloudera Data Hub to zaawansowana usługa analityczna dla Cloudera w chmurze, która ułatwia i przyspiesza uzyskiwanie wartościowych analiz od urządzeń brzegowych po sztuczną inteligencję w znanym modelu klastrowym w chmurze. Dzięki oferowaniu najszerszego zakresu obciążeń analitycznych — w tym przesyłania strumieniowego, ETL, hurtowni danych, baz danych i uczenia maszynowego — usługa Data Hub umożliwia łatwe przenoszenie istniejących obciążeń ze środowisk lokalnych do chmury lub tworzenie ich bezpośrednio w chmurze.
To kompleksowe, bazujące na chmurze rozwiązanie jest obsługiwane przez aparat Cloudera Runtime, zestaw zintegrowanych technologii open source, i oparte na usłudze SDX. Oferuje ono szeroki wybór kształtów klastrów, typów obciążeń, gotowych szablonów i opcji konfiguracji, zapewniając intuicyjne i konfigurowalne środowisko dla użytkowników, którzy są zaznajomieni z tradycyjną architekturą.
Przypadki zastosowań usługi Data Hub
Uprość swoją podróż do chmury
Łatwo przenoś lokalne obciążenia Cloudera do chmury publicznej dzięki platformie, która obejmuje chmury zarówno publiczne, jak i prywatne oraz zapewnia następujące korzyści:
- Lepsza wydajność, niezawodne zarządzanie i dostępność chmury publicznej
- Elastyczność dzięki optymalizacji obciążeń w obu modelach wdrażania
- Zalety znanego formatu z tradycyjnym modelem klastra ułatwiającym przejście do chmury
- Sprawna ścieżka migracji do skonteneryzowanych środowisk Cloudera
Szybkie wdrażanie złożonych obciążeń wieloanalitycznych
Przyspiesz wdrażanie złożonych obciążeń w chmurze publicznej w obrębie całego cyklu życia danych dzięki następującym rozwiązaniom:
- Architektura oparta na chmurze, która umożliwia wdrażanie szerokiej gamy elastycznych, niestandardowych obciążeń analitycznych
- Intuicyjne środowisko z zastosowaniem znanych klastrów opartych na węzłach, niezależnie od tego, czy stosowane będzie podejście oparte na szablonach, czy opracowane zostaną własne obciążenia
- Wysoki stopień dostosowania, umożliwiający wdrażanie obciążeń doskonale dostosowanych do konkretnych wymagań biznesowych
Wybierz obciążenia
- Hurtownia danych w czasie rzeczywistym
- Inżynieria danych dla potoków złożonych
- Przesyłanie strumieniowe w chmurze hybrydowej
- Operacyjna baza danych
Hurtownia danych w czasie rzeczywistym
Zapewnij analitykę dla dużych ilości szybko przychodzących danych.
Szablon hurtowni danych w czasie rzeczywistym w usłudze Data Hub umożliwia pozyskiwanie milionów rekordów na sekundę, w razie potrzeby z aktualizacjami w miejscu. Dane są natychmiast dostępne w formacie optymalnym do zapytań. Ten wzorzec jest idealny dla aplikacji szeregów czasowych, analityki zdarzeń, uzgadniania CDC i potoków przetwarzania danych w czasie rzeczywistym. Szablon obejmuje aparat magazynu na potrzeby analityki danych Apache Kudu, aparat Apache Impala do szybkiego wykonywania zapytań języka SQL, edytor HUE do opracowywania i analizowania zapytań SQL oraz interfejs Apache Spark Streaming do przetwarzania/analityki na strumieniu.
Inżynieria danych dla potoków złożonych
Wzbogacanie, przekształcanie i ładowanie danych.
Usługa Data Hub umożliwia wzbogacanie, przekształcanie i czyszczenie danych w celu tworzenia i wykonywania kompleksowych potoków danych oraz zarządzania nimi z wysokim stopniem elastyczności i dostosowania. Szablon inżynierii danych umożliwia wykonywanie szerokiego zakresu obciążeń przetwarzania danych, w tym przetwarzania zbiorczego i strumieniowego w czasie rzeczywistym przy użyciu platform Apache Spark i Hive.
Przesyłanie strumieniowe w chmurze hybrydowej
Gromadzenie, przetwarzanie i tworzenie analiz w czasie rzeczywistym
DataFlow dla usługi Data Hub to wszechstronna platforma przesyłania strumieniowego danych od urządzeń brzegowych do chmury, która rozwiązuje pewne problemy z przesyłaniem strumieniowym danych w środowiskach hybrydowych z zastosowaniem platform Apache NiFi i Kafka. Umożliwia ona użytkownikom rozszerzenie tego samego lokalnego środowiska przesyłania strumieniowego usługi Cloudera DataFlow na chmurę bez wykorzystywania ogromnych zasobów na potrzeby rozwijania, konfigurowania i konserwowania rozwiązań.
Operational Database
Twórz wysoce niezawodne aplikacje klasy korporacyjnej.
Usługa Data Hub umożliwia uruchamianie wysokowydajnych baz danych NoSQL z obsługą języka ANSI SQL. Zapewnia to niezrównaną skalę i wydajność kluczowych dla firmy aplikacji operacyjnych z wykorzystaniem bazy danych Apache Hbase. Usługa Operational Database zapewnia obsługę ewolucyjnych schematów, która umożliwia programistom wykorzystanie możliwości danych przy jednoczesnym zachowaniu elastyczności w projektowaniu aplikacji. Zapewnia również automatyczne skalowanie w oparciu o użycie obciążenia klastra w celu optymalizacji wykorzystania infrastruktury i kosztów.