Informacje ogólne
Kompleksowa platforma do przetwarzania strumieni danych w czasie rzeczywistym od krawędzi po chmurę.
Cloudera DataFlow (CDF) to skalowalna platforma do analityki na danych czasu rzeczywistego, umożliwiająca pozyskiwanie, transformację i analizę danych oraz podejmowanie natychmiastowych decyzji. DataFlow odpowiada na następujące wyzwania:
- Przetwarzanie danych o dużym wolumenie w czasie rzeczywistym
- Śledzeniu ścieżki pochodzenia i przepływu danych
- Zarządzaniu i monitorowaniu agentów w urządzeniach brzegowych i źródłach danych strumieniowych
- Uzyskiwanie analiz w czasie rzeczywistym i możliwych do wykorzystania informacji na podstawie strumieni danych
Rozszerz usługę DataFlow na platformę Cloudera Data Platform
Funkcje usługi DataFlow są dostępne w usłudze CDP Public Cloud w dwóch opcjach wdrożenia–DataFlow for Data Hub i DataFlow for the Public Cloud–szczegółowo opisano to poniżej. Korzystaj z kluczowych zalet usługi CDP Public Cloud, takich jak szybkie aprowizowanie klastrów, zarządzanie, monitorowanie oraz ujednolicone funkcje bezpieczeństwa i nadzoru usługi SDX w całym cyklu życia danych.
Opcje wdrażania
Platforma strumieni danych od krawędzi do chmury w środowiskach lokalnych, chmury publicznej i chmury hybrydowej.
DataFlow for Data Hub
- Szybko uruchamiaj klastry Apache NiFi w celu pozyskiwania danych na dużą skalę za pomocą funkcji Flow Management for Data Hub
- Rozszerzaj lokalne klastry Apache Kafka na chmurę publiczną za pomocą usługi Streams Messaging for Data Hub
- Przyspiesz przetwarzanie strumieniowe w czasie rzeczywistym za pomocą usługi Apache Flink w chmurze hybrydowej dzięki analityce na strumieniu w usłudze Data Hub
DataFlow for the Public Cloud
- Zmniejsz koszty infrastruktury chmury, umożliwiając automatyczne skalowanie przepływów natywnych dla chmury
- Zarządzaj wszystkimi przepływami NiFi i monitoruj je w wielu klastrach w chmurze na scentralizowanym pulpicie nawigacyjnym
- Przyspiesz rozwój, wykorzystując gotowe przepływy NiFi z galerii ReadyFlows
Platforma Cloudera DataFlow
Edge & Flow Management
Kontroluj i monitoruj urządzenia krawędziowe oraz zarządzaj nimi w ramach inicjatyw związanych ze strumieniami danych i IoT oraz dostarczaj strumienie danych w czasie rzeczywistym, korzystając z pozyskiwania i zarządzania bez potrzeby programowania.
Streams Messaging
Buforuj i skaluj ogromne ilości pozyskiwanych danych, aby zaspokoić potrzeby w zakresie danych w czasie rzeczywistym innych aplikacji korporacyjnych i chmurowych.
Stream Processing & Analytics
Zapewnij wgląd w czasie rzeczywistym, aby poprawić wykrywanie zdarzeń krytycznych i reagowanie na nie, uzyskując cenne rezultaty biznesowe.
Przykłady wykorzystania
Modernizacja rejestrowania
Klient 360
Wgląd w czasie rzeczywistym
Modernizacja logowania
Uwolnij wartość danych generowanych maszynowo dzięki modernizacji rejestrowania CDF.
Modernizacja logowania to holistyczne podejście do uwolnienia wartości danych generowanych maszynowo poprzez obniżenie kosztów przetwarzania i udostępnienie szeregu nowych przypadków użycia analityki. Osiąga się to poprzez pozyskiwanie danych w czasie rzeczywistym, przetwarzanie krawędziowe, transformację i kierowanie danych logów do analizy opisowej, preskryptywnej i predykcyjnej.
Klient 360
Uzyskaj pełny obraz swojego klienta, zbierając wszystkie dane z wielu źródeł.
Jedną z głównych inicjatyw w zakresie transformacji cyfrowej w organizacjach jest poznanie pełnego obrazu klientów. Dane klientów istnieją jednak w wielu źródłach danych, takich jak tradycyjne bazy danych przedsiębiorstw, jeziora danych, magazyny w chmurze i kanały społecznościowe. Funkcje pozyskiwania danych i przesyłania wiadomości CDF umożliwiają bezproblemowe pozyskiwanie, łączenie, wzbogacanie i przetwarzanie danych ze wszystkich tych źródeł danych oraz zapewniają pełną widoczność klienta.
Wgląd w czasie rzeczywistym
Przewiduj awarie i podejmuj działania naprawcze w czasie rzeczywistym.
Wdrożenia IoT lub analityki na strumieniu danych są na tyle dobre, na ile potrafisz wykorzystać wartość danych, które pozyskujesz w czasie rzeczywistym. Przypadki użycia IoT, takie jak konserwacja predykcyjna lub monitorowanie pacjentów, wymagają natychmiastowego przyswajania i przetwarzania danych w celu wygenerowania predykcyjnych i preskryptywnych analiz w czasie rzeczywistym. W niektórych przypadkach mogą to być informacje ratujące życie.
Zaktualizuj obciążenia przetwarzania strumieni do platformy CDP
Cloudera Data Platform (CDP) to nowa chmura danych korporacyjnych (enterprise data cloud). Dzięki usłudze Cloudera DataFlow w ramach platformy CDP firmy mogą obsługiwać obciążenia strumieniowe – od gromadzenia danych na krawędzi po analitykę na strumieniu w chmurze.