• Cloudera Cloudera
  • Już dziś sprawdź możliwości chmury publicznej Cloudera Data Platform
    Informacje ogólne

    Bezpiecznie usprawnij i operacjonalizuj potoki danych w dowolnej skali.

    Usługa CDP Data Engineering jest jedyną usługą natywną w chmurze stworzoną specjalnie dla zespołów inżynierii danych w przedsiębiorstwach. Oparta na rozwiązaniu Apache Spark usługa Data Engineering to kompleksowy zestaw narzędzi do inżynierii danych, który umożliwia automatyzację orkiestracji za pomocą Apache Airflow, a także zapewnia zaawansowane monitorowanie procesów, wizualne rozwiązywanie problemów i kompleksowe narzędzia do zarządzania w celu usprawnienia procesów ETL w zespołach analitycznych przedsiębiorstwa.

    Usługa Data Engineering jest w pełni zintegrowana z platformą Cloudera Data Platform, co zapewnia kompleksową widoczność i bezpieczeństwo dzięki SDX, a także bezproblemową integrację z usługami CDP, takimi jak Data Warehouse i Machine Learning . Usługa Data Engineering na platformie CDP zapewnia spójne, powtarzalne i zautomatyzowane procesy związane z inżynierią danych na platformie chmury hybrydowej w dowolnym miejscu.

    Przykłady wykorzystania

    • Automatyzuj procesy danych w dowolnym miejscu
    • Uzyskaj widoczność i kontrolę nad ETL
    • Zachowaj integralność danych

    Automatyzuj procesy danych w dowolnym miejscu


    Bezpiecznie dostarczaj wysokiej jakości zestawy danych do usług CDP Data Warehouse, CDP Machine Learning lub dowolnego innego narzędzia analitycznego.

    Usługa Data Engineering upraszcza potoki danych do zespołów analitycznych – od uczenia maszynowego po hurtownie danych i nie tylko. Skróć czas do uzyskania wartości dzięki organizacji i automatyzacji potoków, aby dostarczać zorganizowane i przejrzyste zbiory danych wysokiej jakości w dowolnym miejscu.

    Sprawdź w praktyce

    Uzyskaj widoczność i kontrolę nad ETL


    Holistycznie zarządzaj cyklem życia danych w przejrzysty sposób.

    Zarządzanie cyklem życia danych i kontrolowanie kosztów stają się coraz bardziej złożone, gdy próbuje się operacjonalizować potoki danych w całym przedsiębiorstwie na dużą skalę.

    Usługa Data Engineering oferuje zestaw funkcji kontroli operacyjnej i widoczności na potrzeby planowania wydajności, automatyzacji procesów, automatycznej identyfikacji pochodzenia i rozwiązywania problemów w biznesowych przypadkach użycia.

    Przeczytaj blog

    Abstrakcyjny obraz sugerujący widoczność i kontrolę

    Zachowaj integralność danych


    Pełna widoczność potoku danych w celu ochrony Twojej firmy.

    Wraz ze wzrostem ilości i złożoności danych zapewnienie stałej dokładności i wierności na potrzeby skalowania obciążeń analitycznych w całej firmie może być trudne.

    Data Engineering oferuje natywne monitorowanie potoku danych i ostrzeganie w celu wczesnego wykrywania problemów, a także wizualne rozwiązywanie problemów, które pozwala szybko eliminować problemy, zanim wpłyną one na firmę.

     

    Zrzut ekranu: rozwiązywanie problemów z potokiem danych

    Główne cechy

    Organizuj złożone procesy transformacji danych wspierane przez Apache Airflow z setkami operatorów, aby spełnić krytyczne wymagania analityczne.

    Usługa Data Engineering jest skonteneryzowana, skalowalna i przenośna, z izolowanymi środowiskami obciążeń i limitami, co umożliwia bezpieczne zarządzanie potokami za pomocą elastycznych obliczeń na żądanie w celu spełnienia wymogów umów SLA w efektywny kosztowo sposób.

    Wizualizuj metryki wydajności, w tym w zakresie procesora, pamięci i operacji we/wy na wszystkich etapach zadań Spark, aby wskazać wąskie gardła wydajności i zidentyfikować „igłę w stogu siana” podczas rozwiązywania problemów.

    Wykorzystaj obszerny interfejs zarządzania zadaniami za pośrednictwem interfejsów API CLI i REST, aby z łatwością automatyzować i integrować istniejące procesy, takie jak potoki CI/CD i narzędzia innych firm.

    Usługa Data Engineering oferuje w pełni zintegrowaną usługę Spark na platformie Kubernetes, która automatyzuje i usprawnia zarządzanie artefaktami, zabezpieczenia i planowanie zasobów – wykorzystując Apache Yunikorn do tworzenia harmonogramów FIFO i GANG.

    Za pomocą scentralizowanego interfejsu administratorzy platformy mogą zarządzać dostępem i zabezpieczeniami, a następnie szybko udostępniać nowe obciążenia, jednocześnie łatwo monitorując zasoby i wizualizując wykorzystanie zasobów w czasie. SDX umożliwia również śledzenie pochodzenia w całym cyklu życia, dzięki czemu wiesz, skąd pochodzą dane i dokąd zmierzają.

    Chcesz dowiedzieć się więcej?


    Osobiście zapoznaj się z usługą Data Engineering na platformie Cloudera Data Platform

    Jak zacząć

    Prezentacja CDP

    Obejrzyj prezentację na żądanie, aby dowiedzieć się, jak przyspieszyć procesy inżynierii danych w przedsiębiorstwie w dowolnym miejscu.

    Dowiedz się więcej

    Odkryj filmowy przewodnik po CDP


    Przyjrzyj się z bliska CDP w filmie i odkryj, jak bezpieczne i zoptymalizowane przepływy zadań w zakresie inżynierii danych mogą przysłużyć się Twojej firmie.

    Obejrzyj teraz

    Zasoby techniczne CDP

    Oszczędzaj czas, zdobądź wiedzę i rozwiń swoje umiejętności dzięki dostępowi z jednego miejsca do informacji i zasobów technicznych.

    Uzyskaj odpowiedzi

    Bezpłatne szkolenie

    Uzyskaj dostęp do szkoleń na żądanie, aby rozpocząć korzystanie z usługi Data Engineering i umożliwić szybkie i bezpieczne dostarczanie potoków w całym przedsiębiorstwie.

    Do nauki

    Cennik

    Sprawdź ceny, warunki rozliczeń, szczegóły licencji i stawki godzinowe, a także szacuj koszty za pomocą wygodnych kalkulatorów.

    Poznaj ceny

    Dokumentacja produktu

    Zacznij we właściwy sposób dzięki dostępowi do informacją na temat planowania zasobów, konfiguracji produktów i najlepszym praktykom w zakresie inżynierii danych.

    Przeczytaj teraz

    Ebook

    CDP Data Engineering: Przenoszenie cyklu życia danych na wyższy poziom

    Webinar

    Webinar Cognilytica: Optymalizacja procesów inżynierii danych

    Whitepaper

    Lista kontrolna cyklu życia inżynierii danych AI

    Webinar

    Inżynieria danych w przedsiębiorstwie: jak przyspieszyć i skalować potoki danych

    Szkolenia, wsparcie i doradztwo na światowym poziomie

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.