Cloudera Data Engineering

Buduj, organizuj i nadzoruj potoki danych klasy korporacyjnej z Apache Spark na platformie Iceberg. Obsługuj skalowalną AI i wielofunkcyjną analitykę, od chmur po centra danych.

OGÓLNE INFORMACJE

Otwarty standard inżynierii danych dla przedsiębiorstw

Rozwiązanie Data Engineering umożliwia zespołom w przedsiębiorstwie bezpieczne budowanie, automatyzowanie i skalowanie potoków danych w oparciu o otwarte jezioro. Obsługuj wielofunkcyjną analizę i sztuczną inteligencję w kontekście danych z dowolnego miejsca.

Schemat rozwiązania Cloudera Data Engineering

Ujednolicaj ustrukturyzowane i nieustrukturyzowane dane dzięki całkowicie otwartemu rozwiązaniu Apache Spark na platformie Iceberg i orkiestracji za pomocą Airflow — bez konieczności wiązania z pojedynczym dostawcą.

Twórz potoki danych, uruchamiaj je i zarządzaj nimi w dowolnym miejscu — w chmurach, centrach danych lub środowiskach hybrydowych — dzięki elastyczności zapewnianej przez kontenery i ujednoliconemu nadzorowi.

Osiągnij efektywność kosztową dzięki narzędziom do zarządzania finansami służącym do optymalizacji zasobów, obejmującym możliwość obserwowalności na poziomie obciążeń, automatyczne skalowanie i udostępnianie danych bez ETL.

PRZYKŁADY ZASTOSOWANIA

Twórz kompleksowe potoki danych, aby przyspieszyć działanie sztucznej inteligencji i analityki.

Buduj skalowalne potoki danych w dowolnym miejscu

Zapewnij przenośność obciążeń, korzystaj z otwartych standardów i zadbaj o skalowalność zarówno w chmurze, jak i w środowisku lokalnym.

Przyspiesz DataOps dzięki orkiestracji

Automatyzuj przepływy pracy, iteruj potoki i upraszczaj współpracę.

Udostępnianie danych Zero-ETL

Umożliwiaj bezpieczny i zaufany dostęp do danych, zarówno wewnętrznie, jak i zewnętrznie.

Monitoruj i optymalizuj koszty potoków

Obniż TCO dzięki usłudze Observability i wydajnym obliczeniom.

Buduj skalowalne potoki danych w dowolnym miejscu

Zapewnij przenośność obciążeń, korzystaj z otwartych standardów i zadbaj o skalowalność zarówno w chmurze, jak i w środowisku lokalnym.

Przyspiesz DataOps dzięki orkiestracji

Automatyzuj przepływy pracy, iteruj potoki i upraszczaj współpracę.

Udostępnianie danych Zero-ETL

Umożliwiaj bezpieczny i zaufany dostęp do danych, zarówno wewnętrznie, jak i zewnętrznie.

Monitoruj i optymalizuj koszty potoków

Obniż TCO dzięki usłudze Observability i wydajnym obliczeniom.

20%

zwiększona wydajność zespołu ds. danych

Zwiększ wydajność dzięki przenośności, koordynacji i ujednoliconemu dostępowi do danych lokalnych w chmurze Cloudera.

Korzystaj z rozwiązań Spark, Iceberg i Airflow z dowolnego miejsca dzięki interfejsom inżynierii danych natywnym dla chmury.

Zobacz webinar

Zwiększ produktywność użytkowników dzięki intuicyjnym i zabezpieczonym narzędziom korporacyjnym

Twórz, testuj i orkiestruj potoki przy użyciu rozwiązań Sessions i Apache Airflow.

Poznaj historię naszego klienta

Dostarczaj świeże dane do dalszych potoków i na platformy zewnętrzne.

Nawiązuj połączenia z zewnętrznymi silnikami za pośrednictwem Iceberg REST Catalog z zarządzaniem metadanymi i pochodzeniem danych.

Przeczytaj blog

Zrzut ekranu produktu Cloudera Observability

Skaluj mądrzej dzięki nadzorowi nad finansami na poziomie obciążeń

Optymalizuj koszty dzięki wbudowanym analizom i energooszczędnym procesorom AWS Graviton.

Poznaj historię naszego klienta

Migracja do Apache® Iceberg dla początkujących

Zachęcamy do przeczytania planu krok po kroku dotyczącego migracji zadań do Apache Iceberg.

Główne cechy

Uruchamiaj skalowalne, kontrolowane potoki Spark on Iceberg w kontenerach z otwartego jeziora danych. Wykorzystaj rewolucję schematów Iceberg, podróż w czasie i zewnętrzne udostępnianie danych w środowiskach lokalnych lub w chmurze.

Orkiestracja typu „przeciągnij i upuść” dla złożonych przepływów pracy upraszczająca zarządzanie zadaniami, kontrolę zależności i łączność z narzędziami zewnętrznymi.

Uruchamiaj sesje na żądanie do szybkiego testowania i obsługi iteracji. Umożliwiaj zdalne, bezpieczne programowanie z poziomu dowolnego IDE, np. VSCode i Jupyter Notebook, obsługiwane przez Spark Connect.

Utrzymuj aktualność danych, rejestrując zmiany na poziomie wiersza z systemów źródłowych. Automatyzuj kolejne aktualizacje, aby budować niezawodne potoki danych.

Kompleksowo monitoruj potoki danych dzięki zintegrowanemu zarządzaniu pochodzeniem i metadanymi. Rozwiązanie obsługiwane przez platformy Cloudera Shared Data Experience (SDX) oraz Cloudera Data Lineage zapewniające zautomatyzowaną widoczność, nadzór i zaufane analizy w środowiskach hybrydowych.

Automatyzuj przepływy pracy w potokach w ramach dowolnej usługi za pomocą niezawodnych interfejsów API — niezależnie od tego, czy pracujesz w języku SQL, Java, Scala czy Python. Szybko diagnozuj i rozwiązuj problemy z wydajnością dzięki wizualnemu profilowaniu w czasie rzeczywistym z wbudowanym monitorowaniem i obsługą alertów na każdym etapie cyklu życia.

Funkcje według typu klastra Cloudera Data Engineering

		Klaster główny	Klaster uniwersalnego zastosowania
Infrastruktura	Klaster automatycznego skalowania
	Wystąpienia spot
	Cloudera Shared Data Experience
	Otwarte jezioro danych z Iceberg
Spark	Zarządzanie cyklem życia zadań
	Scentralizowany monitoring
	Orkiestracja przepływu pracy (Airflow)
	Przetwarzanie strumieniowe Spark
Końcowe punkty deweloperskie	Sesje interaktywne
	Łączność z zewnętrznymi IDE
	Konektor JDBC (wkrótce)

Opcje wdrażania Cloudera Data Engineering

Zunifikowana warstwa przetwarzania oparta na otwartym, hybrydowym jeziorze danych.

Cloudera w chmurze

Elastyczność w zakresie wielu chmur: wdrażaj rozwiązania w chmurach publicznych za pomocą konteneryzowanych usług opartych na interfejsie API — bez konieczności wiązania się z pojedynczym dostawcą i z pełną interoperacyjnością.
Modułowe doświadczenie dewelopera: Korzystaj z Apache Airflow, zarządzanej platformy Spark oraz interfejsów API i IDE — przyspieszaj rozwój dzięki iteracyjnej współpracy.
Elastyczna skalowalność: automatyczne, dynamiczne skalowanie obciążeń Spark i optymalizacja kosztów na podstawie użycia.

Cloudera w środowisku lokalnym

Własność wdrożenia: wdrażaj rozwiązania w chmurach publicznych za pomocą konteneryzowanych usług opartych na interfejsie API — bez konieczności wiązania się z pojedynczym dostawcą i z pełną interoperacyjnością.
Interfejsy przystosowane do chmury: uzyskaj te same modułowe, konteneryzowane usługi co w chmurze — stworzone z myślą o hybrydowej przenośności i skalowalności.
Stworzone z myślą o przedsiębiorstwach: skorzystaj z szybkiego onboardingu, dostępu do zewnętrznych środowisk IDE i domyślnych szczegółowych funkcji kontroli dostępu.

KLIENCI

Zespoły ufają nam w kwestii przekształcania danych hybrydowych w korzyści biznesowe.

Transport GEODIS

Czytaj więcej

Usługi finansowe Nord/LB

Czytaj więcej

Produkcja i motoryzacja International

Czytaj więcej

Łączniki, integracje i partnerzy.

Twórz potoki w oparciu o otwarty, interoperacyjny ekosystem danych. Integruj aplikacje z wiodącymi silnikami, dostawcami usług chmurowych i narzędziami w całym nowoczesnym stosie danych.

Przetwarzanie danych

Jeziora i hurtownie danych

Orkiestracja danych

Pozyskiwanie strumieniowe

Silnik NoSQL

Jeziora i hurtownie danych

Dostawca usług chmurowych

Orkiestracja kontenerów

Hurtownia danych

Zaangażuj się

Webinar Zwrot z inwestycji w Cloudera w środowisku lokalnym

Ebook Migracja do Apache® Iceberg dla początkujących

Analyst Report Umożliwianie sukcesu sztucznej inteligencji w usługach finansowych

Whitepaper Biała księga CIO: Architektura i strategia danych w erze sztucznej inteligencji

Zrób następny krok

Poznaj szczegóły i odkryj zaawansowane możliwości rozwiązania Cloudera Data Engineering.

Prezentacja produktu Data Engineering

Zapoznaj się z rozwiązaniem Cloudera Engineering w praktyce podczas prezentacji produktu.

Zacznij już teraz

Dokumentacja rozwiązania Data Engineering

Uzyskaj szczegółowe informacje na temat rozpoczynania pracy z rozwiązaniem Cloudera Data Engineering.

Data Engineering w chmurze
Data Engineering w środowisku lokalnym

Poznaj więcej produktów

Cloudera Data Warehouse

Analizuj ogromne ilości danych dla tysięcy jednoczesnych użytkowników bez kompromisów w zakresie kosztów, szybkości i bezpieczeństwa.

Otwarta architektura Data Lakehouse

Podejmuj mądre decyzje dzięki elastycznej platformie, która przetwarza dowolne dane w każdym miejscu, w celu uzyskania przydatnych analiz i zaufanej sztucznej inteligencji.

Cloudera AI

Przyspiesz proces podejmowania decyzji w oparciu o dane (od badań po produkcję) dzięki bezpiecznej, skalowalnej i otwartej platformie sztucznej inteligencji dla przedsiębiorstw.

Cloudera Data Flow

Gromadź i przenoś dane z dowolnego źródła w dowolne miejsce w prosty, bezpieczny, skalowalny i ekonomiczny sposób.

Cloudera Data Engineering

Otwarty standard inżynierii danych dla przedsiębiorstw

Twórz kompleksowe potoki danych, aby przyspieszyć działanie sztucznej inteligencji i analityki.

zwiększona wydajność zespołu ds. danych

Zwiększ wydajność dzięki przenośności, koordynacji i ujednoliconemu dostępowi do danych lokalnych w chmurze Cloudera.

Zwiększ produktywność użytkowników dzięki intuicyjnym i zabezpieczonym narzędziom korporacyjnym

Dostarczaj świeże dane do dalszych potoków i na platformy zewnętrzne.

Skaluj mądrzej dzięki nadzorowi nad finansami na poziomie obciążeń

Migracja do Apache® Iceberg dla początkujących

Zachęcamy do przeczytania planu krok po kroku dotyczącego migracji zadań do Apache Iceberg.

Główne cechy

Uruchamiaj skalowalne, kontrolowane potoki Spark on Iceberg w kontenerach z otwartego jeziora danych. Wykorzystaj rewolucję schematów Iceberg, podróż w czasie i zewnętrzne udostępnianie danych w środowiskach lokalnych lub w chmurze.

Orkiestracja typu „przeciągnij i upuść” dla złożonych przepływów pracy upraszczająca zarządzanie zadaniami, kontrolę zależności i łączność z narzędziami zewnętrznymi.

Uruchamiaj sesje na żądanie do szybkiego testowania i obsługi iteracji. Umożliwiaj zdalne, bezpieczne programowanie z poziomu dowolnego IDE, np. VSCode i Jupyter Notebook, obsługiwane przez Spark Connect.

Utrzymuj aktualność danych, rejestrując zmiany na poziomie wiersza z systemów źródłowych. Automatyzuj kolejne aktualizacje, aby budować niezawodne potoki danych.

Funkcje według typu klastra Cloudera Data Engineering

Opcje wdrażania Cloudera Data Engineering

Cloudera w chmurze

Cloudera w środowisku lokalnym

Zespoły ufają nam w kwestii przekształcania danych hybrydowych w korzyści biznesowe.

Łączniki, integracje i partnerzy.

Zaangażuj się

{title}

Zrób następny krok

Prezentacja produktu Data Engineering

Dokumentacja rozwiązania Data Engineering

Poznaj więcej produktów

Your form submission has failed.