Informacje ogólne
Dlaczego Apache Iceberg?
Apache Iceberg to otwarty format tabeli stworzony specjalnie do prowadzenia analiz na dużą skalę. Oferuje niezawodność i prostotę tabel SQL, zapewniając opcje podobne do hurtowni danych bezpośrednio w repozytorium (jeziorze) danych.
Apache Iceberg nie jest magazynem, bazą danych ani silnikiem obliczeniowym. Jest to warstwa zarządzania metadanymi, która jest zlokalizowana ponad plikami danych i może być przechowywana w dowolnym miejscu. Iceberg umożliwia jednoczesne udostępnianie danych wielu silnikom obliczeniowym, gwarantując przy tym niezawodność i spójność danych.
Dlaczego Iceberg?
Otwartość
Iceberg to rozwiązanie w pełni otwarte i niezależne od dostawcy i silnika. Cieszy się największym wsparciem społeczności zarówno ze strony dostawców, jak i innych podmiotów, co sprzyja tworzeniu bezstronnych innowacyjnych rozwiązań.
Funkcjonalność nowoczesnych hurtowni danych
Funkcje Iceberg, takie jak spójność transakcyjna, ukryte partycjonowanie, ewolucja schematu i podróż w czasie, ułatwiają operacje na danych.
Analityka w skali petabajtów
Iceberg został zbudowany od podstaw, eliminując wąskie gardła poprzednich formatów tabel i zachowując własną warstwę metadanych
Apache Iceberg na platformie Cloudera
Integrujemy Iceberg jako jednostkę pierwszej kategorii bezpośrednio z naszą architekturą Data Lakehouse.
Wykorzystuj wysokowydajne analizy, inżynierię danych, naukę o danych i sztuczną inteligencję, jednocześnie dopasowując odpowiedni silnik do właściwych operacji na danych, eliminując konieczność przenoszenia i kopiowania danych.
Oddzielaj warstwę składowania od warstwy obliczeniowej. Zyskaj ujednolicony dostęp do ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych danych w architekturze data lakehouse. Korzystaj z wbudowanych chatbotów AI, aby odkrywać i wykorzystywać wszystkie dane.
Jakie korzyści oferuje Apache Iceberg na platformie Cloudera?
Jedyna otwarta hybrydowa architektura Data Lakehouse oparta na Iceberg
Wdrożenie w dowolnej lokalizacji, w dowolnej chmurze lub w centrum danych
Obsługa wielu silników
Najszerszy zestaw wstępnie zintegrowanych usług i funkcji danych w zakresie pozyskiwania, przetwarzania, analizy i sztucznej inteligencji na potrzeby całego cyklu życia danych
Niższy koszt TCO nawet o 75%
Wspólny standard danych z ujednoliconymi zabezpieczeniami i zarządzaniem eliminuje ETL, silosy danych oraz kopie danych, zmniejszając całkowity koszt posiadania (TCO) nawet o 75%
Korzyści oferowane przez otwartą architekturę Cloudera Data Lakehouse opartą na Iceberg
Demokratyzacja danych: Umożliwienie wszystkim dostępu do wyników analiz opartych na danych w języku naturalnym
Szybsze wykorzystanie analityki i sztucznej inteligencji: Wdrażanie aplikacji generatywnej sztucznej inteligencji i pulpitów nawigacyjnych opartych na danych
Otwartość i interoperacyjność danych: zachowaj swoje dane i korzystaj z dostępnych narzędzi
Odblokuj pełny potencjał swoich danych
Przedstawiamy Apache Iceberg: przykład Open Data Lakehouse obsługiwany przez Cloudera
Klienci
Apache Iceberg gwarantuje zachowanie pełnej własności danych




Zaangażuj się

Dokumentacja
Pierwsze kroki z Apache Iceberg
Zaczynamy?