Apache Iceberg Open Table Format (OTF) | Open-source

Informacje ogólne

Dlaczego Apache Iceberg?

Apache Iceberg to otwarty format tabeli stworzony specjalnie do prowadzenia analiz na dużą skalę. Oferuje niezawodność i prostotę tabel SQL, zapewniając opcje podobne do hurtowni danych bezpośrednio w repozytorium (jeziorze) danych.

Apache Iceberg nie jest magazynem, bazą danych ani silnikiem obliczeniowym. Jest to warstwa zarządzania metadanymi, która jest zlokalizowana ponad plikami danych i może być przechowywana w dowolnym miejscu. Iceberg umożliwia jednoczesne udostępnianie danych wielu silnikom obliczeniowym, gwarantując przy tym niezawodność i spójność danych.

Dlaczego Iceberg?

Otwartość

Iceberg to rozwiązanie w pełni otwarte i niezależne od dostawcy i silnika. Cieszy się największym wsparciem społeczności zarówno ze strony dostawców, jak i innych podmiotów, co sprzyja tworzeniu bezstronnych innowacyjnych rozwiązań.

Funkcjonalność nowoczesnych hurtowni danych

Funkcje Iceberg, takie jak spójność transakcyjna, ukryte partycjonowanie, ewolucja schematu i podróż w czasie, ułatwiają operacje na danych.

Analityka w skali petabajtów

Iceberg został zbudowany od podstaw, eliminując wąskie gardła poprzednich formatów tabel i zachowując własną warstwę metadanych

Apache Iceberg na platformie Cloudera

Integrujemy Iceberg jako jednostkę pierwszej kategorii bezpośrednio z naszą architekturą Data Lakehouse.

Wykorzystuj wysokowydajne analizy, inżynierię danych, data science i sztuczną inteligencję, jednocześnie dopasowując odpowiedni silnik do właściwych operacji na danych oraz eliminując konieczność przenoszenia i kopiowania danych.

Oddzielaj warstwę składowania od warstwy obliczeniowej. Zyskaj ujednolicony dostęp do ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych danych w architekturze data lakehouse. Korzystaj z wbudowanych chatbotów AI, aby odkrywać i wykorzystywać wszystkie dane.

Jakie korzyści oferuje Apache Iceberg na platformie Cloudera?

Rysunek: Najwyższy poziom to pięć usług Cloudera Data Services. Drugi poziom obejmuje SDX: metadane, Data Catalog, bezpieczeństwo, nadzór, obserwowalność i replikację. Trzeci poziom to Iceberg Tables. Na czwartym, dolnym poziomie prezentowany jest model hybrydowy obejmujący rozwiązania lokalne, chmurę prywatną i chmurę, w tym Azure, Google i AWS.

Jedyna otwarta hybrydowa architektura Data Lakehouse oparta na Iceberg

Wdrożenie w dowolnej lokalizacji, w dowolnej chmurze lub w centrum danych

Obsługa wielu silników

Najszerszy zestaw wstępnie zintegrowanych usług i funkcji danych w zakresie pozyskiwania, przetwarzania, analizy i sztucznej inteligencji na potrzeby całego cyklu życia danych

Niższy koszt TCO nawet o 75%

Wspólny standard danych z ujednoliconymi zabezpieczeniami i zarządzaniem eliminuje ETL, silosy danych oraz kopie danych, zmniejszając całkowity koszt posiadania (TCO) nawet o 75%

Korzyści oferowane przez otwartą architekturę Cloudera Data Lakehouse opartą na Iceberg

Demokratyzacja danych: Umożliwienie wszystkim dostępu do wyników analiz opartych na danych w języku naturalnym

Szybsze wykorzystanie analityki i sztucznej inteligencji: Wdrażanie aplikacji generatywnej sztucznej inteligencji i pulpitów nawigacyjnych opartych na danych

Otwartość i interoperacyjność danych: zachowaj swoje dane i korzystaj z dostępnych narzędzi

Rysunek: The Old Way Hive SQL dla danych w HDFS, a The Iceberg Way daje możliwość wielofunkcyjnej analizy wszystkich Twoich danych.

Zabezpiecz swoje jezioro danych na przyszłość dzięki interoperacyjności

Migracja do Apache® Iceberg dla początkujących

Klienci

Apache Iceberg gwarantuje zachowanie pełnej własności danych

Otwarta architektura Cloudera Data Lakehouse oparta na Iceberg oznacza otwarty format tabeli z wieloma zaawansowanymi funkcjami, co ułatwia korzystanie z danych oraz ich utrzymanie. Otwarty format tabeli jest dla nas ważny, ponieważ oznacza, że dane mogą być łatwo dostępne dla wielu użytkowników przy wykorzystaniu różnych narzędzi. Otwarty format tabeli jest podstawowym wymogiem, ponieważ dane firmy są własnością samej firmy, a nie konkretnego dostawcy. Otwarty format tabeli gwarantuje, że zachowujesz pełną własność swoich danych, niezależnie od zmian technologii w przyszłości.

—Matteo Carucci, dyrektor ds. danych i analiz, Grupa Eutelsat

Sprzedaż detaliczna eMAG

Czytaj więcej

Telekomunikacja Eutelsat Group

Czytaj więcej

Sektor publiczny CDC

Czytaj więcej

Zaangażuj się

Whitepaper Przedstawiamy Apache Iceberg: przykład Open Data Lakehouse obsługiwany przez Cloudera

News CIO Magazine – State of Apache Iceberg

Dokumentacja

Pierwsze kroki z Apache Iceberg

Od przewodników szybkiego startu po szczegóły techniczne i nie tylko – dowiedz się wszystkiego, co trzeba wiedzieć o pierwszych krokach z Apache Iceberg na platformie Cloudera.

Apache Iceberg na platformie Cloudera w chmurze prywatnej

ZOBACZ DOKUMENTACJĘ

Apache Iceberg na platformie Cloudera w chmurze publicznej

ZOBACZ DOKUMENTACJĘ

Apache Iceberg w otwartej architekturze data lakehouse

ZOBACZ DOKUMENTACJĘ

Migracja tabel Hive do tabel Iceberg

ZOBACZ DOKUMENTACJĘ

Apache Iceberg na platformie Cloudera

Dlaczego Apache Iceberg?

Dlaczego Iceberg?

Otwartość

Funkcjonalność nowoczesnych hurtowni danych

Analityka w skali petabajtów

Apache Iceberg na platformie Cloudera

Jakie korzyści oferuje Apache Iceberg na platformie Cloudera?

Jedyna otwarta hybrydowa architektura Data Lakehouse oparta na Iceberg

Obsługa wielu silników

Niższy koszt TCO nawet o 75%

Korzyści oferowane przez otwartą architekturę Cloudera Data Lakehouse opartą na Iceberg

Zabezpiecz swoje jezioro danych na przyszłość dzięki interoperacyjności

Apache Iceberg gwarantuje zachowanie pełnej własności danych

Zaangażuj się

{title}

Pierwsze kroki z Apache Iceberg

Your form submission has failed.