Informacje ogólne
Dlaczego Apache Iceberg?
Apache Iceberg to otwarty format tabeli stworzony specjalnie do prowadzenia analiz na dużą skalę. Oferuje niezawodność i prostotę tabel SQL, zapewniając opcje podobne do hurtowni danych bezpośrednio w repozytorium (jeziorze) danych.
Apache Iceberg nie jest magazynem, bazą danych ani silnikiem obliczeniowym. Jest to warstwa zarządzania metadanymi, która jest zlokalizowana ponad plikami danych i może być przechowywana w dowolnym miejscu. Iceberg umożliwia jednoczesne udostępnianie danych wielu silnikom obliczeniowym, gwarantując przy tym niezawodność i spójność danych.
Dlaczego Iceberg?
Otwartość
Iceberg to rozwiązanie w pełni otwarte i niezależne od dostawcy i silnika. Cieszy się największym wsparciem społeczności zarówno ze strony dostawców, jak i innych podmiotów, co sprzyja tworzeniu bezstronnych innowacyjnych rozwiązań.
Funkcjonalność nowoczesnych hurtowni danych
Funkcje Iceberg, takie jak spójność transakcyjna, ukryte partycjonowanie, ewolucja schematu i podróż w czasie, ułatwiają operacje na danych.
Analityka w skali petabajtów
Iceberg został zbudowany od podstaw, eliminując wąskie gardła poprzednich formatów tabel i zachowując własną warstwę metadanych
Apache Iceberg na platformie Cloudera
Integrujemy Iceberg jako jednostkę pierwszej kategorii bezpośrednio z naszą architekturą Data Lakehouse.
Wykorzystuj wysokowydajne analizy, inżynierię danych, naukę o danych i sztuczną inteligencję, jednocześnie dopasowując odpowiedni silnik do właściwych operacji na danych, eliminując konieczność przenoszenia i kopiowania danych.
Oddzielaj warstwę składowania od warstwy obliczeniowej. Zyskaj ujednolicony dostęp do ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych danych w architekturze data lakehouse. Korzystaj z wbudowanych chatbotów AI, aby odkrywać i wykorzystywać wszystkie dane.
Jakie korzyści oferuje Apache Iceberg na platformie Cloudera?
Jedyna otwarta hybrydowa architektura Data Lakehouse oparta na Iceberg
Wdrożenie w dowolnej lokalizacji, w dowolnej chmurze lub w centrum danych
Obsługa wielu silników
Najszerszy zestaw wstępnie zintegrowanych usług i funkcji danych w zakresie pozyskiwania, przetwarzania, analizy i sztucznej inteligencji na potrzeby całego cyklu życia danych
Niższy koszt TCO nawet o 75%
Wspólny standard danych z ujednoliconymi zabezpieczeniami i zarządzaniem eliminuje ETL, silosy danych oraz kopie danych, zmniejszając całkowity koszt posiadania (TCO) nawet o 75%
Korzyści oferowane przez otwartą architekturę Cloudera Data Lakehouse opartą na Iceberg
Demokratyzacja danych: Umożliwienie wszystkim dostępu do wyników analiz opartych na danych w języku naturalnym
Szybsze wykorzystanie analityki i sztucznej inteligencji: Wdrażanie aplikacji generatywnej sztucznej inteligencji i pulpitów nawigacyjnych opartych na danych
Otwartość i interoperacyjność danych: zachowaj swoje dane i korzystaj z dostępnych narzędzi
Klienci
Apache Iceberg gwarantuje zachowanie pełnej własności danych
Zaangażuj się
Blogi
Databricks Follows Cloudera by Adopting Iceberg, While Snowflake Mulls Open Source Approach
Getting Started With Cloudera Open Data Lakehouse on Private Cloud
From Hive Tables to Iceberg Tables: Hassle-Free
Dokumentacja
Pierwsze kroki z Apache Iceberg
Zaczynamy?