Open source i otwarte standardy

Nauczyliśmy świat, jak cenne są dane big data w połączeniu z open source, a nasza silna wiara w wartość open source, otwartych standardów i otwartych rynków napędza kolejną falę innowacji.

Innowacje open source

Niektórzy dostawcy wykorzystują aktywność społeczności open source, a inni pomagają ją rozwijać. Cloudera jest liderem w dziedzinie rozwoju platformy danych, analiz i sztucznej inteligencji przez tworzenie, wnoszenie wkładu i wspieranie nowych funkcji spełniających wymagania dotyczące bezpieczeństwa, skali i użyteczności.

Opieka nad otwartymi standardami

Cloudera szczyci się wieloletnią i udokumentowaną historią identyfikowania, selekcjonowania i wspierania otwartych standardów (w tym Apache Iceberg, Apache Nifi i Apache Ozone) zapewniających popularną, długoterminową architekturę, na której są budowane przypadki użycia przez nowe oraz długo istniejące przedsiębiorstwa.

Najwyższe wymagania korporacyjne

Aby zapewnić klientom jak najlepsze środowisko obsługi, Cloudera inwestuje znaczne środki w wielowymiarowe testowanie na rzeczywistych obciążeniach przed udostępnieniem wydań, wdraża i utrzymuje zasady bezpieczeństwa oparte na najlepszych praktykach branżowych i wymogach regulacyjnych oraz wspiera rozwój platformy przez szerokie zaangażowanie w społeczność open source.

Usługa Cloudera Data Flow
bazująca na Apache Nifi

Cloudera Data Flow to natywna dla chmury usługa danych obsługiwana przez Apache NiFi, która ułatwia uniwersalną dystrybucję danych poprzez usprawnienie kompleksowego procesu przenoszenia danych.

Usługa Cloudera Object Store
bazująca na Apache Ozone

W centrum danych usługa Cloudera Object Store zapewnia magazyn obiektów o dużej gęstości i natywny dla chmury, umożliwiając przechowywanie danych na ogromną skalę i z dużą wydajnością dzięki rozwiązaniu Apache Ozone.

Otwarta architektura Cloudera Data Lakehouse
bazująca na Apache Iceberg

Architektura data lakehouse firmy Cloudera została zbudowana na bazie Apache Iceberg, otwartego formatu tabeli, który jest standardem w branży, zapewniając wysoką wydajność w dowolnej skali i integrację z najszerszym ekosystemem silników obliczeniowych.

Cloudera jest zaangażowana w etos open source, w tym w sukces projektów open source i społeczności open source.

200+

stanowisk dla programistów Apache

50+

stanowisk PMC

>55

zaangażowanych projektów

Nasz ekosystem open source

Platforma Cloudera wykorzystuje rozległy ekosystem projektów i technologii open source, które łączą się, tworząc prawdziwie hybrydową platformę dla danych, analityki i sztucznej inteligencji. Cloudera ma bogate i udokumentowane doświadczenie w tworzeniu, wnoszeniu wkładu i wspieraniu innowacji open source na potrzeby wdrożeń w przedsiębiorstwach.

Apache Accumulo

Posortowany, rozproszony magazyn o kluczowej wartości z kontrolą dostępu opartą na komórkach.

Apache Airflow

Platforma do zarządzania przepływem pracy dla potoków inżynierii danych.

Apache Arrow

Struktura oprogramowania służąca do opracowywania analiz przetwarzania danych kolumnowych.

Apache Atlas

Zgodność z przepisami elastycznego przedsiębiorstwa dzięki metadanym.

Apache Avro

Struktura serializacji danych i zdalnego wywoływania procedur oparta na formacie wierszowym.

Apache Calcite

Struktura do tworzenia baz danych i systemów zarządzania danymi.

Apache Flink

Struktura przetwarzania strumieni w czasie rzeczywistym dla analityki big data i aplikacji.

Apache Hadoop

Struktura rozproszonego składowania i przetwarzania dla zadań przetwarzania danych na dużą skalę.

Apache HBase

Nierelacyjna baza danych (NoSQL) działająca w systemie plików HDFS.

Apache Hive

Faktyczny standard dla zapytań SQL w Hadoop.

Apache Iceberg

Otwarty format tabeli do analizy na dużą skalę, zapewniający niezawodność i prostotę tabel SQL.

Apache Impala

Analityczna baza danych MPP typu open source dla Apache Hadoop, która zapewnia najszybszy dostęp do informacji.

Apache Kafka

Szybki, skalowalny i odporny na awarie system obsługi wiadomości

Apache Knox Gateway

Bezpieczny punkt wejścia dla klastrów Hadoop.

Apache Kudu

Pamięć masowa do zastosowań wymagających szybkiej analizy dynamicznie zmieniających się danych.

Apache Livy

Interfejs REST dla klastrów Spark.

Apache NiFi

Zintegrowana logistyka danych w czasie rzeczywistym i prosta platforma przetwarzania zdarzeń.

Apache Oozie

Projekt Enterprise Hadoop, w tym oryginalne warstwy magazynowania i przetwarzania danych.

Apache Orc

Kolumnowy format składowania danych zoptymalizowany pod kątem operacji odczytu.

Apache Ozone

Wysoce skalowalny rozproszony magazyn obiektów z interfejsami API zgodnymi z S3.

Apache Parquet

Kolumnowy format składowania danych zoptymalizowany pod kątem operacji WORM.

Apache Phoenix

Aparat przetwarzania równoległego relacyjnej bazy danych obsługujący OLTP dla Hadoop przy użyciu Apache HBase.

Apache Ranger

Kompleksowe bezpieczeństwo dla Enterprise Hadoop.

Apache Solr

Szybkie indeksowanie i wyszukiwanie w Hadoop.

Apache Spark

Platforma Spark dodaje do usługi Hadoop obliczenia w pamięci dla obciążeń ETL, sztucznej inteligencji i Data Science.

Apache Sqoop

Skutecznie przesyła dane zbiorcze między Apache Hadoop a ustrukturyzowanymi repozytoriami danych.

Apache Tez

Struktura dla opartych na YARN aplikacji do przetwarzania danych w Hadoop.

Apache YARN

Centrum architektoniczne Enterprise Hadoop.

Apache Zeppelin

W pełni otwarty notes internetowy pozwalający na interaktywną analizę danych.

Apache ZooKeeper

Serwer open source, który niezawodnie koordynuje rozproszone procesy.

Docker

Konteneryzacja za pośrednictwem wirtualizacji na poziomie systemu operacyjnego.

Cloudera Data Explorer (dawniej Hue)

Środowisko pracy SQL typu open source dla hurtowni Data Warehouse.

Tensorflow

Biblioteka oprogramowania z zakresu uczenia maszynowego i sztucznej inteligencji.

Chroń swoje dane za wszelką cenę

Na bezpieczeństwie i zgodności z przepisami nie warto oszczędzać.

Zacznij już teraz

Kontakt z działem sprzedaży

Odkryj usługi konsultingowe

Znajdź szkolenie

Znajdź dokumentację

Otwartość w stylu Cloudera