Nauczyliśmy świat, jak cenne są dane big data w połączeniu z open source, a nasza silna wiara w wartość open source, otwartych standardów i otwartych rynków napędza kolejną falę innowacji.
Innowacje open source
Niektórzy dostawcy wykorzystują aktywność społeczności open source, a inni pomagają ją rozwijać. Cloudera jest liderem w dziedzinie rozwoju platformy danych, analiz i sztucznej inteligencji przez tworzenie, wnoszenie wkładu i wspieranie nowych funkcji spełniających wymagania dotyczące bezpieczeństwa, skali i użyteczności.
Opieka nad otwartymi standardami
Cloudera szczyci się wieloletnią i udokumentowaną historią identyfikowania, selekcjonowania i wspierania otwartych standardów (w tym Apache Iceberg, Apache Nifi i Apache Ozone) zapewniających popularną, długoterminową architekturę, na której są budowane przypadki użycia przez nowe i rozwijające się przedsiębiorstwa.
Najwyższe wymagania korporacyjne
Aby zapewnić klientom jak najlepsze środowisko obsługi, Cloudera inwestuje znaczne środki w wielowymiarowe testowanie na rzeczywistych obciążeniach przed udostępnieniem wydań, wdraża i utrzymuje zasady bezpieczeństwa oparte na najlepszych praktykach branżowych i wymogach regulacyjnych oraz wspiera rozwój platformy przez szerokie zaangażowanie w społeczność open source.
Usługa Cloudera Data Flow
bazująca na Apache Nifi
Cloudera Data Flow to natywna dla chmury usługa danych obsługiwana przez Apache NiFi, która ułatwia uniwersalną dystrybucję danych poprzez usprawnienie kompleksowego procesu przenoszenia danych.
Usługa Cloudera Object Store
bazująca na Apache Ozone
W centrum danych usługa Cloudera Object Store zapewnia magazyn obiektów o dużej gęstości i natywny dla chmury, umożliwiając przechowywanie danych na ogromną skalę i z dużą wydajnością dzięki rozwiązaniu Apache Ozone.
Otwarta architektura Cloudera Data Lakehouse
bazująca na Apache Iceberg
Architektura data lakehouse firmy Cloudera została zbudowana na bazie Apache Iceberg, otwartego formatu tabeli, który jest standardem w branży, zapewniając wysoką wydajność w dowolnej skali i integrację z najszerszym ekosystemem silników obliczeniowych.
Cloudera jest zaangażowana w etos open source, w tym w sukces projektów open source i społeczności open source.
200+
stanowisk dla programistów Apache
50+
stanowisk PMC
>55
zaangażowanych projektów
Nasz ekosystem open source
Platforma Cloudera wykorzystuje rozległy ekosystem projektów i technologii open source, które łączą się, tworząc prawdziwie hybrydową platformę dla danych, analityki i sztucznej inteligencji. Cloudera ma bogate i udokumentowane doświadczenie w tworzeniu, wnoszeniu wkładu i wspieraniu innowacji open source na potrzeby wdrożeń w przedsiębiorstwach.
Apache Accumulo
Posortowany, rozproszony magazyn o kluczowej wartości z kontrolą dostępu opartą na komórkach.
Apache Airflow
Platforma do zarządzania przepływem pracy dla potoków inżynierii danych.
Apache Arrow
Struktura oprogramowania służąca do opracowywania analiz przetwarzania danych kolumnowych.
Apache Atlas
Zgodność z przepisami elastycznego przedsiębiorstwa dzięki metadanym.
Apache Avro
Struktura serializacji danych i zdalnego wywoływania procedur oparta na formacie wierszowym.
Apache Calcite
Struktura do tworzenia baz danych i systemów zarządzania danymi.
Apache Flink
Struktura przetwarzania strumieni w czasie rzeczywistym dla analityki big data i aplikacji.
Apache Hadoop
Struktura rozproszonego składowania i przetwarzania dla zadań przetwarzania danych na dużą skalę.
Apache HBase
Nierelacyjna baza danych (NoSQL) działająca w systemie plików HDFS.
Apache Hive
Faktyczny standard dla zapytań SQL w Hadoop.
Apache Iceberg
Otwarty format tabeli do analizy na dużą skalę, zapewniający niezawodność i prostotę tabel SQL.
Apache Impala
Analityczna baza danych MPP typu open source dla Apache Hadoop, która zapewnia najszybszy dostęp do informacji.
Apache Kafka
Szybki, skalowalny i odporny na awarie system obsługi wiadomości
Apache Knox Gateway
Bezpieczny punkt wejścia dla klastrów Hadoop.
Apache Kudu
Pamięć masowa do zastosowań wymagających szybkiej analizy dynamicznie zmieniających się danych.
Apache Livy
Interfejs REST dla klastrów Spark.
Apache NiFi
Zintegrowana logistyka danych w czasie rzeczywistym i prosta platforma przetwarzania zdarzeń.
Apache Oozie
Projekt Enterprise Hadoop, w tym oryginalne warstwy magazynowania i przetwarzania danych.
Apache Orc
Kolumnowy format składowania danych zoptymalizowany pod kątem operacji odczytu.
Apache Ozone
Wysoce skalowalny rozproszony magazyn obiektów z interfejsami API zgodnymi z S3.
Apache Parquet
Kolumnowy format składowania danych zoptymalizowany pod kątem operacji WORM.
Apache Phoenix
Aparat przetwarzania równoległego relacyjnej bazy danych obsługujący OLTP dla Hadoop przy użyciu Apache HBase.
Apache Ranger
Kompleksowe bezpieczeństwo dla Enterprise Hadoop.
Apache Solr
Szybkie indeksowanie i wyszukiwanie w Hadoop.
Apache Spark
Platforma Spark dodaje do usługi Hadoop obliczenia w pamięci dla obciążeń ETL, sztucznej inteligencji i Data Science.
Apache Sqoop
Skutecznie przesyła dane zbiorcze między Apache Hadoop a ustrukturyzowanymi repozytoriami danych.
Apache Tez
Struktura dla opartych na YARN aplikacji do przetwarzania danych w Hadoop.
Apache YARN
Centrum architektoniczne Enterprise Hadoop.
Apache Zeppelin
W pełni otwarty notes internetowy pozwalający na interaktywną analizę danych.
Apache ZooKeeper
Serwer open source, który niezawodnie koordynuje rozproszone procesy.
Docker
Konteneryzacja za pośrednictwem wirtualizacji na poziomie systemu operacyjnego.
Hue
Środowisko pracy SQL typu open source dla hurtowni Data Warehouse.
Tensorflow
Biblioteka oprogramowania z zakresu uczenia maszynowego i sztucznej inteligencji.
