Autonomiczni agenci działają, aby osiągać złożone cele, bez konieczności kierowania nimi przez człowieka na każdym etapie. W środowiskach korporacyjnych wdrażanie tych agentów wiąże się z bardziej rygorystycznym zestawem wyzwań: muszą poruszać się po zróżnicowanych systemach danych, spełniać wymogi zgodności, audytu i suwerenności danych oraz utrzymywać wszystkie dane w obrębie środowiska operacyjnego organizacji.
Agenci dalekiego zasięgu stanowią nową klasę autonomicznej sztucznej inteligencji, która wykracza poza pojedyncze zadania, realizując cele w dziesiątkach sekwencyjnych decyzji i uruchamiając przepływy pracy przez wiele godzin lub dni, zachowując kontekst przez cały czas. W skali przedsiębiorstwa każde z tych wyzwań jest spotęgowane.
Firma Cloudera zaprojektowała we współpracy z firmą NVIDIA rozwiązanie Cloudera Agent Studio (część Cloudera AI Studios) właśnie z myślą o stawieniu czoła tym wyzwaniom.
NVIDIA Nemotron zapewnia podstawę modelu: narzędzie to jest dedykowane agentom AI i wymaganiom wnioskowania o wysokiej przepustowości w przepływach pracy dalekiego zasięgu.
Cloudera Agent Studio zapewnia warstwę orkiestracji, która opiera się na tym fundamencie dzięki czterem filarom architektonicznym: dynamicznemu planowaniu wieloetapowemu, przejrzystej współpracy z wieloma agentami, inżynierii kontekstu dla precyzji oraz wykonywaniu w środowisku izolowanym. Każdy filar odnosi się do konkretnego wymogu, który pojawia się, gdy autonomiczni agenci działają na skalę przedsiębiorstwa.
Rysunek 1: Cloudera Agent Studio organizuje autonomiczne przepływy pracy poprzez iteracyjne planowanie wieloetapowe, współpracę z wieloma agentami z narzędziami i umiejętnościami, inżynierię kontekstową opartą na artefaktach i wykonywanie w środowisku testowym — oparte na podstawach obsługi modeli z wykorzystaniem technologii Cloudera AI Inference opartej na modelach NVIDIA NIM i Nemotron dla agentów AI.
Sztuczna inteligencja w przedsiębiorstwach zaczyna się od zarządzania danymi. Prompty, zastrzeżone dane i wyniki modelu muszą pozostać w granicach operacyjnych organizacji, spełniając wymagania zgodności bez uszczerbku dla architektury. Jest to podstawowy wymóg prywatnej AI: pełny stos wnioskowania działający wewnątrz przedsiębiorstwa, a nie poza nim.
Usługa Cloudera AI Inference, obsługiwana przez mikrousługi NVIDIA NIM, umożliwia wysokowydajną, skalowalną obsługę modeli bezpośrednio w środowisku korporacyjnym, zachowując prompty, dane i wyniki wewnątrz obszaru zabezpieczeń. Przyspieszona przez stos sztucznej inteligencji NVIDIA, w tym procesory graficzne Blackwell i Dynamo-Triton, usługa obsługuje szeroką gamę modeli, w tym rodzinę modeli NVIDIA Nemotron dla agentów AI, z zaawansowanym rozumowaniem, użyciem narzędzi i przepływami pracy dalekiego zasięgu. Ta podstawa umożliwia organizacjom tworzenie i uruchamianie korporacyjnych agentów AI bezpośrednio na ich danych — bezpiecznie i na dużą skalę.
Środowiska danych przedsiębiorstwa nie są czyste. Rzeczywiste wdrożenia obejmują dziesiątki baz danych z niespójnymi schematami, skąpą dokumentacją i brakiem deterministycznej ścieżki od pytania biznesowego do właściwego źródła danych. Agent musi skonstruować tę ścieżkę po uruchomieniu.
Orkiestrator programu Agent Studio traktuje eksplorację jako część wykonania. Dzieli złożone żądania na plany wieloetapowe, wykonuje je iteracyjnie i dokonuje samooceny po każdym kroku przed zatwierdzeniem ścieżki. Ta samoczynnie korygująca pętla planowania sprawia, że agenci są niezawodni w środowiskach, których nigdy wcześniej nie napotkali, i utrzymuje przepływy pracy o długim zasięgu czasu przez wiele kolejnych kroków.
Złożone przepływy pracy w przedsiębiorstwie obejmują wiele domen, z których każda wymaga odrębnych strategii rozumowania i specjalistycznych narzędzi. Pojedynczy agent próbujący objąć wszystkie te obszary nie może być dobrze zoptymalizowany pod kątem żadnego z nich, a im szerszy jest jego zakres, tym trudniej zrozumieć i kontrolować zachowanie agenta.
Agent Studio opiera się na wyspecjalizowanych agentach, z których każdy jest dostosowany do konkretnej dziedziny i wyposażony w odpowiednie narzędzia, koordynowanych przez orkiestratora, który rozumie, jak delegować zadania. To, co czyni tę współpracę przejrzystą i wielokrotnie użyteczną, to sposób, w jaki agenci się komunikują: każdy agent zapisuje ustrukturyzowane wyjścia do wspólnego kontekstu projektu, a kolejni agenci wykorzystują te wyjścia jako jawne, kontrolowane wejścia. Cały łańcuch rozumowania jest możliwy do śledzenia na każdym etapie, zapewniając przedsiębiorstwom możliwość podlegania audytom oraz ponownego wykorzystania na wcześniejszych pracach w różnych fazach.
W korporacyjnych skalach danych przekazywanie surowych danych bezpośrednio do modelu nie działa. Okna kontekstowe są skończone, a wraz ze wzrostem nieustrukturyzowanego kontekstu dokładność spada na długo przed osiągnięciem limitu okna.
Agent Studio traktuje okno kontekstowe jako instrument precyzyjny: na każdym kroku do modelu docierają tylko informacje istotne dla konkretnego zadania agenta. Ta konstrukcja oparta na artefaktach zmniejsza zużycie tokenów, zmniejszając koszty wnioskowania i opóźnienia, jednocześnie zwiększając dokładność. To połączenie sprawia, że przepływy pracy dalekiego zasięgu czasu można śledzić w skali przedsiębiorstwa.
To, co sprawia, że autonomiczni agenci są naprawdę potężni, to ich zdolność do dynamicznego generowania narzędzi, umiejętności i kodu wykonywalnego, gdy wymagają tego przepływy pracy — funkcje, które Agent Studio obsługuje natywnie. Jednak bez izolacji kod generowany przez agentów i narzędzia wykonujące go bezpośrednio na systemach przedsiębiorstwa stanowią niedopuszczalne ryzyko.
Domyślnie zaprojektowaliśmy warstwę wykonawczą Agent Studio wokół izolacji. Cały kod generowany przez agentów i wykonywanie narzędzi odbywa się w środowisku wykonawczym piaskownicy bez dostępu do systemów poza ich zdefiniowanym zakresem. Agenci zaczynają od zerowych uprawnień, a każde działanie jest egzekwowane na warstwie infrastruktury, a nie wewnątrz samego procesu agenta. Zapewnia to branżom podlegającym regulacjom możliwość audytowania, jakiej wymagają, bez ograniczania możliwości agentów.
Cloudera zarządza ponad 30 eksabajtami danych ustrukturyzowanych w całej swojej bazie klientów, co sprawia, że analityka danych ustrukturyzowanych jest obszarem, w którym ta architektura przynosi natychmiastowe rezultaty. Duża firma zajmująca się mediami i rozrywką wdrożyła to rozwiązanie, aby zapewnić użytkownikom biznesowym i analitykom interfejs języka naturalnego do ich danych operacyjnych. Ich zasoby danych obejmowały petabajty w dziesiątkach baz danych, często ze sprzecznymi metadanymi i skąpą dokumentacją.
Rozwiązanie Cloudera Agent Studio zorganizowało wyspecjalizowanych agentów wspieranych przez technologię NVIDIA Nemotron działającą w prywatnej sieci klienta. Pytanie analityczne użytkownika biznesowego wywołało iteracyjną pętlę planowania: orkiestrator zbadał stan danych, rozwiązał dwuznaczności schematu i samodzielnie zidentyfikował właściwe źródła danych. Gdy analiza wymagała obliczeń statystycznych wykraczających poza to, co SQL mógł wyrazić, orkiestrator delegował to zadanie odpowiedniemu agentowi wykonywania kodu. Wyjścia pośrednie zostały zapisane jako artefakty i przekazywane do przodu przez przepływ pracy dalekiego zasięgu. Cały wygenerowany kod jest wykonywany w środowisku piaskownicy, zachowując pełne ścieżki inspekcji przez cały czas.
Przepływy pracy, które kiedyś wymagały obsługi inżyniera danych, programisty i analityka pracujących w tej kolejności, stały się dostępne dla każdego użytkownika biznesowego. Dane wyjściowe agentów, w tym polecenia SQL, wygenerowany kod i wizualizacje, zostały zapisane we współdzielonym kontekście projektu — każdy z nich można sprawdzić i kontrolować. Te artefakty można było również eksportować jako potoki produkcyjne. Ponieważ kod generowany przez agentów jest deterministyczny, nawet jeśli podstawowe modele nie są, potoki te są niezawodne i powtarzalne bez dodatkowej inżynierii.
Każdy filar w tej architekturze opiera się na swoim poprzedniku. Prywatna warstwa wnioskowania stanowi podstawę, wspierając wolumeny połączeń i niezawodność wymaganych przepływów pracy dalekiego zasięgu. Planowanie iteracyjne umożliwia agentom poruszanie się po środowiskach, których nigdy nie widzieli. Współpraca z wieloma agentami zapewnia precyzję specjalistyczną w rozumowaniu wieloetapowym. Zarządzanie kontekstem oparte na artefaktach poprawia dokładność przy jednoczesnym zmniejszeniu kosztów wnioskowania i opóźnień. Wykonanie w piaskownicy zapewnia, że agenci działają bezpiecznie w określonych granicach, przy czym każde działanie podlega regulacji i audytowi.
Cloudera i NVIDIA wprowadzają tę architekturę w życie za pomocą Cloudera Agent Studio, Cloudera AI Inference opartego na NVIDIA NIM i rodziny modeli NVIDIA Nemotron. Razem stanowią podstawę do budowania orkiestracji i rozumowania agencyjnego potrzebnych do prowadzenia agentów AI przedsiębiorstwa bezpośrednio na danych korporacyjnych — bezpiecznie, prywatnie i na dużą skalę.
Aby dowiedzieć się więcej, zobacz Cloudera Agent Studio w akcji.
This may have been caused by one of the following: