OpenAI wykonało kolejny krok w kierunku integracji sztuczna inteligencja z codziennym użytkowaniem komputera poprzez całkowitą przebudowę Codex, swojego desktopowego agenta kodu. Narzędzie, znane wcześniej głównie z pomocy programistycznej, staje się teraz asystentem, który potrafi obsługiwać aplikacje, zapamiętywać preferencje i zarządzać projektami niemal bezproblemowo.
Dzięki tej aktualizacji firma kierowana przez Sama Altmana przybliża swój plan stworzenia „Superaplikacja” na komputery stacjonarne, która łączy ChatGPT, Codex i przeglądarkę AtlasCelem tego posunięcia jest uproszczenie obsługi użytkownika, koncentracja zasobów w jednym obszarze roboczym i konkurowanie z takimi rywalami jak Anthropic, zwłaszcza w zakresie środowiska programistycznego i zaawansowanej automatyzacji.
Codex uczy się korzystać z komputera tak jak każdy inny użytkownik
Jedną z najbardziej rzucających się w oczy zmian jest to, że Codex może teraz kontrolować komputer w tleAgent może widzieć, co dzieje się na ekranie, przesuwać własny kursor, klikać, wpisywać tekst i reagować na to, co dzieje się w zainstalowanych aplikacjach, nie przerywając czynności wykonywanych przez użytkownika za pomocą myszy lub klawiatury.
Ta możliwość umożliwia współpracę wielu agentów Codexu równolegle w tym samym zespolePolega ona na przeprowadzaniu testów, zmianie konfiguracji lub wykonywaniu powtarzalnych zadań, podczas gdy pracownik kontynuuje swoje normalne czynności. Otwiera to drogę do automatyzacji przepływów pracy, które wcześniej wymagały stałego nadzoru, takich jak testowanie aplikacji po każdej zmianie kodu lub powtarzanie czynności interfejsu.
OpenAI proponuje tę funkcję jako sposób na obsługę asystenta narzędzia, które nie mają API lub bezpośrednie integracje, co jest powszechne w wielu programach desktopowych. Codex, „widząc” ekran i sterując kursorem, może wchodzić w interakcje z tymi aplikacjami tak samo, jak robiłby to człowiek, choć na razie w sposób kontrolowany i ze szczególnym uwzględnieniem bezpieczeństwa.
Według firmy korzystanie z komputera będzie początkowo dostępne w macOS za pośrednictwem aplikacji desktopowej Codex, powiązany z kontem ChatGPT. Wersja dla systemu Windows pojawi się później, po przetestowaniu wydajności i dostosowaniu funkcji do środowiska Microsoft.
W przypadku Europy i Wielkiej Brytanii OpenAI potwierdziło, że sterowanie komputerowe, zaawansowana personalizacja, sugestie kontekstowe i pamięć Zostaną one aktywowane później. Powodem jest konieczność dostosowania tych funkcji do przepisów o ochronie danych, co jest szczególnie rygorystycznym wymogiem w Unii Europejskiej i na rynku brytyjskim.

Zintegrowana przeglądarka i bezpośrednia praca na stronach internetowych
Aktualizacja wzmacnia również związek Codexu z siecią dzięki przeglądarka zintegrowana z samą aplikacjąZamiast odbierać tylko ogólne instrukcje tekstowe, agent może odbierać polecenia bezpośrednio dotyczące konkretnych elementów strony.
Na przykład w rozwoju front-endu użytkownik może Wybierz komponent internetowy i opisz zmianę. Użytkownik chce coś zrobić (np. zmienić kolor, rozmiar tekstu lub układ bloku), a Codex rozumie instrukcję w konkretnym kontekście wizualnym. Dzięki temu unika się konieczności pisania długich monitów wyjaśniających, która część witryny wymaga zmiany.
Ta wbudowana przeglądarka umożliwia również korzystanie z Codexu Analizuj treści, zbieraj informacje i wykorzystuj je jako kontekst Pozostałe zadania, takie jak dokumentowanie kodu, sprawdzanie specyfikacji produktów czy porównywanie dokumentacji technicznej, można wykonywać w tym samym środowisku, bez konieczności przełączania się między wieloma oknami systemu operacyjnego.
Generowanie i edycja obrazów za pomocą gpt-image-1.5
Kolejnym filarem nowej wersji Codexu jest integracja modelu gpt-image-1.5 do tworzenia i modyfikowania obrazów Z poziomu aplikacji komputerowej agent może generować wykresy, diagramy, makiety i szkice wizualne na podstawie tekstu lub łącząc instrukcje ze zrzutami ekranu i fragmentami kodu.
Możliwość ta jest skierowana bezpośrednio do zespołów pracujących w projektowanie produktów, interfejsów użytkownika lub prototypów gier wideoNa przykład programista może wykonać zrzut ekranu niedokończonego interfejsu, poprosić Codex o zaproponowanie nowego wyglądu menu lub nowego schematu kolorów i uzyskać wygenerowane obrazy pasujące do tego kontekstu, bez konieczności zmiany narzędzi.
Dzięki scentralizowaniu wszystkich funkcji w Kodeksie agenci mogą łączyć zadania związane z kodowaniem i projektowaniem: napisz logikę funkcjonalności, zaktualizuj odpowiedni front-end i wygeneruj makietę wizualną do zaprezentowania zespołowi, bez opuszczania przepływu pracy lub konieczności otwierania zewnętrznych aplikacji do edycji grafiki.
Pamięć, kontekst i automatyzacja zadań długoterminowych
Oprócz sterowania komputerowego i generowania obrazu, największym celem OpenAI w tej wersji jest wyposażenie Codexu w pamięć trwała i znacznie szersze zarządzanie kontekstemNarzędzie to umożliwia ponowne wykorzystanie poprzednich konwersacji, zachowanie ważnych informacji i odzyskanie ich, gdy zajdzie potrzeba kontynuowania projektu.
Funkcja pamięci, która jest udostępniana w wersji zapoznawczej, umożliwia Codexowi zapamiętać osobiste preferencje, częste poprawki lub dane, których zebranie było trudneObejmuje to wszystko, począwszy od typowego stosu technologicznego zespołu, przez sposób organizacji folderów, po najczęściej używane formaty raportów i tagi zwykle używane w serwisie GitHub w przypadku niektórych typów problemów.
Dzięki temu zgromadzonemu kontekstowi agent może proaktywnie proponować zadaniaMożna go użyć do zasugerowania wznowienia niedokończonego projektu, zarekomendowania oczekującego refaktoryzowania lub powiadomienia użytkowników o długoterminowych żądaniach ściągnięcia. Niektóre firmy już używają go do śledzenia konwersacji w Slacku, Gmailu lub Notion i reagowania na określone zdarzenia.
Kodeks może również zaplanuj pracę na przyszłość i reaktywuj się niezależnie do realizacji długoterminowych zadań. Na przykład, może zarządzać kolejką przeglądów kodu przez dni lub tygodnie, odpowiadając na komentarze i aktualizując dokumentację bez konieczności ciągłego monitorowania jej przez programistę.
Ponad 90 dodatków i ulepszone wsparcie dla programistów
Aby dokończyć zmianę, OpenAI dodało prawie 90 nowych wtyczek KodeksuObejmują one integracje z pakietem Microsoft Suite, GitLab Issues, Neon by Databricks, Render i Superpowers, a także obsługę serwerów MCP (Model Context Protocol). Celem jest zapewnienie agentowi większej liczby źródeł kontekstu i większych możliwości operacyjnych.
Dzięki tym wtyczkom Codex może zbierać informacje z różnych usług i działać na ich podstawie Z poziomu jednego obszaru roboczego można przeglądać zgłoszenia w usłudze GitLab, wykonywać zapytania dotyczące danych w środowisku Databricks, aktualizować dokumenty pakietu Office lub korzystać z usług wdrożeniowych, nie zmuszając użytkownika do przeskakiwania między platformami.
Na poziomie czysto technicznym aktualizacja wzmacnia typowe przepływy pracy programistówTeraz Codex umożliwia przeglądanie żądań ściągnięcia, zarządzanie wieloma kartami terminala jednocześnie, łączenie się ze zdalnymi środowiskami programistycznymi za pomocą protokołu SSH oraz otwieranie plików z bogatym podglądem, niezależnie od tego, czy są to pliki PDF, arkusze kalkulacyjne, prezentacje czy dokumenty w innych formatach.
Wszystko to jest skoncentrowane w ujednoliconym doświadczeniu, które według samego OpenAI pozwala na szybszy postęp na wszystkich etapach cyklu życia oprogramowaniaOd napisania początkowego kodu, przez jego testowanie, wdrażanie, dokumentowanie, po konserwację — agenci AI stale ze sobą współpracują w ramach tego samego środowiska pulpitu.
Dostępność, skupienie się na deweloperach i sytuacja w Europie
Nowa wersja Kodeksu jest już wdrażana w aplikacja na komputer stacjonarny dla systemu macOS Dla osób logujących się za pomocą konta ChatGPT. Nie wszystkie funkcje wymagają tego samego rodzaju subskrypcji, a niektóre zaawansowane funkcje mogą zależeć od zakupionego planu, podobnie jak w przypadku innych narzędzi OpenAI.
Thibault Sottiaux, dyrektor Codexu, wyjaśnił, że ta aktualizacja Jest on skierowany szczególnie do deweloperówChociaż intencją jest późniejsze rozszerzenie go na szerszą grupę odbiorców. Chodzi o to, aby zespoły techniczne jako pierwsze skorzystały z nowych agentów i zautomatyzowanych przepływów pracy, a z czasem przeniosły ten model na zadania biurowe, zarządzanie dokumentami czy osobistą produktywność.
OpenAI podkreśla, że wykorzystanie mocy obliczeniowej i pamięci jest realizowane za pomocą podejście zapewniające bezpieczeństwo i zgodność z przepisamiJest to szczególnie istotne w Unii Europejskiej i Wielkiej Brytanii. Z tego powodu zaawansowane funkcje personalizacji, sugestie kontekstowe, pamięć trwała i bezpośrednia kontrola nad systemem operacyjnym będą dostępne na tych rynkach nieco później.
W każdym razie firma utrzymuje, że ta ewolucja Kodeksu otwiera drzwi do superaplikacja desktopowa skoncentrowana na inteligentnej automatyzacjigdzie agenci AI nie tylko pomagają pisać kod, ale także koordynują zadania, dostosowują się do stylu pracy użytkownika i utrzymują złożone projekty w działaniu przez dłuższy czas. Dla europejskich programistów komunikat jest jasny: nadchodzą nowe możliwości, ale z niezbędnymi dostosowaniami, aby dopasować się do istniejących ram regulacyjnych.