Projekt Genie, prototyp sztucznej inteligencji Google’a do tworzenia interaktywnych światów

  • Projekt Genie łączy w sobie Genie 3, Nano Banana Pro i Gemini, umożliwiając generowanie interaktywnych wirtualnych światów z tekstu lub obrazów.
  • Dostęp jest ograniczony do subskrybentów usługi Google AI Ultra w Stanach Zjednoczonych, sesje trwają maksymalnie 60 sekund, a rozdzielczość wynosi około 720p.
  • Narzędzie pozwala szkicować, eksplorować i mieszać światy w czasie rzeczywistym, jednak ma problemy z realizmem, opóźnieniami i słabą kontrolą nad postaciami.
  • Jej zdolność do imitowania znanych gier wywołuje debaty na temat praw autorskich i niepokój części branży gier wideo.

Projekt sztucznej inteligencji mający na celu generowanie interaktywnych światów

Google podjęło nowy krok w swojej ofensywie sztuczna inteligencja stosowana w grach wideo i wirtualne światy Wraz z premierą Project Genie, prototypu, który pozwala użytkownikom generować i nawigować po interaktywnych środowiskach w oparciu o kilka podpowiedzi tekstowych lub obraz, firma przedstawia narzędzie jako eksperyment, wciąż w fazie testów. Jednak jego pierwsze demonstracje wywołały zarówno entuzjazm, jak i wątpliwości w branży.

Na razie dostęp jest ograniczony do abonentów planu Google AI Ultra w Stanach Zjednoczonychz krótkimi sesjami i wydajnością wyraźnie naznaczoną eksperymentalnym charakterem systemu. Mimo to projekt wskazuje na przyszłość, w której każdy użytkownik będzie mógł stwórz mały „grywalny świat” w ciągu kilku sekund, bez konieczności znajomości programowania i obsługi silników graficznych.

Czym jest Project Genie i jakie technologie łączy?

Generator świata ze sztuczną inteligencją

Projekt Genie to prototyp badawczy opracowany przez Google DeepMind i Google AI który działa jak interaktywny generator świata. Jego techniczne podstawy opierają się na trzech filarach: modelu Genie 3, specjalizującym się w symulacji dynamicznych środowisk; Nano Banana Pro, odpowiedzialnym za aspekty wizualne i szkice; oraz Gemini, modelu multimodalnym, który interpretuje instrukcje użytkownika i działa jako asystent podczas tworzenia.

Sercem systemu jest Genie 3, model „świata” zdolny do przewidywania klatka po klatce tego, co dzieje się na ekranieW odróżnieniu od poprzednich technologii, które generowały wyłącznie statyczne sceny 3D, to podejście pozwala otoczeniu reagować na ruchy gracza w czasie rzeczywistym, z rozdzielczością około 720p i kilkoma minutami spójności wizualnej, zgodnie z wewnętrznymi eksperymentami DeepMind.

Na tej podstawie jest on zintegrowany Nano Banana Pro, odpowiedzialny za generowanie początkowego obrazu sceny Ten początkowy widok, na podstawie tekstu opisowego lub obrazu referencyjnego, służy jako szkic, na którym można zdecydować o stylu graficznym, kompozycji świata i wyglądzie postaci, którą będziesz sterować podczas eksploracji.

Wreszcie, Gemini działa jako warstwa orkiestracyjna i asystentInterpretuje instrukcje w języku naturalnym, pomaga dostosowywać świat na bieżąco i ułatwia wykonywanie takich zadań, jak zmiana perspektywy (pierwsza lub trzecia osoba), remiksowanie już stworzonego środowiska lub łączenie kilku pomysłów w jeden grywalny scenariusz.

Jak powstają i są eksplorowane wirtualne światy

Interaktywne światy generowane przez sztuczną inteligencję

Działalność Projektu Genie opiera się na: proces postępowy w trzech fazach Google podsumowuje to jako szkicowanie, eksplorowanie i łączenie światów. Celem jest umożliwienie każdemu przejścia od pomysłu do małego interaktywnego doświadczenia bez dodatkowych narzędzi.

W pierwszym etapie użytkownik pisze opis świata, który chce stworzyć, lub przesyła obraz referencyjny. Na podstawie tych danych wejściowych Nano Banana Pro generuje statyczny podgląd Scenerią może być las w stylu low-poly, futurystyczne środowisko miejskie, historyczny krajobraz lub cokolwiek innego, co opisano w tekście. Na tym etapie definiuje się również typ postaci, tryb kamery i podstawowe parametry ruchu.

Po zaakceptowaniu szkicu do gry wchodzi Genie 3, który umożliwia graczowi Eksploruj otoczenie swobodnie, korzystając ze standardowych funkcji komputera, takich jak klawisze W, A, S i DModel generuje na bieżąco to, co pojawia się przed postacią, przewidując każdą klatkę na podstawie poprzednich i zachowując pewną spójność, gdy kamera się obraca lub powraca do obszaru, który już odwiedziła.

Trzecią kluczową umiejętnością jest łączenie i remiksowanie światówSystem pozwala użytkownikom na przeglądanie wcześniej wygenerowanych scenariuszy, modyfikowanie ich za pomocą nowych parametrów, łączenie ich ze sobą, a nawet wykorzystywanie wstępnie wygenerowanych światów od Google jako bazy do tworzenia wariantów. Dodatkowo, nagrania z sesji można udostępniać innym użytkownikom do obejrzenia lub wykorzystania jako inspiracji.

Wszystko to jest obsługiwane z poziomu aplikacji internetowej podobnej do innych usług Google AI, dzięki czemu Nie trzeba instalować żadnych dodatkowych programów, ani posiadać zaawansowanej wiedzy technicznej.Wystarczy uruchomić narzędzie, wprowadzić instrukcję i rozpocząć testowanie kombinacji, aż do uzyskania interesującego wyniku.

Ograniczenia techniczne: czas, wydajność i realizm

Ograniczenia prototypu sztucznej inteligencji dla światów wirtualnych

Google upiera się przy definiowaniu Projektu Genie jako prototyp badawczy o wyraźnie eksperymentalnym charakterzeTa etykieta nie jest czystą formalnością: obecne doświadczenia wskazują na kilka wyraźnych ograniczeń, które utrudniają praktyczne wykorzystanie narzędzia, wykraczając poza początkową ciekawość.

Najbardziej oczywistym jest Limit 60 sekund na generację i sesję eksploracyjnąPo tej minucie świat się wyłącza i rozpoczyna się nowe doświadczenie. Firma wyjaśnia, że ​​to ograniczenie pozwala na lepsze rozdysponowanie zasobów obliczeniowych, ponieważ każda sesja rezerwuje dedykowany procesor dla użytkownika, który gra.

W zakresie wydajności testy publiczne opisują rozdzielczość zbliżona do 720p i częstotliwość od 20 do 24 klatek na sekundęTym funkcjom towarzyszy zauważalne opóźnienie sygnału wejściowego podczas poruszania postacią lub zmiany kamery. Według niektórych wczesnych testerów, wrażenia z gry bardziej przypominają interaktywne wideo niż w pełni płynną, tradycyjną grę wideo.

Należy również zauważyć, że Genie 3 Nie jest to klasyczny silnik graficzny, lecz model przewidujący następną klatkę. W związku z powyższym, prowadzi to do dziwnych zachowań: ścieżek, które zmieniają teksturę bez wyraźnego powodu, znikających elementów, nieprawdopodobnej fizyki lub losowo deformujących się animacji.

Sam Google ostrzega, że ​​generowane światy „Mogą nie wydawać się całkowicie prawdziwe lub nie zawsze odpowiadać wskazaniom lub prawom fizyki”.Sterowanie postaciami bywa niedokładne. Innymi słowy, technologia ta rokuje nadzieje, ale wciąż daleko jej do dopracowanego doświadczenia w grach pod względem rozgrywki i stabilności wizualnej.

Ograniczony dostęp i międzynarodowa mapa drogowa

Ograniczony dostęp do prototypu sztucznej inteligencji

W tej pierwszej fazie Projekt Genie jest dostępny tylko dla Klienci Google AI Ultra w Stanach ZjednoczonychNajbardziej zaawansowany plan subskrypcji firmy jest skierowany do firm i twórców, którzy potrzebują wydajnych możliwości sztucznej inteligencji. To usługa premium, która ogranicza liczbę użytkowników mających dostęp do eksperymentu.

Decyzja o ograniczeniu testów jest uzasadniona zarówno koszt obliczeniowy każdej sesji Wynika to z zainteresowania Google zebraniem szczegółowych opinii przed szerszym wdrożeniem. Dyrektor ds. badań w DeepMind, Shlomi Frutcher, podkreślił, że możliwość udostępnienia tych narzędzi większej liczbie osób w celu zebrania rzeczywistych opinii użytkowników jest „ekscytująca”, ale na razie nie ma konkretnej daty ich pojawienia się w Europie ani na innych rynkach.

Z perspektywy użytkowników i badań hiszpańskich i europejskich oznacza to, że przynajmniej w krótkim okresie Najbardziej realistyczną rolą będzie rola obserwatora:uważnie śledź testy, analizuj filmy krążące już w mediach społecznościowych i oceń, w jakim stopniu tę technologię można zintegrować z procesami projektowania poziomów, szybkiego prototypowania i wizualizacji pomysłów.

Google wyraziło zamiar stopniowo rozszerzać dostęp O ile pozwolą na to wydajność, koszty i kwestie prawne. Tempo tego rozwoju będzie jednak również zależeć od reakcji społeczności i rozwoju debaty na temat praw autorskich i odpowiedzialnego korzystania z treści stron trzecich.

Możliwość imitowania znanych gier i debaty na temat praw autorskich

Jednym z najbardziej delikatnych punktów Projektu Genie jest jego możliwość odtworzenia, z różnym stopniem powodzenia, światów wyraźnie inspirowanych istniejącymi grami wideoNiektórym dziennikarzom specjalizującym się w tego typu tematyce udało się stworzyć scenariusze, które wyraźnie przypominały takie tytuły, jak Super Mario 64, Metroid Prime czy The Legend of Zelda: Breath of the Wild.

W przypadku Zeldy widziano je nawet postacie, które rozkładają paralotnię podczas skokuTen gest jest ściśle związany z grą Nintendo. Te zbieżności sugerują, że model został wytrenowany z wykorzystaniem dużej liczby publicznie dostępnych filmów z rozgrywki, co rodzi pytania dotyczące traktowania własności intelektualnej w procesie szkolenia sztucznej inteligencji.

Po kilku testach, w których odtworzono światy inspirowane powszechnie rozpoznawalnymi franczyzami, Google zaczęło zablokować generowanie niektórych scenariuszy i postacizwłaszcza gdy wspominane są konkretne nazwy lub znaki towarowe. W niektórych przypadkach narzędzie bezpośrednio zapobiega tworzeniu światów opartych na określonych sagach, powołując się na „interesy zewnętrznych dostawców treści”.

Firma wyjaśnia, że ​​projekt Genie to „szkolony głównie z wykorzystaniem publicznie dostępnych danych internetowych”Należy jednak pamiętać, że treści te nadal podlegają prawom autorskim. W rezultacie powstał system moderacji, który wciąż jest w fazie rozwoju. Niektóre próby reprodukcji utworów chronionych prawem autorskim są wyraźnie blokowane, a inne przechodzą bezkarnie, o ile unika się zbyt bezpośrednich odniesień.

To nieregularne zachowanie podsyca debatę na temat W jakim stopniu sztuczna inteligencja może lub powinna inspirować się istniejącymi grami? Gdzie przebiega granica między hołdem, imitacją a kopiowaniem? Oczekuje się, że ta debata będzie szczególnie istotna w regionach takich jak Unia Europejska, gdzie ramy regulacyjne dotyczące danych szkoleniowych i praw autorskich w sztucznej inteligencji wciąż są w fazie definiowania.

Potencjalny wpływ na branżę gier wideo

Poza medialną atrakcyjnością oglądania światy „jak Mario” lub „jak Zelda” generowane w ciągu kilku sekundProjekt Genie jest częścią szerszego wyścigu między dużymi firmami technologicznymi o zastosowanie generatywnej sztucznej inteligencji w tworzeniu gier. Na przykład Microsoft zaprezentował projekty takie jak Muse, mające na celu automatyzację części procesu projektowania i produkcji, a inne firmy badają podobne rozwiązania, aby obniżyć koszty i przyspieszyć rozwój.

W tym kontekście propozycja Google ma na celu stać się narzędzie do szybkiego prototypowania i eksperymentowania Może to zainteresować zarówno niezależne studia, jak i dużych wydawców. Możliwość zbudowania grywalnego scenariusza na podstawie szkicu lub akapitu tekstu może ułatwić wczesną weryfikację pomysłów, tworzenie wewnętrznych wersji demonstracyjnych lub testowanie mechaniki bez konieczności poświęcania wielu miesięcy pracy.

Jednak wzrost popularności tego typu rozwiązań budzi obawy wśród niektórych przedstawicieli sektora. Z jednej strony, Istnieją obawy dotyczące potencjalnego wpływu na niektóre profile zawodowe. Z drugiej strony, wielu deweloperów jest nieufnych wobec modeli biznesowych, w których sztuczna inteligencja jest trenowana na już opublikowanych pracach, bez wyraźnego wynagrodzenia dla ich autorów.

Na rynkach europejskim i hiszpańskim, gdzie debata na temat ochrony twórczości kulturowej jest szczególnie ożywiona, kluczowe będzie sprawdzenie, jak narzędzia takie jak Project Genie wpisują się w przyszłe regulacje. Aspekty takie jak przejrzystość danych szkoleniowych, systemy rezygnacji dla posiadaczy praw oraz atrybucja generowanych treści mogą zadecydować o tym, czy rozważne wdrożenie będzie miało wpływ na ciągły konflikt z twórcami i wydawcami.

Na razie Projekt Genie jest na wczesnym etapie, gdzie Działa bardziej jako laboratorium publiczne niż gotowy produkt.Jego rozwój oraz sposób, w jaki Google poradzi sobie z powiązanymi kwestiami prawnymi i etycznymi, zadecydują o tym, czy zostanie on ostatecznie zintegrowany z procesami pracy w studiach, czy pozostanie efektownym, ale ograniczonym eksperymentem.

Jednak wygląd tego prototypu wyraźnie pokazuje, że duże firmy technologiczne widzą w nim Automatyczne generowanie interaktywnych światów Strategiczny teren najwyższej klasy. Chociaż jego faktyczne wykorzystanie jest obecnie ograniczone i obarczone niedoskonałościami technicznymi, kierunek rozwoju jest jasny: modele coraz bardziej zdolne do przekształcania tekstu i obrazów w grywalne doświadczenia, a branża będzie musiała zdecydować, jak chce współistnieć z tymi nowymi narzędziami.

Podobne artykuł:
Definicja wirtualnej rzeczywistości Co powinieneś wiedzieć!