Notebookcheck Logo

NVIDIA prezentuje model generatywnej sztucznej inteligencji LATTE3D text-to-3D nazwany "wirtualną drukarką 3D"

LATTE3D może interpretować wysoce specyficzne monity tekstowe w celu wygenerowania modelu 3D (Źródło obrazu: NVIDIA)
LATTE3D może interpretować wysoce specyficzne monity tekstowe w celu wygenerowania modelu 3D (Źródło obrazu: NVIDIA)
Zespół badawczy NVIDIA ds. sztucznej inteligencji zaprezentował nowy model generatywny, który w ciągu sekundy może przekształcić podpowiedzi tekstowe w modele 3D, gotowe (lub przynajmniej bliskie tego) do zastosowań takich jak tworzenie gier, projektowanie i robotyka. Jak dotąd model został przeszkolony tylko do generowania "zwierząt i przedmiotów codziennego użytku", ale można dodać więcej kategorii. Niemal natychmiastowa prędkość powinna zmienić wiele przepływów pracy.
AI 3D Printing Nvidia Virtual Reality (VR) / Augmented Reality (AR)

Podczas gdy modele sztucznej inteligencji generujące obraz i wideo dominują w wiadomościach od jakiegoś czasu, NVIDIA zrobiła krok w kolejnym logicznym kierunku dzięki LATTE3D, nowemu generatywnemu modelowi sztucznej inteligencji, który zamienia podpowiedzi tekstowe w kompletne modele 3D w mniej niż sekundę. Zostało to ogłoszone podczas NVIDIA GTC w zeszłym tygodniutechnologia ta jest reklamowana jako podobna do "wirtualnej drukarki 3D", ponieważ może natychmiastowo dostarczać modele 3D "w popularnym formacie używanym w standardowych aplikacjach renderujących", gotowe do wdrożenia w tworzeniu gier wideo, reklamie, projektach projektowych lub dowolnej aplikacji wymagającej wirtualnego środowiska, w tym VR i AR.

Generatywna sztuczna inteligencja Text-to-3D nie jest nową technologią, a sam dokument badawczy firmy NVIDIA https://research.nvidia.com/labs/toronto-ai/LATTE3D/ stawia LATTE3D przeciwko kilku istniejącym systemom, takim jak MVDream, 3DTopia i LGM. Przewagą LATTE3D jest szybkość działania. W testach porównawczych inne modele sztucznej inteligencji potrzebują od 20 sekund do nawet 30 minut na wygenerowanie wyniku, podczas gdy LATTE3D generuje porównywalny (i często wyższej jakości) rendering w zaledwie 400 milisekund.

LATTE3D pracuje osobno nad geometrią 3D i teksturami, aby stworzyć realistyczny model (Źródło obrazu: NVIDIA)
LATTE3D pracuje osobno nad geometrią 3D i teksturami, aby stworzyć realistyczny model (Źródło obrazu: NVIDIA)
Niemal natychmiastowa wydajność jest tym, co daje LATTE3D przewagę nad innymi modelami AI (Źródło obrazu: NVIDIA)
Niemal natychmiastowa wydajność jest tym, co daje LATTE3D przewagę nad innymi modelami AI (Źródło obrazu: NVIDIA)
Mając więcej czasu, LATTE3D dalej udoskonala dane wyjściowe (Źródło obrazu: NVIDIA)
Mając więcej czasu, LATTE3D dalej udoskonala dane wyjściowe (Źródło obrazu: NVIDIA)

Należy zauważyć, że podobnie jak w przypadku drukowania 3D, jakość wydruku z LATTE3D i innych modeli AI poprawia się wraz z upływem czasu. Zaletą jest to, że w przeciwieństwie do druku 3D, na początku można zdecydować się na przedkładanie szybkości nad jakość, a później zdecydować się poczekać na bardziej wyrafinowane wyniki, zamiast ustalać ustawienia od samego początku.

Podobnie jak w przypadku każdej innej generatywnej sztucznej inteligencji, LATTE3D ma potencjał do przekształcenia wielu przepływów pracy. Podczas gdy wcześniej trzeba było przeszukiwać bibliotekę zasobów 3D lub poświęcać cenne godziny pracy, aby stworzyć prosty obiekt, dzięki technologii NVIDIA wystarczy wpisać krótki opis i zaimportować wygenerowany wynik do aplikacji lub platform.

Próbka możliwości LATTE3D (Źródło obrazu: NVIDIA)
Próbka możliwości LATTE3D (Źródło obrazu: NVIDIA)
 
 

Jak dotąd zespół badawczy wyszkolił LATTE3D tylko do tworzenia modeli przedmiotów codziennego użytku i zwierząt, ale można to rozszerzyć na inne kategorie z odpowiednimi zestawami danych. Model został wytrenowany przy użyciu procesorów graficznych NVIDIA A100 Tensor Core, a w wersji demonstracyjnej firmy działał na pojedynczej karcie NVIDIA RTX A6000.

Jako projekt badawczy, LATTE3D jest nadal w fazie rozwoju i jak dotąd nie było mowy o wydaniu go jako produktu lub usługi. Przyszłe plany projektu obejmują rozszerzenie możliwości o "text-to-4D" lub generowanie animacji 3D.

Wciągające środowiska wirtualne i rzeczywistości mieszanej można odkrywać dzięki zestawowi słuchawkowemu Meta Quest 3 i okularom AR XREAL Air 2 Pro, które są dostępne na Amazon.

Źródło(a)

Please share our article, every link counts!
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2024 03 > NVIDIA prezentuje model generatywnej sztucznej inteligencji LATTE3D text-to-3D nazwany "wirtualną drukarką 3D"
Vishal Bhardwaj, 2024-03-25 (Update: 2024-03-25)