Nvidia i Google Cloud uruchomią instancje sprzętowe AI
Blog

Nvidia i Google Cloud uruchomią instancje sprzętowe AI

Firma Nvidia nawiązała współpracę z firmą Google Cloud w celu wprowadzenia na rynek nowej oferty sprzętu w chmurze, Platforma L4, który jest przeznaczony do obsługi aplikacji skoncentrowanych na wideo, jednocześnie przyspieszając wydajność wideo opartą na sztucznej inteligencji. To partnerstwo zapewni klientom korporacyjnym dostęp do platformy L4 za pośrednictwem Vertex AI, zarządzanej usługi uczenia maszynowego Google.

L4 jest obecnie dostępne w Google Cloud jako prywatny podgląd za pośrednictwem maszyn wirtualnych Google G2. Jest to uniwersalny procesor graficzny, który zapewnia możliwości transkodowania, strumieniowania wideo i dekodowania wideo. Nvidia planuje wypuścić L4 w tym roku za pośrednictwem swoich partnerów sprzętowych, w tym Cisco, Dell, Asus, Hewlett Packard Enterprise i Lenovo.

Nvidia ma również ogłosił inne rozwiązania sprzętowe skoncentrowane na AI, w tym L40, H100 NVL i Grace Hopper dla modeli rekomendacji. L40 jest zaprojektowany do optymalizacji grafiki i generowania obrazów 2D, wideo i 3D z obsługą AI, podczas gdy H100 NVL obsługuje duże modele językowe, takie jak ChatGPT. Grace Hopper z Recommendation Models skupia się na modelach rekomendacji.

L40 jest dostępny w tym tygodniu u partnerów sprzętowych Nvidii. Z drugiej strony Nvidia spodziewa się, że H100 NVL i Grace Hopper zostaną dostarczone w drugiej połowie roku.

Oprócz platformy L4, Nvidia uruchomiła platformę DGX Cloud, która oferuje infrastrukturę i oprogramowanie do trenowania modeli dla generatywnych i innych form AI. DGX Cloud oferuje osiem procesorów graficznych Nvidia H100 lub A100 80 GB Tensor Core na węzeł, wraz z pamięcią masową. Subskrybenci DGX Cloud mają również dostęp do warstwy oprogramowania Nvidia, AI Enterprise, która zawiera struktury AI, wstępnie wytrenowane modele i przyspieszone biblioteki nauki o danych.

Nvidia planuje współpracę z innymi dostawcami usług w chmurze w celu hostowania infrastruktury DGX Cloud. Oracle Cloud Infrastructure jest pierwszym partnerem, podczas gdy Microsoft Azure ma rozpocząć hostowanie DGX Cloud w następnym kwartale fiskalnym. Usługa ostatecznie zostanie rozszerzona również na Google Cloud.

Wejście Nvidii w obliczenia AI jest częścią jej strategii odejścia od nieopłacalnych inwestycji w gry i profesjonalną wirtualizację. Ostatni raport zysków firmy pokazał, że jej działalność w zakresie centrów danych, w tym chipów AI, nadal rośnie, co wskazuje, że Nvidia może skorzystać z generatywnego boomu AI.

Jaka jest twoja reakcja?

Podekscytowany
0
Szczęśliwy
0
Miłość
0
Niepewny
0
Głupi
0
Sama Wilsona
Sam jest naukowcem danych z siedzibą w Berkeley w Kalifornii. Jest pasjonatem AI i pracuje w tej dziedzinie od kilku lat. W wolnym czasie lubi wędrować i odkrywać nowe szlaki.

    Produkty które mogą Ci się spodobać:

    Więcej w:Blog