Lubiany przez Jensena Huanga Aby wprowadzić sztuczną inteligencję do każdego centrum danych, The Nvidia – powiedział współzałożyciel i CEO dziś podczas Computex w Tajpej. Podczas pierwszego publicznego przemówienia Huanga od prawie czterech lat ogłosił kilka ogłoszeń, w tym daty premiery chipów, superkomputera DGX GH200 i partnerstwa z dużymi firmami. Oto wszystkie wiadomości z dwugodzinnego przemówienia.
1. Karta graficzna Nvidia GForce RTX 4080 Ti dla graczy jest obecnie w pełnej produkcji i jest „produkowana masowo” z partnerami na Tajwanie.
2. Huang ogłosił Nvidia Avatar Cloud Engine (ACE) for Games, konfigurowalną usługę AI Model Foundry z wstępnie wyszkolonymi modelami dla twórców gier. Dzięki interakcjom językowym opartym na sztucznej inteligencji NPC zyskają dodatkowy charakter.
3. Model obliczeniowy Nvidia Kuta obsługuje obecnie cztery miliony programistów i ponad 3000 aplikacji. Cuda odnotowała ponad 40 milionów pobrań, w tym 25 milionów pobrań tylko w zeszłym roku.
4. Produkcja na pełną skalę serwera GPU HGX H100 została rozpoczęta i „jest produkowana przez firmy z całego Tajwanu” — powiedział Huang. Twierdził również, że był to pierwszy na świecie komputer z silnikiem transformatorowym.
5. Huang nazwał przejęcie przez Nvidię w 2019 roku producenta chipów superkomputerowych Mellanox za 6,9 miliarda dolarów „jedną z największych decyzji strategicznych”.
6. Produkcja następnej generacji układów GPU Hopper rozpocznie się w sierpniu 2024 r., dokładnie dwa lata po rozpoczęciu produkcji pierwszej generacji.
7. Nvidia GH200 Grace Hopper jest już w pełnej produkcji. SuperChip 4 PetaFIOPS TE wykorzystuje 72 procesory ARM, 96 GB pamięci HBM3 i 576 procesorów graficznych połączonych za pomocą połączeń typu chip-to-chip. Huang opisał to jako pierwszy na świecie przyspieszony procesor komputerowy, który ma również gigantyczną pamięć: „To komputer, a nie chip”. Jest przeznaczony do zastosowań w centrach danych o wysokiej rezystancji.
8. Jeśli pamięć Grace Hopper to za mało, Nvidia ma rozwiązanie — DGX GH200. Został stworzony przez połączenie najpierw ośmiu Grays Hoppers z trzema przełącznikami NVLINK, a następnie połączenie ze sobą zasobników o pojemności 900 GB. Wreszcie 32 są połączone razem z kolejną warstwą przełączników, aby połączyć łącznie 256 żetonów szarego zbiornika. Powstały ExaFLOPS Transformer Engine działa jak gigantyczny GPU ze 144 TB pamięci GPU. Grace Hopper jest tak szybka, że może obsługiwać warstwę 5G w oprogramowaniu, powiedział Huang. Google Cloud, Meta i Microsoft będą pierwszymi firmami, które uzyskają dostęp do DGX GH200 i poznają jego możliwości.
9. Nvidia i SoftBank nawiązały współpracę w celu wprowadzenia Grace Hopper Superchip w nowych rozproszonych centrach danych SoftBank w Japonii. Hostuj generatywną sztuczną inteligencję i aplikacje bezprzewodowe na wspólnej platformie serwerowej dla wielu dzierżawców, zmniejszając koszty i zużycie energii.
10. Partnerstwo SoftBank-Nvidia opiera się na architekturze referencyjnej Nvidia MGX, z której obecnie korzystają firmy na Tajwanie. Zapewnia modułową strukturę referencyjną, która umożliwia producentom komputerów zbudowanie ponad 100 wariantów serwerów dla sztucznej inteligencji, przyspieszonych obliczeń i aplikacji omniverse. Wspólne przedsięwzięcia obejmują ASRock Rack, Asus, Gigabyte, Pegatron, QCT i Supermicro.
11. Huang ogłosił akcelerowaną platformę sieciową Spectrum-X w celu przyspieszenia chmur opartych na sieci Ethernet. Posiada przełącznik Spectrum 4 ze 128 portami o przepustowości 400 GB/s i 51,2 T/s. Przełącznik został zaprojektowany do obsługi nowego typu sieci Ethernet i jest zaprojektowany kompleksowo do adaptacyjnego routingu, izolacji wydajności i przetwarzania w sieci szkieletowej, powiedział Huang. Ma inteligentny nick BlueField 3, który łączy się z przełącznikiem Spectrum 4 w celu kontrolowania przeciążenia.
12. WPP, największa na świecie agencja reklamowa, nawiązała współpracę z Nvidią w celu zbudowania silnika treści opartego na Nvidia Omniverse. Będzie w stanie tworzyć zdjęcia i treści wideo do wykorzystania w reklamie.
13. Platforma robotów Nvidia Isaac ARM jest teraz dostępna dla każdego, kto chce budować roboty i ma pełny stos od chipów po czujniki. Isaac ARM zaczyna się od chipa o nazwie Nova Orin i jest pierwszym w pełni referencyjnym stosem robotyki, powiedział Huang.
Dzięki swojej pozycji w dziedzinie sztucznej inteligencji akcje Nvidii poszybowały w górę w ciągu ostatniego roku, a obecnie jej wycena rynkowa wynosi około 960 miliardów dolarów, co czyni ją jedną z najcenniejszych firm na świecie (tylko Apple, Microsoft, Saudi Aramco, Alphabet i Amazon zajmują wyższą pozycję).
Chiński biznes stoi w miejscu
Nie ma wątpliwości, że chińskie firmy AI bacznie obserwują najnowocześniejszy krzem, który Nvidia wprowadza na stół. Tymczasem obawiają się kolejnej rundy amerykańskich zakazów chipów, które grożą podważeniem ich postępów w generatywnej sztucznej inteligencji, która będzie wymagać znacznie większej mocy obliczeniowej i danych niż poprzednie generacje sztucznej inteligencji.
W zeszłym roku rząd USA zakazał Nvidii sprzedaży procesorów graficznych A100 i H100 do Chin. Oba chipy są używane do uczenia dużych modeli językowych, takich jak GPT-4 OpenAI. H100, jego układ najnowszej generacji oparty na architekturze obliczeniowej Nvidii Hopper GPU z wbudowanym silnikiem Transformer, cieszy się szczególnie dużym zainteresowaniem. W porównaniu do A100H100 może zapewnić 9x szybsze szkolenie AI i 30x szybsze wnioskowanie AI w LLM.
Chiny to oczywiście ogromny rynek, którego nie można przegapić. Zakaz eksportu chipów kosztował Nvidię 400 milionów dolarów potencjalnej sprzedaży tylko w trzecim kwartale ubiegłego roku. To sprawiło, że Nvidia próbowała sprzedać Chinom wolniejszy chip, który spełniałby amerykańskie przepisy dotyczące kontroli eksportu. Ale na dłuższą metę Chiny będą szukać jeszcze silniejszych alternatyw, a zakaz stanowi wyraźne przypomnienie dla Chin, aby stały się samowystarczalne w kluczowych sektorach technologicznych.
Jak ostatnio powiedział Huang Wywiad Z Financial Times: „Jeśli [China] Nie można kupić w USA, robią to sami. Więc Ameryka powinna być ostrożna. Chiny to bardzo ważny rynek dla sektora technologicznego.