„Nvidia“ generalinis direktorius gina savo griovį, kai dirbtinio intelekto laboratorijos keičia savo AI modelių tobulinimą
„Nvidia“ per pastarąjį ketvirtį uždirbo daugiau nei 19 mlrd. Kalbėdami apie pajamas, analitikai generaliniam direktoriui Jensenui Huangui pasakė, kaip „Nvidia“ seksis, jei technologijų įmonės pradėtų naudoti naujus metodus savo AI modeliams tobulinti.
Metodas, kuriuo grindžiamas OpenAI o1 modelis, arba „bandymo laiko mastelio keitimas“, atsirado gana dažnai. Manoma, kad dirbtinio intelekto modeliai duos geresnius atsakymus, jei suteiksite jiems daugiau laiko ir skaičiavimo galios „mąstyti“ per klausimus. Tiksliau, tai prideda daugiau skaičiavimo prie AI išvados fazės, kuri yra viskas, kas nutinka vartotojui spustelėjus įvesties mygtuką.
„Nvidia“ generalinis direktorius buvo paklaustas, ar jis mato, kaip dirbtinio intelekto modelių kūrėjai pereina prie šių naujų metodų ir kaip senesni „Nvidia“ lustai veiktų darant AI išvadas.
Huangas investuotojams sakė, kad o1 ir bandymo laiko keitimas plačiau gali vaidinti didesnį vaidmenį „Nvidia“ versle, pavadindamas tai „vienu įdomiausių pokyčių“ ir „nauju mastelio keitimo įstatymu“. Huangas padarė viską, kad investuotojai užtikrintų, jog „Nvidia“ būtų tinkamai pasiruošusi pokyčiams.
„Nvidia“ generalinio direktoriaus pastabos sutampa su tuo, ką „Microsoft“ generalinis direktorius Satya Nadella pasakė antradienį „Microsoft“ renginio scenoje: „o1“ yra naujas būdas dirbtinio intelekto pramonei tobulinti savo modelius.
Tai yra didelis dalykas lustų pramonei, nes joje daugiau dėmesio skiriama AI išvadoms. Nors „Nvidia“ lustai yra auksinis AI modelių mokymo standartas, yra daugybė gerai finansuojamų startuolių, kuriančių žaibiškus AI išvadų lustus, pvz., „Groq“ ir „Cerebras“. Tai galėtų būti konkurencingesnė erdvė Nvidia veikti.
Nepaisant naujausių pranešimų, kad generuojamųjų modelių tobulinimas lėtėja, Huangas analitikams sakė, kad dirbtinio intelekto modelių kūrėjai vis dar tobulina savo modelius, pridedant daugiau skaičiavimo ir duomenų per išankstinį mokymą.
„Anthropic“ generalinis direktorius Dario Amodei taip pat trečiadienį per interviu scenoje per Cerebral Valley viršūnių susitikimą San Franciske sakė nemato modelio kūrimo sulėtėjimo.
„Pagrindinio modelio išankstinio mokymo mastelio keitimas yra nepakitęs ir jis tęsiasi“, – trečiadienį sakė Huangas. „Kaip žinote, tai yra empirinis dėsnis, o ne pagrindinis fizinis dėsnis, bet įrodymai rodo, kad jis ir toliau didėja. Tačiau mes mokomės, kad to nepakanka.
Tai tikrai norėjo išgirsti „Nvidia“ investuotojai, nes lustų gamintojo akcijos 2024 m. išaugo daugiau nei 180 %, parduodant dirbtinio intelekto lustus, kuriais „OpenAI“, „Google“ ir „Meta“ moko savo modelius. Tačiau Andreessen Horowitz partneriai ir keli kiti dirbtinio intelekto vadovai anksčiau teigė, kad šie metodai jau pradeda rodyti mažėjančią grąžą.
Huangas pažymėjo, kad dauguma „Nvidia“ skaičiavimo darbų krūvių šiandien yra susiję su išankstiniu dirbtinio intelekto modelių mokymu, o ne išvadomis, tačiau jis tai labiau priskyrė tam, kur šiandien yra dirbtinio intelekto pasaulis. Jis sakė, kad vieną dieną paprasčiausiai bus daugiau žmonių, valdančių AI modelius, o tai reiškia, kad bus daugiau išvadų. Huangas pažymėjo, kad „Nvidia“ šiandien yra didžiausia išvadų platforma pasaulyje, o įmonės mastas ir patikimumas suteikia jai didžiulį pranašumą, palyginti su startuoliais.
„Mūsų viltys ir svajonės yra, kad kada nors pasaulis padarys daugybę išvadų ir tada AI tikrai pasisekė“, – sakė Huangas. „Visi žino, kad jei jie diegs CUDA ir Nvidia architektūros naujoves, jie galės greičiau diegti naujoves ir žino, kad viskas turėtų veikti.