Kaip „Deepseek“ AI proveržis iš naujo apibrėžė pasaulinės technologijų konkursą
2023 m. Pabaigoje pavadinta mažai žinoma kinų AI laboratorija Deepseek Stulbintas Silicio slėnis išleido atvirojo kodo modelius, kurie pralenkė pramonės titanus, tokius kaip „Openai“ „GPT-4O“ ir „Meta“ lama 3.1-tai dalis išlaidų. Šis proveržis sukėlė skubias diskusijas apie Amerikos AI lyderystę ir jos puslaidininkių eksporto kontrolės veiksmingumą.
6 milijonų dolerių „Marvel: Deepseek“ ekonomiškai efektyvi naujovė
„Deepseek“ pavyzdinis modelis buvo sukurtas tiesiog du mėnesiai su biudžetu 6 milijonai dolerių„NVIDIA“ H800 lustų panaudojimas (sumažintas eksporto variantas). Trečiųjų šalių etalonai atskleidė savo pranašumą koduojant, sudėtingą problemų sprendimą ir matematinį tikslumą, netgi pranokdami „Anthropic“ Claude’o sonetą 3.5. Prioritetų nustatymo efektyvumui, o ne brutaliam skaičiavimo galiai, „Deepseek“ atskleidė įtrūkimus Silicio slėnio „didesniame-i-better“ metode.
Pagrindinių etalonų rezultatai
- Kodavimas: 12% greičiau nei GPT-4o
- Matematikos samprotavimai: 9% didesnis tikslumas nei Claude 3.5
- Problemų sprendimas: Pralenkta lama 3.1 per 6/10 užduotis
Kaip „Deepseee“ apėmė JAV lustų apribojimus
JAV uždraudė eksportuoti pažangių lustų, tokių kaip NVIDIA H100, siekiant pažaboti Kinijos AI pažangą. Vis dėlto „Deepseee“ sėkmė naudojant „H800“ pabrėžia dvi galimybes:
- Novatoriški sprendimai: Technikos, kaip Modelio distiliavimas– Naudojant didesnius modelius mažesniems, efektyviems mokyti – padidėjo priklausomybė nuo neapdorotų skaičiavimo.
- Ydingas eksporto valdymas: Apribojimai gali netyčia paskatinti Kinijos laboratorijas, kad būtų galima optimizuoti išteklių naudojimą.
Kaip pažymėjo „Benchmark“ Chetanas Puttagunta, „Distiliavimas leidžia mažiems modeliams„ mokytis “iš milžinų-efektyviai“.
Kinijos AI ekosistemos kilimas
„Deepseek“ nėra vienas. Startupai patinka 01.AI (Įkūrė Kai-Fu Lee) ir atnaujinti „Bytedance“ modeliai pasiekia panašius žygdarbius:
- 01.AI: Išmokė pažangiausią modelį tik už 3 milijonus dolerių.
- TEMEDance: Teigia, kad naujausias leidimas pralenkia GPT-4O kritiniuose etalonuose.
Ši kolektyvinė pažanga pabrėžia didėjantį Kinijos AI inovacijų meistriškumą, kurį skatina būtinybė ir strateginiai ištekliai.
Silicio slėnis reaguoja: pagyrimas ir panika
„Microsoft“ generalinė direktorė Satya Nadella pripažino „Deepseek“ žingsnius „Davos 2024“: „Jų skaičiavimo efektyvumas yra puikus. Turime rimtai vertinti Kinijos pažangą. “ Tuo tarpu pasipiktinimo generalinis direktorius Aravind Srinivas savo sėkmę priskyrė adaptaciniam problemų sprendimui: „Suvaržymai veisiamas efektyvumas“.
Ką tai reiškia pasauliniam AI dominavimui
- Kaina palyginti su skale: Pigūs, veiksmingi modeliai galėtų demokratizuoti PG plėtrą.
- Geopolitiniai poslinkiai: Eksporto kontrolė gali pagreitinti Kinijos pasitikėjimą savimi.
- Atvirojo kodo pagreitis: „Deepseek“ nemokami modeliai kviečia visuotinį bendradarbiavimą ir konkurenciją.
Išvada: nauja AI naujovių era
„Deepseek“ pakilimas rodo seisminį AI geopolitinio kraštovaizdžio poslinkį. Nors Silicio slėnis diskutuoja apie savo išlaidų strategijas, Kinijos laboratorijos įrodo, kad išradingumas dažnai viršija infrastruktūrą. Technikos entuziastams ši konkurencija žada greitesnius proveržus, tačiau taip pat griežtesnės varžybos.
Neišmeskite AI tendencijų – prenumeratos, jei norite įžvalgų apie pasaulinius technologijų sutrikimus.