Kinija pristatė savo daug triukšmo sukėlusi savo DI modelį

Kinijoje įsikūrusi dirbtinio intelekto bendrovė „DeepSeek“, išleidusi dirbtinio intelekto modelį, kuris konkuruoja su geriausiais JAV modeliais, tačiau buvo pagamintas už mažesnę kainą, sukėlė šoką Silicio slėnyje ir akcijų biržose. Nors ši žinia sukėlė technologijų sektoriaus akcijų išpardavimą ir paskatino rizikos kapitalo investuotoją Marcą Andreesseną rezultatus apibūdinti kaip „DI Sputniko momentą“ (Kinijos pažanga dirbtinio intelekto srityje, regis, nustebino didžiąją dalį technologijų pasaulio), šis atvirojo kodo dirbtinis intelektas nėra toks revoliucingas, kaip atrodo.

„DeepSeek“ modelio „R1“ rezultatai buvo palyginami su „OpenAI“ „o1“ modelio rezultatais keliuose matematikos ir programavimo lyginamuosiuose testuose, o jį apmokyti kainavo 20–50 kartų pigiau ir jis naudojo gerokai mažiau skaičiavimo galios. Pasak dirbtinio intelekto politikos tyrėjo Mileso Brundage'o, anksčiau dirbusio „OpenAI“, „R1“. kaip ir „OpenAI“ „o“ serija, yra vadinamasis ankstyvojo mąstymo modelis. Šios sistemos gali spręsti sudėtingesnes užduotis nei kiti didieji kalbos modeliai (angl. large language model, LLM), nes jos suskaido problemas į dalis ir kiekvieną dalį sprendžia atskirai. Tai taip pat reiškia, kad jos sunaudoja daugiau skaičiavimo galios ir energijos, todėl praktinis taikymas yra brangus. O tai, kad jis yra atvirojo kodo ir laisvai prieinamas, gali priversti JAV konkurentus sumažinti savo kainas.

Tačiau vis dar neaišku, kaip tiksliai „R1“ atsilieka nuo pirmaujančių JAV dirbtinio intelekto modelių. Bendrovė „DeepSeek“ gana skaidriai skelbia „R1“ rezultatus įvairiuose lyginamuosiuose testuose. Tuo tarpu mes nežinome, ar JAV technologijų bendrovės pasiekė dar įspūdingesnių rezultatų su kitomis pirmaujančiomis sistemomis – pavyzdžiui, su naujausiu „OpenAI“ modeliu „o3“ – jos juos laiko paslaptyje ir neskelbia. Be to, iki šiol išbandyti lyginamieji testai neatspindi visų galimų dirbtinio intelekto modelio galimybių.

„Žmonės per daug galvoja, kad tai yra ankstyvas naujos paradigmos žingsnis, o ne paradigmos pabaiga“, – sako M. Brundage'as.

Gali egzistuoti ir kiti „DeepSeek“ modelio apribojimai. Jis turi tam tikrų šališkumo požymių, kurie buvo įdiegti mokymų metu ir kuriais siekiama laikytis Kinijos vyriausybės apribojimų – pavyzdžiui, vengti diskusijų apie elgesį su uigūrų etnine mažuma ir laikytis Kinijos komunistų partijos linijos dėl Taivano politinio statuso.

„R1“ modelis gali teikti itin efektyvius rezultatus – nors buvo apmokytas naudojant mažesnę skaičiavimo galią nei panašūs modeliai – tačiau „DeepSeek“ vis tiek turėjo didelę skaičiavimo galią, kuri galėjo būti naudinga kuriant modelį, tinklaraštyje rašo Kalifornijoje įsikūrusio analitinio centro „RAND Corporation“ atstovas Lennartas Heimas ir Oksfordo universiteto atstovas Sihao Huangas.

Jie nurodo, kad „DeepSeek“ turi prieigą prie vieno didžiausių Azijoje dirbtinio intelekto lustų klasterių, taip pat prie Kinijos ir užsienio kompiuterinių išteklių, saugomų debesijoje, kuriai netaikoma JAV eksporto kontrolė, kuria siekta apriboti JAV lustų naudojimą Kinijoje. Tokie ištekliai tikriausiai padėjo „DeepSeek“ atrasti veiksmingesnius modelių metodus, nes pirmiausia buvo sukurti sintetiniai mokymo duomenys, o tada buvo galima atlikti daug bandymų ir klaidų eksperimentų.

Nepaisant JAV eksporto kontrolės, bendrovė taip pat turėjo prieigą prie naujausios kartos dirbtinio intelekto lustų. Naujausi eksporto apribojimai buvo įvesti 2023 m. spalį, todėl jie dar nepadarė pilno poveikio Kinijos dirbtinio intelekto kūrimo pastangoms, sako L. Heimas ir S. Huangas. Jie pažymi, kad „DeepSeek“ savo dirbtinio intelekto modelius mokė naudodama „NVIDIA H800“ lustus, kurie buvo sukurti siekiant apeiti senesnes ir ne tokias veiksmingas JAV eksporto kontrolės priemones.

„Kinijoje vis dar veikia duomenų centrai su dešimtimis tūkstančių lustų, o JAV įmonės stato duomenų centrus su šimtais tūkstančių lustų, – rašo tyrėjai. – Tikrasis išbandymas nutiks tada, kai šiuos duomenų centrus reikės atnaujinti arba išplėsti – procesas, kuris bus lengvesnis JAV įmonėms, bet sudėtingesnis Kinijos įmonėms, kurioms taikoma JAV eksporto kontrolė.“

Jei „DeepSeek“ neketina visiškai sugriauti JAV įsikūrusio dirbtinio intelekto pasaulio, kodėl ji kelia paniką JAV technologijų rinkai ir investuotojams? Ne tiek dėl to, kad ji visam laikui pakeitė dirbtinio intelekto lenktynes, bet ji neabejotinai sudrumstė nerealius šios pramonės šakos lūkesčius. Pastaraisiais metais susiformavo dirbtinio intelekto reklamos burbulas, dėl kurio technologijų bendrovių vertinimai buvo itin aukšti. Akcijų kainų pokytis gali atspindėti realesnį DI piniginės vertės įvertinimą.

Pirmasis „Sputniko“ momentas buvo tas, kai Sovietų Sąjunga nustebino JAV, įsibėgėdama ir paleisdama į kosmosą pirmąjį dirbtinį palydovą. Tačiau JAV iš tikrųjų buvo panašiame kosmoso technologijų srityje kaip ir sovietai, ir gerai žinojo apie sovietų pažangą.

Šis momentas gali būti panašus į Sputniko laikus: tai gali būti situacija, kai sensacinga istorija sukels pernelyg didelę visuomenės reakciją ir paskatins didesnes JAV išlaidas dirbtiniam intelektui, rašo „New Scientist“.

dirbtinis intelektas Kinija

Kinija pristatė savo daug triukšmo sukėlusi savo DI modelį – štai kodėl ir kiek tai svarbu

Rekomenduojame

Po Lietuvą važinėjantis V. Gapšys nustebino vilnietį: paaiškino, kodėl sąlygos kitokios nei E. Masiuliui ir R. Kurlianskiui (9)

Konservatorių lyderio rinkimų renginyje – ir Monika Navickienė: pasirodžiusi užminė mįslę (10)

Seimo nariams – išbandymas: ant stalo atsidūrė į juos nukreiptas planas (8)

Nuošaliame vienkiemyje – stulbinanti afera: pilstuko mėgėjai nardė langų ploviklio jūroje Atsukam laiką