Lekörözte az amerikai mesterségesintelligencia-modelleket egy olcsó kínai verzió

Valóságos pánik tört ki a Szilícium-völgyben, miután egy kvázi ismeretlen kínai cég, a DeepSeek piacra dobott egy mesterségesintelligencia-modellt, amely felülmúlja a legjobb amerikai termékeket, ráadásul az amerikai megfelelőknél nagyságrendekkel olcsóbban és – a washingtoni exportkorlátozásoknak „köszönhetően” – jóval kevésbé fejlett chipekkel építették.

Tavalyi kampánya során a hivatalába visszatért amerikai elnök 100 milliárd dollárt ígért a mesterséges intelligenciával (MI) kapcsolatos infrastruktúra bővítésére, beiktatása másnapján viszont már jóval ambiciózusabb programot hirdetett meg. Azt mondta, 500 milliárd dollárt költhetnek az MI-hez kapcsolódó fejlesztésekre a következő négy évben.

Felülmúlja a legjobb amerikai termékeket | Fotók: Pexels

Jóformán Donald Trump bejelentésével egy időben jelent meg a DeepSeek kínai startup chatbotjának új verziója, amely alaposan feladta a leckét az amerikai riválisoknak.

Az egy éve alapított cég fejlesztése mindössze 5,6 millió dollárba került, miközben az olyan óriások, mint a ChatGPT-t 2022 novemberében elindító OpenAI, a Meta, a Google vagy a Microsoft máris milliárdokat költöttek saját rendszereik kifejlesztésére és működtetésére.

A DeepSeek R1 névre keresztelt modellje nagy port kavart az elmúlt napokban a nyugati médiában és pénzpiacokon. Hétfőn a világ 500 leggazdagabb embere több mint százmilliárd dollárt veszített, miután a DeepSeek hatása a főbb tőzsdeindexeken is megmutatkozott. A legnagyobb vesztesek persze azok a milliárdosok, akiknek vagyona az MI-hez kötődik: az Oracle, az NVidia vagy a Dell vezetői 10-20 milliárd dollárral lettek szegényebbek.

A nyugati konkurensek – köztük Sam Altman, az OpenAI vezetője – maguk is elismerik, hogy az olcsó kínai termék képes felvenni a versenyt a nagy amerikai technológiai vállalatok vezető modelljeivel, miközben nemcsak nagyságrendekkel kevesebbe került a megépítése, de a kínaiak lényegesen kevesebb és gyengébb számítógépes chipet használtak fel a fejlesztés során.

Az MI modellek rengeteg csúcstechnológiás processzort, a hétköznapi felhasználók által videókártyaként emlegetett úgynevezett grafikus feldolgozóegységet (GPU) használnak. A nyugati cégeknek nem okoz gondot ezeknek a beszerzése, viszont néhány éve az Egyesült Államok korlátozza a legfejlettebb chipek exportálását Kínába azzal a bevallott szándékkal, hogy megőrizze Amerika globális technológiai fölényét.

A tiltások arra kényszerítették a kínai kutatókat, hogy kreatívan bánjanak az interneten szabadon elérhető eszközök széles skálájával.

Általánosságban elmondható, hogy minél fejlettebb egy processzor, annál nagyobb a kapacitása, ami a nagy nyelvi modell (Large Language Modell, LLM) alapú mesterséges intelligencia rendszerek betanításakor elvileg előnyt jelent.

A Meta legújabb modelljének (Llama 3) betanításához 16 ezer darab H100 típusú NVidia-processzort használtak, és Mark Zuckerberg cége tavaly bejelentette, hogy az év vége előtt további 600 ezret kíván felhalmozni. Az Elon Musk által támogatott XAI százezer H100-zal működő adatközpontot épített Memphisben. Az OpenAI nem köti a nagyközönség orrára a saját GPU-készletének a méretét, de a The Economist szerint a legújabb processzorait maga Jensen Huang, az amerikai chipgyártó főnöke szállította át áprilisban az NVidia gyárából.

A DeepSeek mintegy kétezer darab H800-as processzort használt, ami az NVidia H100-asának kimondottan a kínai piac számára lebutított változata. Többek között abban különbözik az amerikai behemótok által használt chipektől, hogy az adatátvitel sebessége 600 Gigabit/másodperc helyett mindössze 300 GBps.

A DeepSeek modelljének teljesítménye kérdéseket vet fel az amerikai kormány exportkorlátozásainak nem kívánt következményeivel kapcsolatban, írja a New York Times. A tiltások arra kényszerítették a kínai kutatókat, hogy kreatívan bánjanak az interneten szabadon elérhető eszközök széles skálájával. Konkrétan a kínai fejlesztők olyan szoftveres megoldásokat kerestek, melyek tompítani tudják a hardverek hiányát. Olyan terméket hoztak létre, amely a legtöbb mutató - társalgás, logikai feladatok, programozás - tekintetében versenyképes alternatívája a nagy amerikai modelleknek. Az a tény pedig, hogy mindezt olcsón hozták létre, megkérdőjelezi a közkeletű nézetet, miszerint a legfejlettebb MI-rendszereket csakis a legnagyobb techipari vállalatok kifejleszteni. Utóbbiak amúgy kivétel nélkül az Egyesült Államokban székelnek.

16/9 vagy 1920x1080
CSAK SAJÁT

Kapcsolódók

Kimaradt?