
Vincent Ginis published this article together with Christophe Benoit and Jeroen Baert in De Morgen.
De artificieel intelligente chatbot van de Chinese start-up DeepSeek evenaart de resultaten van zijn concurrenten voor een fractie van de prijs. Chipsmaker Nvidia krijgt klappen op de beurs en Amerikaanse techbazen maken zich zorgen. Maar is dit echt het spoetnikmoment voor AI?
Computerwetenschapper Jeroen Baert: ‘Er zal veel met modder gegooid worden’
“Heel lang leefde het idee dat AI enkel beter kon worden door meer in data en rekenkracht te investeren. China was op dat vlak beperkt omdat het land niet de nieuwste en krachtigste chips van Nvidia kon gebruiken. Toch lijkt het gratis R1-model van DeepSeek (dat eerder deze maand gelanceerd werd, PN) op verschillende benchmarks even goed of beter dan Amerikaanse concurrenten te scoren.
“De hele industrie dacht dat we nog jarenlang enorme hoeveelheden chips bij Nvidia moesten blijven kopen om competitief te blijven, maar nu worden ze ingehaald door een bedrijf dat beweert niet zoveel rekenkracht te gebruiken en toch evenveel doet. In de week waarin Donald Trump aankondigde dat via Starlink 500 miljard in AI-infrastructuur geïnvesteerd wordt, is dat toch pijnlijk.
“Er is toch wel ongerustheid over DeepSeek in de sector omdat zelfs OpenAI als grootste AI-bedrijf ter wereld gigantische verliezen draait. Zij kunnen zelfs hun duurste abonnement niet verkopen zonder zelf geld bij te passen. Microsoft heeft nu AI in de Office-pakketten gestopt en vraagt daar enkele dollars meer voor, maar de vraag is of mensen daarop zitten te wachten.
“Investeerders zullen ook twee keer nadenken waar ze hun geld nog insteken. Er kan meer dan één pad richting de state of the art zijn, misschien volstaat oudere of andere hardware dan waar Nvidia mee komt. Vroeger was OpenAI de koploper, maar nu zitten alle bedrijven ongeveer op hetzelfde niveau. Er is bij die grote spelers nog weinig ruimte om te differentiëren.
“Het is koffiedik kijken hoe de Amerikaanse concurrenten van DeepSeek zullen reageren. Er zal wel veel met modder gegooid worden nu er een extra deelnemer in de race is. Zeker de Chinese afkomst zal worden aangevallen en er komen vast vragen over het privacyvraagstuk. Daarnaast is er ophef omdat DeepSeek getraind zou zijn met output van andere AI-modellen, maar dat is moeilijk te bewijzen. Bovendien zijn concurrenten zelf ook in rechtszaken rond copyright verwikkeld.”
Professor artificiële intelligentie Vincent Ginis (VUB/Harvard University): ‘Beleggers gaan te kort door de bocht’
“DeepSeeks taalmodel V3 staat al sinds november op onze radar. Als het nog geen spoetnikmoment was door de technologie, dan werd het dat wel door alle aandacht die errond ontstaan is. Het bedrijf haalt met minder parameters een efficiëntie die vergelijkbaar is met de state-of-the-artmodellen van Google of OpenAI, maar op vlak van architectuur is er eigenlijk niets nieuws. Het is een efficiëntere variant van wat we hadden en waarvan we al wisten dat het niet geoptimaliseerd was.
“Het Chinese bedrijf toont dat er minder computerhardware nodig is om een taalmodel te trainen. Dat is fijn nieuws, al is er in de technische paper ook wel wat gefoefeld. Sommige parameters worden wel meegerekend, andere niet. Er was dus een slimme boekhouder aan de slag om bij die hallucinant goede cijfers uit te komen. Voor mij is dit alleszins minder schokkend dan toen de o3-modellen van OpenAI op volle capaciteit 87 procent scoorden op de ARC-AGI-benchmark (test voor de redeneringsvaardigheden van AI, PN).
“De beurzen reageren nu heftig omdat er de laatste achttien maanden een grote wedloop naar de chips van Nvidia aan de gang was. Voor iedere nieuwe versie van ChatGPT heb je bijvoorbeeld een veelvoud van het bestaande aantal chips nodig. Beleggers zijn nu nerveus omdat DeepSeek het met minder rekenkracht kan, maar ik denk dat ze te kort door de bocht gaan. Door de exponentiële groei wordt die kloof snel ingehaald. Als je ziet welke nieuwe generaties er nog aankomen, zullen er namelijk nog heel veel chips nodig zijn.
“DeepSeek toont dat je China bij de ontwikkeling van AI niet uit het oog mag verliezen, al wacht ik toch meer op welke nieuwe functionaliteiten of doorbraken er nog aankomen.”
AI-expert Christophe Benoit: ‘Schept mogelijkheden voor Europa’
“Het indrukwekkendste aan het model van DeepSeek is dat het elke prompt analyseert en nagaat wie die het best kan oplossen. Het gebruikt niet telkens het volledige systeem. Die zogenaamde mixture of experts zorgt voor een lagere rekenkracht. ChatGPT doet dat ondertussen ook al even door bij elke prompt na te gaan of er generatieve AI nodig is dan wel of een antwoord online opgezocht kan worden. Maar als het klopt wat DeepSeek in zijn technische paper beweert, is er sprake van een echte paradigmashift. Alsof de Chinezen op Mars geland zijn.
“DeepSeek kon zijn taalmodel trainen voor iets minder dan zes miljoen dollar, dat is een peulschil als je weet dat de ontwikkeling van GPT-4 volgens OpenAI-topman Sam Altman 100 miljoen dollar kostte. Belangrijk is dat ze voor hun technologie ook veel minder energie nodig hebben, terwijl Microsoft een kerncentrale op gang trok om in de AI-race te kunnen stappen. Het voelt toch alsof concurrenten op zoek waren naar manieren om hun paarden te verbeteren, terwijl DeepSeek een auto uitvond.
“Het model van de Chinese speler is open source. Iedereen kan de code downloaden en er verder aan bouwen. Dat schept voor Europa en andere regio’s ook mogelijkheden om met beperkte middelen toch een systeem uit te bouwen. In een handelsoorlog met de Verenigde Staten is het voor China ook handig om te kunnen zeggen dat het de duurste Nvidia-chips niet nodig heeft.
“Er is wel nog veel onduidelijkheid en het moet nog blijken of DeepSeek kan wat het belooft. Je moet altijd achterdochtig zijn als zoiets uit Chinese hoek komt. Maar als het werkt, is dit voor de hele wereld positief nieuws. Al betekent dat wel dat er mensen zijn die miljarden in AI-onderzoek investeerden dat de verkeerde kant uit ging. Hun geld krijgen ze niet meer terug.”