GPT-5.5 is er — maar het model is niet het verhaal
OpenAI presenteert een beter model. Wat het echt bouwt, is een platform waaruit je niet meer wegkomt.
Donderdag 23 april bracht OpenAI GPT-5.5 uit, zes weken na GPT-5.4. De benchmarks zijn beter: 82,7% op Terminal-Bench 2.0 tegenover 75,1% voor de vorige versie, 73,1% op Expert-SWE tegenover 68,5%. Co-founder Greg Brockman omschreef het als "a faster, sharper thinker for fewer tokens." Kortom: het model is goed. Maar het model is niet het nieuws.
Het echte verhaal speelt zich af op een ander niveau. GPT-5.5 verschijnt niet als losstaand product — het verschijnt als onderdeel van een strategie die OpenAI al maanden in de steigers zet en nu steeds nadrukkelijker benoemt. Codex, de desktop-app van OpenAI, kan inmiddels in de achtergrond alle apps op je Mac bedienen, meerdere agents parallel laten werken en taken inplannen voor uren of weken vooruit. Codex-lead Thibault Sottiaux was vorige week openhartig over de bedoeling: "We doen eigenlijk het slinkse ding waarbij we de super app in het openbaar bouwen en het vanuit Codex laten evolueren."
Slinkse ding. Dat is een opmerkelijke woordkeuze voor een openbare mediabriefing.
Tegelijk circuleert intern bij OpenAI een memo van chief revenue officer Denise Dresser, uitgelekt via The Verge. Daarin schrijft ze dat multi-product adoptie OpenAI "harder to replace" maakt, en dat het bedrijf moet ophouden te denken als een bedrijf met losse productlijnen. "We should think like a platform company with multiple entry points and one integrated enterprise offering." De boodschap is helder: het gaat niet om het beste model op de leaderboard, het gaat om een positie die moeilijk te verlaten is.
Voor de professional die AI serieus wil inzetten, is dit de relevante verschuiving. Ethan Mollick (Wharton), die vroeg toegang had tot GPT-5.5, biedt daarvoor een bruikbaar frame: denk niet in modellen, maar in modellen plus apps plus harnesses. Het zijn drie lagen die samen bepalen wat je kunt. En OpenAI maakt op alle drie stappen tegelijk. Mollick testte GPT-5.5 Pro op een 3D-havensimulatortaak die GPT-5.4 Pro in 33 minuten afrondde — GPT-5.5 Pro deed het in 20, en deed het beter. Uit vier prompts en een stapel oude onderzoeksdata rolde iets uit wat hij omschreef als het resultaat van een sterk tweedejaars PhD-project. De modellen worden beter. Maar de vraag is of je nog kunt kiezen voor een ander model als de app en de harness ook van OpenAI zijn.
The jagged frontier is still there. It is just much further out than it used to be.
Mollick is eerlijk dat er grenzen zijn: long-form fictie blijft vlak, hypothesen zijn soms oninteressant ook als de statistieken kloppen. De capaciteiten groeien, maar ongelijkmatig. Dat nuance verdwijnt echter snel in de commerciële logica die Dresser in haar memo schetst: platform, lock-in, enterprise. De keuze voor een tool wordt steeds meer een keuze voor een ecosysteem.
Wie nu kiest voor de Codex-werkplek met GPT-5.5, kiest tegelijk voor een brouwend OS-niveau-platform met eigen browser, eigen agentinfrastructuur en 90 plugins. Dat is niet verkeerd — het kan productief zijn. Maar het is iets anders dan een model uitproberen. OpenAI bouwt bewust naar een situatie waar het niet meer uitmaakt wie het beste model heeft, want de rest van de stapel maakt overstappen duur. De vraag is niet meer: welk model is het slimst? De vraag is: hoever wil jij in dit platform stappen, en wanneer wordt dat een keuze die je niet meer makkelijk terugdraait?
Deel dit artikel
Bekijk ook
De prijs van intelligentie: waarom de race naar de bodem voorbij is
Voor het eerst in de korte geschiedenis van de AI-boom worden modellen niet goedkoper, maar juist duurder. De implicaties voor professionals zijn groot.
Gated Intelligence: Het nieuwe kastenstelsel van AI
De nieuwste modellen van Anthropic, OpenAI en Google zijn te krachtig voor het gewone publiek. We betreden een tijdperk waarin je 'clearance' belangrijker is dan je abonnement.
Waarom AI op papier alles kan, maar in de praktijk struikelt
AI scoort inmiddels 100% op programmeertests, maar kan in de helft van de gevallen nog geen analoge klok aflezen. Welkom bij de ‘jagged frontier’.
Nieuwsbrieven
Krijg het laatste van VandaagAI.nl direct in je inbox