GPT-5.5 is er — maar het model is niet het verhaal

Donderdag 23 april bracht OpenAI GPT-5.5 uit, zes weken na GPT-5.4. De benchmarks zijn beter: 82,7% op Terminal-Bench 2.0 tegenover 75,1% voor de vorige versie, 73,1% op Expert-SWE tegenover 68,5%. Co-founder Greg Brockman omschreef het als "a faster, sharper thinker for fewer tokens." Kortom: het model is goed. Maar het model is niet het nieuws.

Het echte verhaal speelt zich af op een ander niveau. GPT-5.5 verschijnt niet als losstaand product — het verschijnt als onderdeel van een strategie die OpenAI al maanden in de steigers zet en nu steeds nadrukkelijker benoemt. Codex, de desktop-app van OpenAI, kan inmiddels in de achtergrond alle apps op je Mac bedienen, meerdere agents parallel laten werken en taken inplannen voor uren of weken vooruit. Codex-lead Thibault Sottiaux was vorige week openhartig over de bedoeling: "We doen eigenlijk het slinkse ding waarbij we de super app in het openbaar bouwen en het vanuit Codex laten evolueren."

Slinkse ding. Dat is een opmerkelijke woordkeuze voor een openbare mediabriefing.

Tegelijk circuleert intern bij OpenAI een memo van chief revenue officer Denise Dresser, uitgelekt via The Verge. Daarin schrijft ze dat multi-product adoptie OpenAI "harder to replace" maakt, en dat het bedrijf moet ophouden te denken als een bedrijf met losse productlijnen. "We should think like a platform company with multiple entry points and one integrated enterprise offering." De boodschap is helder: het gaat niet om het beste model op de leaderboard, het gaat om een positie die moeilijk te verlaten is.

Voor de professional die AI serieus wil inzetten, is dit de relevante verschuiving. Ethan Mollick (Wharton), die vroeg toegang had tot GPT-5.5, biedt daarvoor een bruikbaar frame: denk niet in modellen, maar in modellen plus apps plus harnesses. Het zijn drie lagen die samen bepalen wat je kunt. En OpenAI maakt op alle drie stappen tegelijk. Mollick testte GPT-5.5 Pro op een 3D-havensimulatortaak die GPT-5.4 Pro in 33 minuten afrondde — GPT-5.5 Pro deed het in 20, en deed het beter. Uit vier prompts en een stapel oude onderzoeksdata rolde iets uit wat hij omschreef als het resultaat van een sterk tweedejaars PhD-project. De modellen worden beter. Maar de vraag is of je nog kunt kiezen voor een ander model als de app en de harness ook van OpenAI zijn.

The jagged frontier is still there. It is just much further out than it used to be.

Ethan Mollick, One Useful Thing

Mollick is eerlijk dat er grenzen zijn: long-form fictie blijft vlak, hypothesen zijn soms oninteressant ook als de statistieken kloppen. De capaciteiten groeien, maar ongelijkmatig. Dat nuance verdwijnt echter snel in de commerciële logica die Dresser in haar memo schetst: platform, lock-in, enterprise. De keuze voor een tool wordt steeds meer een keuze voor een ecosysteem.

Wie nu kiest voor de Codex-werkplek met GPT-5.5, kiest tegelijk voor een brouwend OS-niveau-platform met eigen browser, eigen agentinfrastructuur en 90 plugins. Dat is niet verkeerd — het kan productief zijn. Maar het is iets anders dan een model uitproberen. OpenAI bouwt bewust naar een situatie waar het niet meer uitmaakt wie het beste model heeft, want de rest van de stapel maakt overstappen duur. De vraag is niet meer: welk model is het slimst? De vraag is: hoever wil jij in dit platform stappen, en wanneer wordt dat een keuze die je niet meer makkelijk terugdraait?

GPT-5.5 is er — maar het model is niet het verhaal

Bekijk ook

De prijs van intelligentie: waarom de race naar de bodem voorbij is

Gated Intelligence: Het nieuwe kastenstelsel van AI

Waarom AI op papier alles kan, maar in de praktijk struikelt

Nieuwsbrieven