GPT-5
We hadden onze vorige blogpost over het open-weights model van OpenAI nog niet af, en OpenAI kondigde de release aan van het langverwachte GPT-5. Zoals gewoonlijk gingen we er direct mee aan de slag.
Fact sheet
Hier wat korte feitjes over dit model.
- Closed weights
- 3 varianten: GPT-5, GPT-5 mini en GPT-5 nano
- 400k context window
- Het is een reasoning-model
- Goed in tool use
- Multimodal - ondersteunt tekst en afbeeldingen als input (geen audio)
- Goed in coderen
- Goed in agentic taken
- Mixture of experts
Reasoning effort en verbosity
Net als met gpt-oss is het mogelijk om de reasoning effort in te stellen. Dit configureert hoelang een model redeneert voordat deze een antwoord produceert. De beschikbare waardes hier zijn minimal, low, medium en high. Hoe hoger de waarde, hoe hoger de kwaliteit van het antwoord, maar ook hoe langer het duurt en hoe duurder het is.
Daarnaast is er ook de verbosity-instelling, waarmee je kunt aanpassen hoe beknopt (of juist niet) de uiteindelijk reactie van GPT-5 is. Hier zijn de beschikbare waardes low, medium en high.

Aantal parameters
Normaal gesproken bespreken we bij deze blogposts het aantal parameters van een model. Echter zijn alle GPT-5-modellen closed-weights modellen en heeft OpenAI de informatie over de grootte van de modellen ook niet openbaar gemaakt. Onderzoekers die schattingen hebben gemaakt, denken dat het model tussen de 3 en 5 biljoen parameters heeft. Dit zijn dus waarschijnlijk gigantisch grote modellen.
Afbeeldingen omschrijven
GPT-5 is multimodal - het is in staat om afbeeldingen te begrijpen. Hieronder geven we het model drie afbeeldingen met de vraag om deze te omschrijven. We hebben hierbij een Nederlandse en een Engelse variant laten genereren. We vergelijken het met de output die we in het verleden kregen van GPT-4o.
GPT-5: Afbeeldingen omschrijven

Een felgele rubberen eend drijft in een klein, lichtblauw opblaasbadje met helder water. Het zonlicht laat het water fonkelen en op de achtergrond is wat groen gras te zien.
A bright yellow rubber duck with an orange beak is floating in a small inflatable kiddie pool. The pool is filled with clear blue water that shows sunlit ripples, and it has a white-and-blue ringed edge. Green grass is visible around the pool in the background.
De afbeelding toont een opblaasbaar kinderzwembad met helder blauw water. In het water drijft een gele rubberen eend met een oranje snavel. De achtergrond is grasgroen.
The image shows a bright yellow rubber duck floating in a small inflatable pool filled with water. The pool has a light blue rim, and the water appears clear, with reflections visible on its surface. The setting is outdoors, with green grass surrounding the pool. The duck has an orange beak and a cheerful appearance.

Op de foto staan twee mannen ontspannen op een brug over een gracht in een Nederlandse stad. Ze leunen tegen een groen metalen hekwerk en kijken lachend in de camera. De man links draagt een grijze polo en spijkerbroek; de man rechts een wit, lichtgeprint overhemd met jeans en bruine schoenen. Achter hen loopt de gracht door met aangemeerde bootjes, geparkeerde auto’s langs de kade en statige, historische panden tussen veel groen. De achtergrond is licht onscherp, waardoor de twee personen duidelijk op de voorgrond staan. Het lijkt een bewolkte, maar heldere dag.
- Two adult men are standing on a small green metal bridge over a calm canal.
- Both are smiling and dressed casually in jeans; one wears a light gray polo, the other a white patterned button‑down shirt with a brown belt.
- Behind them are leafy trees, parked cars, and historic-looking buildings lining the canal.
- A couple of small boats are moored along the water.
- The scene is bright but overcast, giving soft, even light and reflections on the water.
Op de afbeelding staan twee mensen op een brug bij een gracht. Op de achtergrond zijn bomen, geparkeerde auto's en historische gebouwen te zien. Beide personen dragen casual kleding en kijken vriendelijk naar de camera. Het ziet er uit als een typisch Nederlands grachtenpand met een gezellige sfeer.
The image features two men standing on a bridge over a canal. They're casually dressed, one in a gray polo shirt and jeans, and the other in a white patterned shirt and jeans. They are smiling and posing for the photo. In the background, there are trees, parked cars, and canal boats along the waterway, suggesting a picturesque, urban setting with a relaxed atmosphere.

Een speelse, vintage-achtige illustratie. Op de voorgrond drijft een geelbruine onderzeeër in de vorm van een eend, met drie ronde patrijspoorten en een hendel bovenop. Het water is donker en golvend. Op de achtergrond barst een grote vulkaan uit: roodgloeiende lavastromen lopen langs de flanken naar beneden, terwijl een dikke rookwolk opstijgt. In de lucht dwarrelen witte stippen, alsof sneeuw of as valt, wat een grappig contrast vormt met het cartooneske eend-onderzeeërtje.
A whimsical illustration shows a duck-shaped yellow submarine bobbing on choppy blue water. It has three round portholes, a periscope-like knob on top, and a greenish head with an orange bill. In the background, a large volcano erupts, sending dark smoke and bright red lava streams down its sides. White dots drift across the scene like falling ash or snow. The art has a vintage, textured print style with muted colors, blending playful imagery with a dramatic natural event.
De afbeelding toont een cartoonachtige scène met een eendvormige onderzeeër die op het water drijft. Op de achtergrond is een vulkaan te zien die uitbarst, met lava die langs de zijkanten stroomt en een rookwolk die opstijgt. Het geheel heeft een fantasie-achtige uitstraling, met een retro-stijl in het kleurgebruik en de illustratietechniek. Er zijn ook sneeuwvlokken die de lucht vullen, wat een surrealistisch effect geeft.
The image depicts a whimsical scene of a duck-shaped submarine floating on water. In the background, a volcano is actively erupting, spewing red lava and smoke into the sky. Snowfall is depicted with white dots scattered across the scene, adding a surreal contrast to the fiery eruption. The artwork combines elements of fantasy and nature in a stylized, artistic manner.
Ik moet eerlijk zeggen dat ik niet echt het idee krijg dat GPT-5 enorm veel beter is. Er zitten wel verschillen in de omschrijvingen, en GPT-5 lijkt soms wel iets betere output te leveren, maar dit zou net zo goed statistische ruis kunnen zijn. Beide modellen zijn gewoon erg competent in het omschrijven van afbeeldingen.
Wel is dit een goed moment om vanaf nu GPT-4 te vervangen voor deze taak door GPT-5, en deze als baseline te gaan gebruiken. In toekomstige blogposts zullen we dus vanaf nu gaan vergelijken met de resultaten van GPT-5.
Tekstherkenning in afbeeldingen
De eerdere GPT-modellen zijn altijd vrij sterk geweest in het extraheren van tekst uit afbeeldingen. Ook voor mijn eigen
hobbyprojecten zijn dit vaak de modellen die ik voor deze taken gebruik. Ik heb lange tijd gpt-4o-2024-08-06
hiervoor ingezet
en was enkele maanden geleden overgestapt naar gpt-4.1-mini-2025-04-14
, beide naar grote tevredenheid.
Hoe doet GPT-5 het op dit vlak?
GPT-5: Tekstherkenning in afbeeldingen

SNELLER EENVOUDIGER SLIMMER
Met klantportalen en strategische automatisering helpen wij bedrijven met het behalen van hun doelen.

"LAAT HET HIER, DAN LEES IK HET EN VERTEL JE LATER WEL OF IK HET KOOP."
On the book cover: "Alleen op een eiland"

klant
VC
upload:
- documenten
- opnamen van vergaderingen
- feedback op resultaten
meerdere iteraties
ontvangt:
- rapportages
- overzichten
- adviezen

Het eindejaar ziet er weer veelbelovend uit voor de PC bezitters, of ik zou misschien beter zeggen ‘Pentium 150 bezitters’. Begin september hebben we een bezoekje gebracht aan de ECTS show in Londen, een van de grootste vakbeurzen voor de computergames industrie. Alle nieuwe games die pas binnen ettelijke maanden op de markt komen, staan op ECTS reeds in demo te draaien: Outlaws, X-wing vs Tie Fighter, Monkey island 3, Falcon 4, Tomb Raider, Diablo, C&C Red Alert, Privateer the Darkning, Theme Hospital, Master of Orion 2, noem maar op...
Wat vooral onze aandacht trok was Tomb Raider, dit nieuwe 3D actiespel werd gedemonstreerd op van die nieuwe 3D accelerator kaarten voor de PC. Ik bezweer je, de snelheid en de kwaliteit van de graphics die we daar te zien kregen, dat hou je gewoon niet voor mogelijk. Op onze cover cd-rom van deze maand staat een rolling demo van Tomb Raider. Deze werkt echter enkel in gewone VGA mode, je moet je even voorstellen dat dit spel aan dezelfde snelheid in svga (met 64.000 kleuren) draait... Alvast even om naar uit te kijken.
Het tweede spel dat onze kin bijna tot op de grond deed openvallen was Falcon 4.0. Het spel wordt pas ergens half volgend jaar verwacht, maar vlak voor onze neus stond een medewerker van Spectrum Holobyte rondjes te vliegen boven een adembenemend landschap (te vergelijken met Flight Unlimited, maar nog véél beter!). “Wilt u het misschien ook eens proberen”, vroeg de vriendelijke man mij. Zo’n vraag laat ik mij natuurlijk geen tweede maal stellen en dus nam ik de stuurpook van hem over. Ik kan u nu dan ook met enige trots melden dat ik waarschijnlijk de eerste Europeaan ben die de F16 van Falcon 4.0 verticaal de grond heeft ingeboord. Onder het mom dat er ‘een vuiltje’ in mijn oog zat, verdween ik met een rood aangelopen hoofd van de Microprose stand.
Een interessante nieuwe dat ook vlot circuleerde, was de aankondiging van een nieuwe Pentium chip van Intel, met als codenaam MMX. Deze nieuwe Pentium chip bevat naast een gewone co-processor ook nog eens een co-processor voor graphics (hij is ook op andere vlakken bruikbaar). Gamers zouden hiermee een grote afname van de functies van deze speciale co-processor moeten aanschouwen, vooral in renderlagen en videobewerking.

Het eindejaar ziet er weer veelbelovend uit voor de PC bezitters, of ik zou misschien beter zeggen ‘Pentium 150 bezitters’. Begin september hebben we een bezoekje gebracht aan de ECTS show in Londen, een van de grootste vakbeurzen voor de computergames industrie. Alle nieuwe games die pas binnen ettelijke maanden op de markt komen, staan op ECTS reeds in demo te draaien: Outlaws, X-wing vs Tie Fighter, Monkey island 3, Falcon 4, Tomb Raider, Diablo, C&C Red Alert, Privateer the Darkning, Theme Hospital, Master of Orion 2, noem maar op...
Wat vooral onze aandacht trok was Tomb Raider, dit nieuwe 3D actiespel werd gedemonstreerd op een van de nieuwe 3D accelerator kaarten voor de PC. Ik bezweer je, de snelheid en de kwaliteit van de graphics die we daar te zien kregen, dat hou je gewoon niet voor mogelijk. Op onze cover cd-rom van deze maand staat een rolling demo van Tomb Raider. Deze werkt echter enkel in gewone VGA mode, je moet je even voorstellen dat dit spel aan dezelfde snelheid in svga (met 64.000 kleuren) draait... Alvast eentje om naar uit te kijken.
Het tweede spel dat onze kin bijna tot op de grond deed openvallen was Falcon 4.0. Het spel wordt pas ergens half volgend jaar verwacht, maar vlak voor onze neus stond een medewerker van Spectrum Holobyte rondjes te vliegen boven een adembenemend landschap (te vergelijken met Flight Unlimited, maar nog véél beter)! “Wilt u het misschien ook eens proberen”, vroeg de vriendelijke man mij. Zo’n vraag laat ik mij natuurlijk geen tweede maal stellen en meteen nam ik de stuurpook van hem over. Ik kan u nu dan ook met enige trots melden dat ik waarschijnlijk de eerste Europeaan ben geweest die de F16 van Falcon 4.0 verticaal de grond heeft ingeboord. Onder het mom dat er ‘een vuiltje’ in mijn oog zat, verdween ik met een rood aangelopen hoofd van de Microprose stand.
Een interessant nieuwtje dat ook vlot circuleerde, was de aankondiging van een nieuwe Pentium chip van Intel, met als codenaam MMX. Deze nieuwe Pentium chip bevat naast een gewone co-processor ook nog eens een co-processor voor graphics (hij is ook nog voor andere zaken bruikbaar). Games die gebruik zouden maken van de functies van deze speciale co-processor zouden een snelheidswinst kunnen realiseren.
Afbeelding 3 was natuurlijk de grote test - het handschrift van Casper. Menig dokter schijnt er jaloers op te zijn. Een handschrift zo intens dat archeologen over duizenden jaren zich zullen afvragen of het een buitenaards schrift was.
Hoe deed GPT-5 het? Volgens mij verrassend goed. De experts hier op kantoor hebben geverifieerd dat het inderdaad overeenkomt met de oorspronkelijke inhoud van de tekst. Ongelofelijk. Ik geloof ze op hun woord.

Maar, geloof het of niet, er is een test in mijn 'dataset' die nog moeilijker is dan het handschrift van Casper; namelijk de afbeelding die bij tab 4 en 5 gebruikt is. Deze foto van tekst in een tijdschrift gaf in het verleden bij oudere OpenAI-modellen, zoals GPT-4, veel problemen en veroorzaakte ook veel hallucinaties. Let op: ik vroeg hier specifiek om alleen de tekst die in het gele vak stond te extraheren.
Ik was dus erg benieuwd hoe GPT-5 met deze afbeelding om zou gaan.
En het resultaat? Ook GPT-5 hallucineert hierbij! Ik kan me voorstellen dat je weinig zin hebt om de hele tekst te moeten lezen en vergelijken, maar het is al voldoende om naar de laatste zin van het gele vlak te kijken. Hier verandert hij woorden zoals 'nieuwtje' naar 'nieuwe' en 'Games' naar 'Gamers'. Maar het wordt nog veel erger - hij begint delen van zinnen te veranderen, en op het einde hallucineert hij zelfs een totaal nieuwe zin erbij!
Dus ook GPT-5 was niet in staat om deze afbeelding te verwerken. Dat is jammer, dacht ik. Maar, wacht: we kunnen ook nog de thinking mode proberen! En die produceerde, na anderhalve minuut denken, een perfecte transcriptie. Heel indrukwekkend! Dit is de transcriptie die in tab 5 staat.
Vertalingen
Uit de MMLU-benchmarks blijkt dat GPT-5 een fractie beter is dan GPT-4. Maar op zich is dat niet gek - want GPT-4 was al behoorlijk goed. De thinking mode van GPT-5 presteert vergelijkbaar met het oude O3-high. Het o3-high-model was erg berucht vanwege de hoge kosten van het draaien van dit model, dus ook dit is een indrukwekkend resultaat.
Maar hoe doen ze het wanneer ze geconfronteerd worden met Aquamentus, onze balkendraak? Ik verwacht zelf geen verrassingen, maar zoals altijd zie hieronder onze vertaalkaarten:
Originele tekst
Ik heb honger! De zon schijnt. Ik loop met de hond naar de winkel. Daar koop ik brood en melk.

Vertaling
Vertaling (na reflectie)
Originele tekst
Toen zijn favoriete voetbalclub verloor, liep hij met de ziel onder de arm alsof hij zelf op het veld had gestaan. Maar zijn mentor probeert hem aan te moedigen, door te zeggen: 'Tut tut! De bal is rond!'

Vertaling
Vertaling (na reflectie)
Originele tekst
In order to obtain the Triforce, you’ll have to defeat Aquamentus, a very strong enemy. He shoots beams in three directions.

Vertaling
Vertaling (na reflectie)
Zoals verwacht - geen verrassingen, gewoon een competente vertaling. Bij de vertalingen van de andere (non-gpt-5-)modellen heb ik voor het gemak dezelfde resultaten hergebruikt als die we ook gebruikten bij het vorige artikel over gpt-oss. Normaal gesproken genereren we alle resultaten opnieuw, maar dat leek nu niet echt nodig, ook omdat er geen andere nieuwe modellen in ons lijstje erbij zijn gekomen.
Coderen
De status quo van de beste taalmodellen voor programmeren is al hele lange tijd hetzelfde: dit zijn de Claude-modellen, van Anthropic. Alhoewel de meningen vaak nog verschillen lijkt het beste model nu Claude Opus 4.1 te zijn, maar het zou ook Claude Sonnet 4 kunnen zijn.
Maar, daar komt nu voor het eerst verandering in, nu GPT-5 er is. De GPT-5-modellen lijken bijzonder sterk te zijn op het vlak van coderen, en de enorme kloof die al deze tijd bestond tussen OpenAI en Claude lijkt nu eindelijk overbrugd te zijn. Welk model is nu beter? Het antwoord is complex: beide modellen zijn namelijk erg sterk, maar blijken uit te blinken op iets andere vlakken. Claude (Sonnet) is bijvoorbeeld vaak wat sneller te zijn met refactors, en wat bondiger, terwijl GPT-5 soms wat sterker is op het vlak van logica die verspreid is over meerdere bestanden.
Maar tot zover lijkt het om het even: er is voorlopig geen duidelijke winnaar. Dat klinkt misschien als een anti-climax, maar ik denk dat Anthropic zich misschien nu wel zorgen moet gaan maken. Want de GPT-5-modellen zijn ook nog eens goedkoper.
Disclaimer
Bij deze artikelen laat ik het uitgelichte model altijd zelf de laatste zin van de disclaimer (bovenaan ieder artikel) bedenken. Het gpt-oss model presteerde hier erg teleurstellend - GPT-5 produceerde wel betere zinnen, soms zelfs bruikbare zinnen, maar er zat niks indrukwekkends of echt leuks tussen. En ze voelden vaak ook heel erg aan als nonsens, maar dat kan komen omdat ik prompt niet voorzie van voldoende context.
Enkele voorbeelden:
- Onze stand-ups worden niet korter, maar dankzij GPT-5 zijn de demo’s ineens véél spectaculairder.
- Met GPT-5 wordt “even googelen” officieel passé.
- GPT-5 praat sneller, slimmer en soms beter dan je schoonmoeder.
Nou... laat het mijn schoonmoeder maar niet horen.

Waar zijn de andere modellen gebleven!?
Toen ik mijn chat-interface opende viel mij meteen iets op: ik kon alleen nog maar GPT-5-modellen selecteren!
Voorheen stonden er allerlei modellen, zoals 4o, 4o-mini, o3, etc. OpenAI heeft ervoor gekozen om ze allemaal te vervangen door GPT-5. In de benchmarks is terug te zien dat GPT-5-modellen inderdaad sterker zijn, dus technisch is dat heel goed te verantwoorden. Maar sterker nog: ik denk dat het een hele slimme zet was van OpenAI om dit te doen. Want het was inmiddels een meme geworden op het internet, hoe onduidelijk de OpenAI namen waren. Het was vaak niet duidelijk dat het o3-model veel sterker was dan het 4o-model, en wat werd er bijvoorbeeld bedoeld met de mini-modellen? En gpt-4.5 was weer een totaal ander model dan gpt-4, en niet als vervanger of opvolger bedoeld.
Kortom: het was een onduidelijke zooi. Ik denk dat alleen Microsoft slechter is in het bedenken van namen (voor hun Xbox-consoles).
Maar met deze zet hebben ze alles in één klap duidelijk gemaakt: je hebt GPT-5, GPT-5 Thinking en GPT-5 Pro. Het is direct duidelijk. Ook in de API is het vrij duidelijk (al hebben we daar gelukkig voorlopig nog wel toegang tot de oudere modellen). De keuze daar is GPT-5, GPT-5 Chat, GPT-5 mini en GPT-5 nano.
Conclusie
GPT-5 is een aardige stap voorwaarts. Het is een zeer competent, krachtig en betaalbaar model, dat erg goed is in het volgen van instructies.
Er zijn ook nadelen. Het model lijkt meer robotachtige antwoorden te geven, mogelijk omdat OpenAI het model nog veiliger heeft geprobeerd te maken. Ook weet het nog regelmatig te hallucineren. Het is duidelijk dat we er nog niet zijn.
Maar het is wel een stuk indrukwekkender dan de toch een beetje tegenvallende en teleurstellende release van gpt-oss. Het is jammer dat dat model niet van deze kwaliteit was. Ergens vraag ik me ook af of de timing van de release van GPT-5 misschien wel was om de teleurstelling van het open-weights model van OpenAI te overstemmen.
Ik ga in ieder geval in mijn hobbyprojecten wel alvast upgraden naar dit model, en de programmeercapaciteiten van dit model uitproberen.
