Disclaimer: Welkom bij onze TechBlog!
Dit is een artikel in ons TechBlog. Ons Techblog bevat artikelen, geschreven door onze developers, over dingen die ze zijn tegengekomen tijdens hun werkzaamheden. Deze artikelen gaan (meestal) over een technisch onderwerp, en zijn met name bedoeld om te vermaken en (soms) te informeren. GPT-5 is er, dus wij doen wat elke developer doet: eerst bloggen, dan pas de docs lezen.

zaterdag 9 augustus 2025
Auteur: Jeroen Mimpen
Tekstredacteur: Mark Coenradie

Model Uitgelicht - GPT-5

OpenAI GPT-5 LLM AI Model Review Taalmodellen Redeneermodellen AI Vertaling Multimodaal Code Generatie Tekstherkenning Model Testen API Closed Source Tool Use

GPT-5

Jeroen

Hallo. Wie ben jij?

GPT-5

Hallo! Ik ben ChatGPT, jouw digitale gesprekspartner — een soort wandelende encyclopedie met een vleugje humor en geduld.
Ik kan je helpen met uitleg, ideeën, vertalingen, verhalen, berekeningen, of gewoon een goed gesprek.

En jij, wie ben jij?

Jeroen

Ik ga een blogartikel schrijven over jou. Wat vind je daarvan?

GPT-5

Klinkt leuk! 🎉
Een blogartikel over mij is een beetje alsof je een portret schildert van iemand die uit woorden bestaat — ik ben benieuwd welke kanten je gaat belichten.

Ik kan je helpen met:

Achtergrondinformatie over hoe ik werk (zonder al te technisch te worden, tenzij je dat wilt).
Leuke anekdotes of voorbeelden van gesprekken.
Mogelijke invalshoeken voor je artikel (informatief, kritisch, humoristisch, filosofisch…).
Q&A-stijl content, alsof je mij hebt geïnterviewd.

Wil je dat je blog meer persoonlijk en verhalend wordt, of juist informatief en feitelijk?

GPT-5

We hadden onze vorige blogpost over het open-weights model van OpenAI nog niet af, en OpenAI kondigde de release aan van het langverwachte GPT-5. Zoals gewoonlijk gingen we er direct mee aan de slag.

Fact sheet

Hier wat korte feitjes over dit model.

Closed weights
3 varianten: GPT-5, GPT-5 mini en GPT-5 nano
400k context window
Het is een reasoning-model
Goed in tool use
Multimodal - ondersteunt tekst en afbeeldingen als input (geen audio)
Goed in coderen
Goed in agentic taken
Mixture of experts

Reasoning effort en verbosity

Net als met gpt-oss is het mogelijk om de reasoning effort in te stellen. Dit configureert hoelang een model redeneert voordat deze een antwoord produceert. De beschikbare waardes hier zijn minimal, low, medium en high. Hoe hoger de waarde, hoe hoger de kwaliteit van het antwoord, maar ook hoe langer het duurt en hoe duurder het is.

Daarnaast is er ook de verbosity-instelling, waarmee je kunt aanpassen hoe beknopt (of juist niet) de uiteindelijk reactie van GPT-5 is. Hier zijn de beschikbare waardes low, medium en high.

Aantal parameters

Normaal gesproken bespreken we bij deze blogposts het aantal parameters van een model. Echter zijn alle GPT-5-modellen closed-weights modellen en heeft OpenAI de informatie over de grootte van de modellen ook niet openbaar gemaakt. Onderzoekers die schattingen hebben gemaakt, denken dat het model tussen de 3 en 5 biljoen parameters heeft. Dit zijn dus waarschijnlijk gigantisch grote modellen.

Afbeeldingen omschrijven

GPT-5 is multimodal - het is in staat om afbeeldingen te begrijpen. Hieronder geven we het model drie afbeeldingen met de vraag om deze te omschrijven. We hebben hierbij een Nederlandse en een Engelse variant laten genereren. We vergelijken het met de output die we in het verleden kregen van GPT-4o.

GPT-5: Afbeeldingen omschrijven

Een felgele rubberen eend drijft in een klein, lichtblauw opblaasbadje met helder water. Het zonlicht laat het water fonkelen en op de achtergrond is wat groen gras te zien.

The image shows a bright yellow rubber duck floating in a small inflatable pool filled with water. The pool has a light blue rim, and the water appears clear, with reflections visible on its surface. The setting is outdoors, with green grass surrounding the pool. The duck has an orange beak and a cheerful appearance.

Op de foto staan twee mannen ontspannen op een brug over een gracht in een Nederlandse stad. Ze leunen tegen een groen metalen hekwerk en kijken lachend in de camera. De man links draagt een grijze polo en spijkerbroek; de man rechts een wit, lichtgeprint overhemd met jeans en bruine schoenen. Achter hen loopt de gracht door met aangemeerde bootjes, geparkeerde auto’s langs de kade en statige, historische panden tussen veel groen. De achtergrond is licht onscherp, waardoor de twee personen duidelijk op de voorgrond staan. Het lijkt een bewolkte, maar heldere dag.

Two adult men are standing on a small green metal bridge over a calm canal.
Both are smiling and dressed casually in jeans; one wears a light gray polo, the other a white patterned button‑down shirt with a brown belt.
Behind them are leafy trees, parked cars, and historic-looking buildings lining the canal.
A couple of small boats are moored along the water.
The scene is bright but overcast, giving soft, even light and reflections on the water.

Op de afbeelding staan twee mensen op een brug bij een gracht. Op de achtergrond zijn bomen, geparkeerde auto's en historische gebouwen te zien. Beide personen dragen casual kleding en kijken vriendelijk naar de camera. Het ziet er uit als een typisch Nederlands grachtenpand met een gezellige sfeer.

The image features two men standing on a bridge over a canal. They're casually dressed, one in a gray polo shirt and jeans, and the other in a white patterned shirt and jeans. They are smiling and posing for the photo. In the background, there are trees, parked cars, and canal boats along the waterway, suggesting a picturesque, urban setting with a relaxed atmosphere.

Een speelse, vintage-achtige illustratie. Op de voorgrond drijft een geelbruine onderzeeër in de vorm van een eend, met drie ronde patrijspoorten en een hendel bovenop. Het water is donker en golvend. Op de achtergrond barst een grote vulkaan uit: roodgloeiende lavastromen lopen langs de flanken naar beneden, terwijl een dikke rookwolk opstijgt. In de lucht dwarrelen witte stippen, alsof sneeuw of as valt, wat een grappig contrast vormt met het cartooneske eend-onderzeeërtje.

A whimsical illustration shows a duck-shaped yellow submarine bobbing on choppy blue water. It has three round portholes, a periscope-like knob on top, and a greenish head with an orange bill. In the background, a large volcano erupts, sending dark smoke and bright red lava streams down its sides. White dots drift across the scene like falling ash or snow. The art has a vintage, textured print style with muted colors, blending playful imagery with a dramatic natural event.

De afbeelding toont een cartoonachtige scène met een eendvormige onderzeeër die op het water drijft. Op de achtergrond is een vulkaan te zien die uitbarst, met lava die langs de zijkanten stroomt en een rookwolk die opstijgt. Het geheel heeft een fantasie-achtige uitstraling, met een retro-stijl in het kleurgebruik en de illustratietechniek. Er zijn ook sneeuwvlokken die de lucht vullen, wat een surrealistisch effect geeft.

The image depicts a whimsical scene of a duck-shaped submarine floating on water. In the background, a volcano is actively erupting, spewing red lava and smoke into the sky. Snowfall is depicted with white dots scattered across the scene, adding a surreal contrast to the fiery eruption. The artwork combines elements of fantasy and nature in a stylized, artistic manner.

Ik moet eerlijk zeggen dat ik niet echt het idee krijg dat GPT-5 enorm veel beter is. Er zitten wel verschillen in de omschrijvingen, en GPT-5 lijkt soms wel iets betere output te leveren, maar dit zou net zo goed statistische ruis kunnen zijn. Beide modellen zijn gewoon erg competent in het omschrijven van afbeeldingen.

Wel is dit een goed moment om vanaf nu GPT-4 te vervangen voor deze taak door GPT-5, en deze als baseline te gaan gebruiken. In toekomstige blogposts zullen we dus vanaf nu gaan vergelijken met de resultaten van GPT-5.

Tekstherkenning in afbeeldingen

De eerdere GPT-modellen zijn altijd vrij sterk geweest in het extraheren van tekst uit afbeeldingen. Ook voor mijn eigen hobbyprojecten zijn dit vaak de modellen die ik voor deze taken gebruik. Ik heb lange tijd gpt-4o-2024-08-06 hiervoor ingezet en was enkele maanden geleden overgestapt naar gpt-4.1-mini-2025-04-14, beide naar grote tevredenheid.

Hoe doet GPT-5 het op dit vlak?

GPT-5: Tekstherkenning in afbeeldingen

SNELLER EENVOUDIGER SLIMMER

Met klantportalen en strategische automatisering helpen wij bedrijven met het behalen van hun doelen.

"LAAT HET HIER, DAN LEES IK HET EN VERTEL JE LATER WEL OF IK HET KOOP."

On the book cover: "Alleen op een eiland"

klant

upload:

documenten
opnamen van vergaderingen
feedback op resultaten

meerdere iteraties

ontvangt:

rapportages
overzichten
adviezen

Het eindejaar ziet er weer veelbelovend uit voor de PC bezitters, of ik zou misschien beter zeggen ‘Pentium 150 bezitters’. Begin september hebben we een bezoekje gebracht aan de ECTS show in Londen, een van de grootste vakbeurzen voor de computergames industrie. Alle nieuwe games die pas binnen ettelijke maanden op de markt komen, staan op ECTS reeds in demo te draaien: Outlaws, X-wing vs Tie Fighter, Monkey island 3, Falcon 4, Tomb Raider, Diablo, C&C Red Alert, Privateer the Darkning, Theme Hospital, Master of Orion 2, noem maar op...

Wat vooral onze aandacht trok was Tomb Raider, dit nieuwe 3D actiespel werd gedemonstreerd op van die nieuwe 3D accelerator kaarten voor de PC. Ik bezweer je, de snelheid en de kwaliteit van de graphics die we daar te zien kregen, dat hou je gewoon niet voor mogelijk. Op onze cover cd-rom van deze maand staat een rolling demo van Tomb Raider. Deze werkt echter enkel in gewone VGA mode, je moet je even voorstellen dat dit spel aan dezelfde snelheid in svga (met 64.000 kleuren) draait... Alvast even om naar uit te kijken.

Het tweede spel dat onze kin bijna tot op de grond deed openvallen was Falcon 4.0. Het spel wordt pas ergens half volgend jaar verwacht, maar vlak voor onze neus stond een medewerker van Spectrum Holobyte rondjes te vliegen boven een adembenemend landschap (te vergelijken met Flight Unlimited, maar nog véél beter!). “Wilt u het misschien ook eens proberen”, vroeg de vriendelijke man mij. Zo’n vraag laat ik mij natuurlijk geen tweede maal stellen en dus nam ik de stuurpook van hem over. Ik kan u nu dan ook met enige trots melden dat ik waarschijnlijk de eerste Europeaan ben die de F16 van Falcon 4.0 verticaal de grond heeft ingeboord. Onder het mom dat er ‘een vuiltje’ in mijn oog zat, verdween ik met een rood aangelopen hoofd van de Microprose stand.

Een interessante nieuwe dat ook vlot circuleerde, was de aankondiging van een nieuwe Pentium chip van Intel, met als codenaam MMX. Deze nieuwe Pentium chip bevat naast een gewone co-processor ook nog eens een co-processor voor graphics (hij is ook op andere vlakken bruikbaar). Gamers zouden hiermee een grote afname van de functies van deze speciale co-processor moeten aanschouwen, vooral in renderlagen en videobewerking.

Wat vooral onze aandacht trok was Tomb Raider, dit nieuwe 3D actiespel werd gedemonstreerd op een van de nieuwe 3D accelerator kaarten voor de PC. Ik bezweer je, de snelheid en de kwaliteit van de graphics die we daar te zien kregen, dat hou je gewoon niet voor mogelijk. Op onze cover cd-rom van deze maand staat een rolling demo van Tomb Raider. Deze werkt echter enkel in gewone VGA mode, je moet je even voorstellen dat dit spel aan dezelfde snelheid in svga (met 64.000 kleuren) draait... Alvast eentje om naar uit te kijken.

Het tweede spel dat onze kin bijna tot op de grond deed openvallen was Falcon 4.0. Het spel wordt pas ergens half volgend jaar verwacht, maar vlak voor onze neus stond een medewerker van Spectrum Holobyte rondjes te vliegen boven een adembenemend landschap (te vergelijken met Flight Unlimited, maar nog véél beter)! “Wilt u het misschien ook eens proberen”, vroeg de vriendelijke man mij. Zo’n vraag laat ik mij natuurlijk geen tweede maal stellen en meteen nam ik de stuurpook van hem over. Ik kan u nu dan ook met enige trots melden dat ik waarschijnlijk de eerste Europeaan ben geweest die de F16 van Falcon 4.0 verticaal de grond heeft ingeboord. Onder het mom dat er ‘een vuiltje’ in mijn oog zat, verdween ik met een rood aangelopen hoofd van de Microprose stand.

Een interessant nieuwtje dat ook vlot circuleerde, was de aankondiging van een nieuwe Pentium chip van Intel, met als codenaam MMX. Deze nieuwe Pentium chip bevat naast een gewone co-processor ook nog eens een co-processor voor graphics (hij is ook nog voor andere zaken bruikbaar). Games die gebruik zouden maken van de functies van deze speciale co-processor zouden een snelheidswinst kunnen realiseren.

Afbeelding 3 was natuurlijk de grote test - het handschrift van Casper. Menig dokter schijnt er jaloers op te zijn. Een handschrift zo intens dat archeologen over duizenden jaren zich zullen afvragen of het een buitenaards schrift was.

Hoe deed GPT-5 het? Volgens mij verrassend goed. De experts hier op kantoor hebben geverifieerd dat het inderdaad overeenkomt met de oorspronkelijke inhoud van de tekst. Ongelofelijk. Ik geloof ze op hun woord.

Maar, geloof het of niet, er is een test in mijn 'dataset' die nog moeilijker is dan het handschrift van Casper; namelijk de afbeelding die bij tab 4 en 5 gebruikt is. Deze foto van tekst in een tijdschrift gaf in het verleden bij oudere OpenAI-modellen, zoals GPT-4, veel problemen en veroorzaakte ook veel hallucinaties. Let op: ik vroeg hier specifiek om alleen de tekst die in het gele vak stond te extraheren.

Ik was dus erg benieuwd hoe GPT-5 met deze afbeelding om zou gaan.

En het resultaat? Ook GPT-5 hallucineert hierbij! Ik kan me voorstellen dat je weinig zin hebt om de hele tekst te moeten lezen en vergelijken, maar het is al voldoende om naar de laatste zin van het gele vlak te kijken. Hier verandert hij woorden zoals 'nieuwtje' naar 'nieuwe' en 'Games' naar 'Gamers'. Maar het wordt nog veel erger - hij begint delen van zinnen te veranderen, en op het einde hallucineert hij zelfs een totaal nieuwe zin erbij!

Dus ook GPT-5 was niet in staat om deze afbeelding te verwerken. Dat is jammer, dacht ik. Maar, wacht: we kunnen ook nog de thinking mode proberen! En die produceerde, na anderhalve minuut denken, een perfecte transcriptie. Heel indrukwekkend! Dit is de transcriptie die in tab 5 staat.

Vertalingen

Uit de MMLU-benchmarks blijkt dat GPT-5 een fractie beter is dan GPT-4. Maar op zich is dat niet gek - want GPT-4 was al behoorlijk goed. De thinking mode van GPT-5 presteert vergelijkbaar met het oude O3-high. Het o3-high-model was erg berucht vanwege de hoge kosten van het draaien van dit model, dus ook dit is een indrukwekkend resultaat.

Maar hoe doen ze het wanneer ze geconfronteerd worden met Aquamentus, onze balkendraak? Ik verwacht zelf geen verrassingen, maar zoals altijd zie hieronder onze vertaalkaarten:

Originele tekst

Ik heb honger! De zon schijnt. Ik loop met de hond naar de winkel. Daar koop ik brood en melk.

Vertaling

Vertaling (na reflectie)

Originele tekst

Toen zijn favoriete voetbalclub verloor, liep hij met de ziel onder de arm alsof hij zelf op het veld had gestaan. Maar zijn mentor probeert hem aan te moedigen, door te zeggen: 'Tut tut! De bal is rond!'

Vertaling

Vertaling (na reflectie)

Originele tekst

In order to obtain the Triforce, you’ll have to defeat Aquamentus, a very strong enemy. He shoots beams in three directions.

Vertaling

Vertaling (na reflectie)

Zoals verwacht - geen verrassingen, gewoon een competente vertaling. Bij de vertalingen van de andere (non-gpt-5-)modellen heb ik voor het gemak dezelfde resultaten hergebruikt als die we ook gebruikten bij het vorige artikel over gpt-oss. Normaal gesproken genereren we alle resultaten opnieuw, maar dat leek nu niet echt nodig, ook omdat er geen andere nieuwe modellen in ons lijstje erbij zijn gekomen.

Coderen

De status quo van de beste taalmodellen voor programmeren is al hele lange tijd hetzelfde: dit zijn de Claude-modellen, van Anthropic. Alhoewel de meningen vaak nog verschillen lijkt het beste model nu Claude Opus 4.1 te zijn, maar het zou ook Claude Sonnet 4 kunnen zijn.

Maar, daar komt nu voor het eerst verandering in, nu GPT-5 er is. De GPT-5-modellen lijken bijzonder sterk te zijn op het vlak van coderen, en de enorme kloof die al deze tijd bestond tussen OpenAI en Claude lijkt nu eindelijk overbrugd te zijn. Welk model is nu beter? Het antwoord is complex: beide modellen zijn namelijk erg sterk, maar blijken uit te blinken op iets andere vlakken. Claude (Sonnet) is bijvoorbeeld vaak wat sneller te zijn met refactors, en wat bondiger, terwijl GPT-5 soms wat sterker is op het vlak van logica die verspreid is over meerdere bestanden.

Maar tot zover lijkt het om het even: er is voorlopig geen duidelijke winnaar. Dat klinkt misschien als een anti-climax, maar ik denk dat Anthropic zich misschien nu wel zorgen moet gaan maken. Want de GPT-5-modellen zijn ook nog eens goedkoper.

Disclaimer

Bij deze artikelen laat ik het uitgelichte model altijd zelf de laatste zin van de disclaimer (bovenaan ieder artikel) bedenken. Het gpt-oss model presteerde hier erg teleurstellend - GPT-5 produceerde wel betere zinnen, soms zelfs bruikbare zinnen, maar er zat niks indrukwekkends of echt leuks tussen. En ze voelden vaak ook heel erg aan als nonsens, maar dat kan komen omdat ik prompt niet voorzie van voldoende context.

Enkele voorbeelden:

Onze stand-ups worden niet korter, maar dankzij GPT-5 zijn de demo’s ineens véél spectaculairder.
Met GPT-5 wordt “even googelen” officieel passé.
GPT-5 praat sneller, slimmer en soms beter dan je schoonmoeder.

Nou... laat het mijn schoonmoeder maar niet horen.

Waar zijn de andere modellen gebleven!?

Toen ik mijn chat-interface opende viel mij meteen iets op: ik kon alleen nog maar GPT-5-modellen selecteren!

Voorheen stonden er allerlei modellen, zoals 4o, 4o-mini, o3, etc. OpenAI heeft ervoor gekozen om ze allemaal te vervangen door GPT-5. In de benchmarks is terug te zien dat GPT-5-modellen inderdaad sterker zijn, dus technisch is dat heel goed te verantwoorden. Maar sterker nog: ik denk dat het een hele slimme zet was van OpenAI om dit te doen. Want het was inmiddels een meme geworden op het internet, hoe onduidelijk de OpenAI namen waren. Het was vaak niet duidelijk dat het o3-model veel sterker was dan het 4o-model, en wat werd er bijvoorbeeld bedoeld met de mini-modellen? En gpt-4.5 was weer een totaal ander model dan gpt-4, en niet als vervanger of opvolger bedoeld.

Kortom: het was een onduidelijke zooi. Ik denk dat alleen Microsoft slechter is in het bedenken van namen (voor hun Xbox-consoles).

Maar met deze zet hebben ze alles in één klap duidelijk gemaakt: je hebt GPT-5, GPT-5 Thinking en GPT-5 Pro. Het is direct duidelijk. Ook in de API is het vrij duidelijk (al hebben we daar gelukkig voorlopig nog wel toegang tot de oudere modellen). De keuze daar is GPT-5, GPT-5 Chat, GPT-5 mini en GPT-5 nano.

Conclusie

GPT-5 is een aardige stap voorwaarts. Het is een zeer competent, krachtig en betaalbaar model, dat erg goed is in het volgen van instructies.

Er zijn ook nadelen. Het model lijkt meer robotachtige antwoorden te geven, mogelijk omdat OpenAI het model nog veiliger heeft geprobeerd te maken. Ook weet het nog regelmatig te hallucineren. Het is duidelijk dat we er nog niet zijn.

Maar het is wel een stuk indrukwekkender dan de toch een beetje tegenvallende en teleurstellende release van gpt-oss. Het is jammer dat dat model niet van deze kwaliteit was. Ergens vraag ik me ook af of de timing van de release van GPT-5 misschien wel was om de teleurstelling van het open-weights model van OpenAI te overstemmen.

Ik ga in ieder geval in mijn hobbyprojecten wel alvast upgraden naar dit model, en de programmeercapaciteiten van dit model uitproberen.

Blognavigatie

Vorige blog-artikel

Model Uitgelicht - gpt-oss

OpenAI's eerste open-weights model sinds 2019 is eindelijk hier! Maar presteert gpt-oss wel zo goed als verwacht?

Volgende blog-artikel

Model Uitgelicht - GPT-5 Aanvulling

De lancering van GPT-5 kreeg een gemixte receptie. Wat is er aan de hand? In dit artikel doen wij een kleine aanvulling op ons eerdere artikel en bespreken we de situatie.

Terug naar overzicht