Koop geverifieerde OpenAI, Anthropic, Gemini, AWS, Azure en GCP credits tegen kortingsprijzen.
Je AI-rekening is hoger dan je denkt (Redeneer-tokens)
Je hebt een OpenAI o3-integratie ingesteld. De prijzen geven aan: $10 per miljoen invoertokens en $40 per miljoen uitvoertokens. Je budgetteert dienovereenkomstig. Dan komt je eerste maandelijkse rekening binnen en deze is 2-3x hoger dan verwacht.
De boosdoener: redeneer-tokens. De o-serie modellen van OpenAI (en nu ook redeneermodi bij andere providers) genereren verborgen "denk"-tokens waarvoor je wordt gefactureerd, maar die je nooit in het antwoord ziet.
Deze gids legt precies uit wat redeneer-tokens zijn, hoe ze je rekening opdrijven en hoe je ze kunt beheersen door slim gebruik en kortingscredits via AI Credits.
Koop geverifieerde OpenAI, Anthropic, Gemini, AWS, Azure en GCP credits tegen kortingsprijzen.
Wat zijn redeneer-tokens?
Redeneer-tokens zijn tokens die door het model worden gegenereerd tijdens het interne denkproces, voordat het de uiteindelijke respons produceert. Bij modellen zoals OpenAI o3, gebeurt het volgende:
- Het model ontvangt je prompt.
- Het genereert interne redeneringen (chain of thought).
- Het itereert en verfijnt zijn redeneringen.
- Het produceert de uiteindelijke zichtbare uitvoer.
Stappen 2 en 3 genereren tokens waarvoor je wordt gefactureerd, maar die je niet ziet.
Koop geverifieerde OpenAI, Anthropic, Gemini, AWS, Azure en GCP credits tegen kortingsprijzen.
De werkelijke prijsberekening
Wat je denkt dat je betaalt:
Voor OpenAI o3 ($10/$40 per MTok), een query met 5K invoer + 2K uitvoertokens:
- Invoerkosten: $0,05
- Uitvoerkosten: $0,08
- Totaal: $0,13
Wat je werkelijk betaalt:
Zelfde query, maar o3 genereert 8K redeneer-tokens (geteld als uitvoer):
- Invoerkosten: $0,05
- Kosten redeneer-tokens: $0,32
- Kosten zichtbare uitvoer: $0,08
- Totaal: $0,45
Dat is 3,5x meer dan verwacht. En je hebt geen inzicht in het redeneergedeelte.
Modellen die redeneer-tokens gebruiken
OpenAI o-serie
- o1, o1-mini - redeneren standaard ingeschakeld
- o3, o3 Pro - uitgebreid redeneren, grootste impact
- GPT-5 met redeneermodus - redeneren indien ingeschakeld
Anthropic Claude
- Claude Opus 4.6 - uitgebreide denmodus (indien ingeschakeld)
- Claude Sonnet 4.6 - optioneel uitgebreid denken
Google Gemini
- Gemini 2.5 Pro - uitgebreide denmodus
DeepSeek
- DeepSeek R1 - redeneren standaard ingeschakeld
Veelvoorkomend patroon: Elk model dat wordt gepromoot als "redeneermodel" of met "denk"-functies, genereert verborgen redeneer-tokens.
Hoeveel redeneer-tokens genereren deze modellen?
Gemiddelden in de praktijk:
| Model | Typische redeneer-tokens per query |
|---|---|
| GPT-5 (geen redenering) | 0 |
| OpenAI o1-mini | 500-3.000 |
| OpenAI o3 | 2.000-15.000 |
| OpenAI o3 Pro | 5.000-50.000 |
| Claude Opus (denmodus) | 1.000-10.000 |
| DeepSeek R1 | 1.000-8.000 |
Redeneer-tokens overtreffen vaak de zichtbare uitvoertokens met 5-10x. Je werkelijke kosten kunnen veel hoger zijn dan wat het "uitvoer"-gedeelte suggereert.
Hoe de werkelijke kosten te berekenen
Gebruik voor redeneermodellen deze gecorrigeerde formule:
Werkelijke kosten per query =
(Invoertokens * invoerprijs)
+ ((Zichtbare uitvoer + redeneer-tokens) * uitvoerprijs)
Voor OpenAI o3 met 5K invoer, 2K zichtbare uitvoer, 8K redeneer-tokens:
- (5.000 * $10/1M) + ((2.000 + 8.000) * $40/1M)
- = $0,05 + $0,40
- = $0,45 per query
Vermenigvuldig met het queryvolume om de werkelijke maandelijkse kosten te krijgen.
Hoe de kosten van redeneer-tokens te verlagen
1. Gebruik niet-redeneermodellen waar mogelijk
Gebruik voor taken die geen diepgaande redenering vereisen, standaardmodellen:
- GPT-5 ($1,25/$10) in plaats van o3 ($10/$40) voor algemeen werk
- Claude Sonnet zonder denmodus voor routinematige analyse
- Gemini 2.5 Flash voor snelle antwoorden
Besparing: 50-90% door geen redeneermodellen te gebruiken voor niet-redeneringstaken.
2. Stel limieten in voor het redeneerbudget
OpenAI's o3 laat je reasoning_effort-parameters instellen:
low- minimale redenering, goedkopermedium- gebalanceerdhigh- maximale redenering, duurste
Gebruik low of medium, tenzij je echt maximale redeneerdiepte nodig hebt.
3. Cache redeneer-inputs
Prompt-caching is ook van toepassing op de inputs van redeneermodellen. Cache de delen van je prompt die niet veranderen.
4. Koop kortingscredits via AI Credits
AI Credits verkoopt kortingscredits voor OpenAI met tot 60% korting op de winkelprijs. Voor workloads met veel redenering levert dit de grootste besparingen op, aangezien redeneer-tokens dure uitvoer-tokens zijn.
5. Gebruik redeneermodellen alleen voor eindantwoorden
Meerfasenpijplijnen: gebruik goedkope modellen voor tussenliggende stappen, gebruik o3/o3 Pro alleen voor de uiteindelijke synthese.
Vergelijking van werkelijke kosten
Voor een onderzoekswerklast van 10.000 queries/maand:
Naïeve berekening (geen redeneer-tokens):
- o3: 10.000 * $0,13 = $1.300
Werkelijke berekening (met redeneer-tokens):
- o3: 10.000 * $0,45 = $4.500
Met AI Credits met 50% korting:
- o3 + AI Credits: 10.000 * $0,225 = $2.250
Besparing van $2.250/maand ten opzichte van de werkelijke winkelprijs.
Veelgestelde vragen
Wat zijn redeneer-tokens?
Tokens gegenereerd door redeneermodellen (zoals OpenAI o3) tijdens hun interne "denk"-proces voordat de uiteindelijke respons wordt geproduceerd. Je wordt ervoor gefactureerd, maar ziet ze nooit.
Waarom rekent OpenAI voor redeneer-tokens?
Redeneer-tokens verbruiken echte GPU-rekenkracht. OpenAI brengt de kosten door. De redenering maakt de superieure redeneerkwaliteit van het model mogelijk, maar drijft de kosten op.
Hoeveel voegen redeneer-tokens toe aan mijn rekening?
Meestal 2-3x de naïeve berekening. Voor intensieve gebruikers van o3 Pro kunnen de kosten voor redenering de rekening volledig domineren.
Kan ik mijn gebruik van redeneer-tokens zien?
De API-antwoorden van OpenAI bevatten tokentellingen die invoer-, uitvoer- en redeneer-tokens afzonderlijk weergeven. Controleer je gebruik om de werkelijke uitsplitsing te zien.
Hoe vermijd ik de kosten van redeneer-tokens?
Gebruik niet-redeneermodellen (GPT-5, Claude Sonnet zonder denken) wanneer redenering niet nodig is. Stel de redeneerinspanning in op low of medium. Koop kortingscredits via AI Credits om de kosten te dekken.
Zijn redeneer-tokens de kosten waard?
Voor taken die echt diepgaande redenering vereisen (wiskunde, wetenschap, complexe analyse), ja. Voor routinetaken, nee - gebruik goedkopere modellen.
Laat je niet verrassen door redeneer-tokens
Redeneer-tokens zijn de grootste verborgen kosten in de AI-facturering van 2026. Nu weet je het - en je kunt ervoor plannen.
Vraag een offerte aan op aicredits.co ->
Redeneer-tokens met 60% korting. Bespaar op aicredits.co.