Køb verificerede OpenAI, Anthropic, Gemini, AWS, Azure og GCP credits til rabatpriser.
Din AI-regning er højere, end du tror (Begrundelsestokens)
Du har sat en OpenAI o3-integration op. Prissætningen siger 10 $ pr. million inputtokens og 40 $ pr. million outputtokens. Du budgetterer derefter. Derefter ankommer din første måneds regning, og den er 2-3 gange højere end forventet.
Synderen: Begrundelsestokens. OpenAI's o-serie modeller (og nu begrundelsestilstande hos andre udbydere) genererer skjulte "tænke"-tokens, som du betaler for, men aldrig ser i svaret.
Denne guide forklarer præcist, hvad begrundelsestokens er, hvordan de oppuster din regning, og hvordan du kontrollerer dem gennem smart brug og rabatterede kreditter via AI Credits.
Køb verificerede OpenAI, Anthropic, Gemini, AWS, Azure og GCP credits til rabatpriser.
Hvad er Begrundelsestokens?
Begrundelsestokens er tokens genereret af modellen under dens interne tænke-proces, før den producerer det endelige svar. Med modeller som OpenAI o3 sker følgende:
- Modellen modtager din prompt
- Genererer intern begrundelse (kæde af tanker)
- Itererer og forfiner sin begrundelse
- Producerer det endelige, synlige output
Trin 2 og 3 genererer tokens, som du betaler for, men ikke ser.
Køb verificerede OpenAI, Anthropic, Gemini, AWS, Azure og GCP credits til rabatpriser.
Den Reelle Prissætningsregnemaskine
Hvad du tror, du betaler:
For OpenAI o3 (10 $/40 $ pr. MTok), en forespørgsel med 5K input + 2K output tokens:
- Inputomkostning: 0,05 $
- Outputomkostning: 0,08 $
- Total: 0,13 $
Hvad du rent faktisk betaler:
Samme forespørgsel, men o3 genererer 8K begrundelsestokens (talt som output):
- Inputomkostning: 0,05 $
- Omkostning for begrundelsestokens: 0,32 $
- Omkostning for synligt output: 0,08 $
- Total: 0,45 $
Det er 3,5 gange mere end forventet. Og du har ingen indsigt i begrundelsesdelen.
Modeller der Bruger Begrundelsestokens
OpenAI o-serie
- o1, o1-mini - begrundelse aktiveret som standard
- o3, o3 Pro - omfattende begrundelse, størst effekt
- GPT-5 med begrundelsestilstand - begrundelse, når den er aktiveret
Anthropic Claude
- Claude Opus 4.6 - udvidet tænketilstand (når den er aktiveret)
- Claude Sonnet 4.6 - valgfri udvidet tænkning
Google Gemini
- Gemini 2.5 Pro - udvidet tænketilstand
DeepSeek
- DeepSeek R1 - begrundelse aktiveret som standard
Fælles mønster: Enhver model markedsført som en "begrundelsesmodel" eller med "tænke"-funktioner vil generere skjulte begrundelsestokens.
Hvor Mange Begrundelsestokens Genererer Disse Modeller?
Reelle gennemsnit:
| Model | Typiske Begrundelsestokens pr. Forespørgsel |
|---|---|
| GPT-5 (ingen begrundelse) | 0 |
| OpenAI o1-mini | 500-3.000 |
| OpenAI o3 | 2.000-15.000 |
| OpenAI o3 Pro | 5.000-50.000 |
| Claude Opus (tænketilstand) | 1.000-10.000 |
| DeepSeek R1 | 1.000-8.000 |
Begrundelsestokens overstiger ofte synlige outputtokens med 5-10 gange. Din reelle omkostning kan være meget højere end hvad "output"-delen antyder.
Sådan Beregner du den Sande Omkostning
For begrundelsesmodeller skal du bruge denne korrigerede formel:
Sand omkostning pr. forespørgsel =
(Inputtokens * inputpris)
+ ((Synligt output + begrundelsestokens) * outputpris)
For OpenAI o3 med 5K input, 2K synligt output, 8K begrundelsestokens:
- (5.000 * 10 $/1M) + ((2.000 + 8.000) * 40 $/1M)
- = 0,05 $ + 0,40 $
- = 0,45 $ pr. forespørgsel
Gang med antallet af forespørgsler for at få den reelle månedlige omkostning.
Sådan Reducerer du Omkostningerne ved Begrundelsestokens
1. Brug Modeller Uden Begrundelse, Når det er Muligt
Til opgaver, der ikke kræver dyb begrundelse, skal du bruge standardmodeller:
- GPT-5 (1,25 $/10 $) i stedet for o3 (10 $/40 $) til generelt arbejde
- Claude Sonnet uden tænketilstand til rutinemæssig analyse
- Gemini 2.5 Flash til hurtige svar
Besparelser: 50-90 % ved at undgå begrundelsesmodeller til opgaver uden begrundelse.
2. Indstil Budgetgrænser for Begrundelse
OpenAI's o3 giver dig mulighed for at indstille reasoning_effort parametre:
low- minimal begrundelse, billigeremedium- afbalancerethigh- maksimal begrundelse, dyrest
Brug low eller medium, medmindre du virkelig har brug for maksimal begrundelsesdybde.
3. Cache Input til Begrundelse
Prompt-caching gælder også for input til begrundelsesmodeller. Cache de dele af din prompt, der ikke ændrer sig.
4. Køb Rabaterede Kreditter via AI Credits
AI Credits sælger rabatterede OpenAI-kreditter til op til 60 % under detailprisen. For arbejdsbyrder med meget begrundelse giver dette de største besparelser, da begrundelsestokens er dyre outputtokens.
5. Brug Begrundelsesmodeller Kun til Endelige Svar
Fler-trins pipelines: brug billige modeller til mellemliggende trin, brug kun o3/o3 Pro til den endelige syntese.
Reelle Omkostningssammenligninger
For en forskningsarbejdsbyrde på 10.000 forespørgsler/måned:
Naiv beregning (ingen begrundelsestokens):
- o3: 10.000 * 0,13 $ = 1.300 $
Reelle beregning (med begrundelsestokens):
- o3: 10.000 * 0,45 $ = 4.500 $
Med AI Credits til 50 % rabat:
- o3 + AI Credits: 10.000 * 0,225 $ = 2.250 $
Besparelse på 2.250 $/måned i forhold til den reelle detailpris.
Ofte Stillede Spørgsmål
Hvad er begrundelsestokens?
Tokens genereret af begrundelsesmodeller (som OpenAI o3) under deres interne "tænke"-proces, før de producerer det endelige svar. Du betaler for dem, men ser dem aldrig.
Hvorfor opkræver OpenAI betaling for begrundelsestokens?
Begrundelsestokens forbruger reel GPU-beregningskraft. OpenAI sender omkostningerne videre. Begrundelsen muliggør modellens overlegne begrundelseskvalitet, men oppuster omkostningerne.
Hvor meget tilføjer begrundelsestokens til min regning?
Typisk 2-3 gange den naive beregning. For tunge o3 Pro-brugere kan begrundelsesomkostningerne dominere regningen helt.
Kan jeg se mit forbrug af begrundelsestokens?
OpenAI's API-svar inkluderer tokenantal, der viser input, output og begrundelsestokens separat. Tjek dit forbrug for at se den reelle opdeling.
Hvordan undgår jeg omkostninger ved begrundelsestokens?
Brug modeller uden begrundelse (GPT-5, Claude Sonnet uden tænkning), når begrundelse ikke er nødvendig. Indstil begrundelseseffekten til low eller medium. Køb rabatterede kreditter via AI Credits for at udligne omkostningerne.
Er begrundelsestokens prisen værd?
Til opgaver, der oprigtigt kræver dyb begrundelse (matematik, videnskab, kompleks analyse), ja. Til rutinemæssige opgaver, nej - brug billigere modeller.
Lad dig Ikke Overraske af Begrundelsestokens
Begrundelsestokens er den største skjulte omkostning i AI-regninger i 2026. Nu ved du det - og du kan planlægge for dem.
Få et tilbud på aicredits.co ->
Begrundelsestokens til 60 % rabat. Spar på aicredits.co.