Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.
Din AI-regning er høyere enn du tror (Resonneringstokener)
Du satte opp en OpenAI o3-integrasjon. Prissettingen sier 10 dollar per million input-tokener og 40 dollar per million output-tokener. Du budsjetterer deretter. Så kommer den første månedens regning, og den er 2-3 ganger høyere enn forventet.
Skyldig: Resonneringstokener. OpenAI sine o-serie modeller (og nå resonneringsmoduser hos andre leverandører) genererer skjulte "tenke"-tokener som du blir belastet for, men som du aldri ser i svaret.
Denne guiden forklarer nøyaktig hva resonneringstokener er, hvordan de blåser opp regningen din, og hvordan du kan kontrollere dem gjennom smart bruk og rabatterte kreditter via AI Credits.
Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.
Hva er Resonneringstokener?
Resonneringstokener er tokener generert av modellen under dens interne tankeprosess, før den produserer det endelige svaret. Med modeller som OpenAI o3, modellen:
- Mottar prompten din
- Genererer intern resonnering (tankekjede)
- Itererer og raffinerer resonneringen sin
- Produserer den endelige synlige utdataen
Trinn 2 og 3 genererer tokener du blir belastet for, men som du ikke ser.
Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.
Den Egentlige Prisberegningen
Hva du tror du betaler:
For OpenAI o3 (10 $/40 $ per million tokener), en spørring med 5K input + 2K output tokener:
- Input-kostnad: 0,05 $
- Output-kostnad: 0,08 $
- Totalt: 0,13 $
Hva du faktisk betaler:
Samme spørring, men o3 genererer 8K resonneringstokener (talt som output):
- Input-kostnad: 0,05 $
- Resonneringstokener-kostnad: 0,32 $
- Synlig output-kostnad: 0,08 $
- Totalt: 0,45 $
Det er 3,5 ganger mer enn forventet. Og du har ingen innsikt i resonneringsdelen.
Modeller Som Bruker Resonneringstokener
OpenAI o-serie
- o1, o1-mini - resonnering aktivert som standard
- o3, o3 Pro - omfattende resonnering, størst innvirkning
- GPT-5 med resonneringsmodus - resonnering når aktivert
Anthropic Claude
- Claude Opus 4.6 - utvidet tenkemodus (når aktivert)
- Claude Sonnet 4.6 - valgfri utvidet tenking
Google Gemini
- Gemini 2.5 Pro - utvidet tenkemodus
DeepSeek
- DeepSeek R1 - resonnering aktivert som standard
Vanlig mønster: Enhver modell markedsført som "resonneringsmodell" eller med "tenke"-funksjoner vil generere skjulte resonneringstokener.
Hvor Mange Resonneringstokener Genererer Disse Modellene?
Reelle gjennomsnitt:
| Modell | Typiske Resonneringstokener per Spørring |
|---|---|
| GPT-5 (uten resonnering) | 0 |
| OpenAI o1-mini | 500-3 000 |
| OpenAI o3 | 2 000-15 000 |
| OpenAI o3 Pro | 5 000-50 000 |
| Claude Opus (tenkemodus) | 1 000-10 000 |
| DeepSeek R1 | 1 000-8 000 |
Resonneringstokener overgår ofte synlige output-tokener med 5-10 ganger. Din reelle kostnad kan være mye høyere enn "output"-delen antyder.
Slik Beregner Du Reell Kostnad
For resonneringsmodeller, bruk denne korrigerte formelen:
Reell kostnad per spørring =
(Input-tokener * input-pris)
+ ((Synlig output + resonneringstokener) * output-pris)
For OpenAI o3 med 5K input, 2K synlig output, 8K resonneringstokener:
- (5 000 * 10 $/1M) + ((2 000 + 8 000) * 40 $/1M)
- = 0,05 $ + 0,40 $
- = 0,45 $ per spørring
Multipliser med antall spørringer for å få den reelle månedlige kostnaden.
Slik Reduserer Du Kostnader for Resonneringstokener
1. Bruk Modeller Uten Resonnering Når Mulig
For oppgaver som ikke krever dyp resonnering, bruk standardmodeller:
- GPT-5 (1,25 $/10 $) i stedet for o3 (10 $/40 $) for generelt arbeid
- Claude Sonnet uten tenkemodus for rutinemessig analyse
- Gemini 2.5 Flash for raske svar
Besparelser: 50-90 % ved å unngå resonneringsmodeller for oppgaver uten behov for resonnering.
2. Sett Grenser for Resonneringsbudsjett
OpenAI sin o3 lar deg sette reasoning_effort-parametere:
low- minimal resonnering, billigeremedium- balanserthigh- maksimal resonnering, dyrest
Bruk low eller medium med mindre du virkelig trenger maksimal resonneringsdybde.
3. Cache Resonneringsinput
Prompt-caching gjelder også for input til resonneringsmodeller. Cache delene av prompten din som ikke endrer seg.
4. Kjøp Rabatterte Kreditter Via AI Credits
AI Credits selger rabatterte OpenAI-kreditter til opptil 60 % rabatt fra veil pris. For arbeidsmengder med mye resonnering, gir dette de største besparelsene siden resonneringstokener er dyre output-tokener.
5. Bruk Resonneringsmodeller Kun for Endelige Svar
Flerstegspipelines: bruk billige modeller for mellomliggende trinn, bruk bare o3/o3 Pro for den endelige syntesen.
Sammenligning av Reell Kostnad
For en forskningsarbeidsmengde på 10 000 spørringer/måned:
Naiv beregning (ingen resonneringstokener):
- o3: 10 000 * 0,13 $ = 1 300 $
Reell beregning (med resonneringstokener):
- o3: 10 000 * 0,45 $ = 4 500 $
Med AI Credits til 50 % rabatt:
- o3 + AI Credits: 10 000 * 0,225 $ = 2 250 $
Sparer 2 250 $ /måned sammenlignet med den reelle utsalgsprisen.
Ofte Stillete Spørsmål
Hva er resonneringstokener?
Tokener generert av resonneringsmodeller (som OpenAI o3) under deres interne "tenke"-prosess før de produserer det endelige svaret. Du blir belastet for dem, men ser dem aldri.
Hvorfor tar OpenAI betalt for resonneringstokener?
Resonneringstokener bruker ekte GPU-ressurser. OpenAI viderefører kostnaden. Resonneringen muliggjør modellens overlegne resonneringskvalitet, men øker kostnadene.
Hvor mye legger resonneringstokener til regningen min?
Vanligvis 2-3 ganger den naive beregningen. For tunge brukere av o3 Pro, kan resonneringskostnadene dominere regningen fullstendig.
Kan jeg se bruken min av resonneringstokener?
OpenAI sine API-svar inkluderer token-tellinger som viser input, output og resonneringstokener separat. Sjekk bruken din for å se den reelle fordelingen.
Hvordan unngår jeg kostnader for resonneringstokener?
Bruk modeller uten resonnering (GPT-5, Claude Sonnet uten tenking) når resonnering ikke er nødvendig. Sett resonneringsinnsatsen til low eller medium. Kjøp rabatterte kreditter via AI Credits for å dekke kostnadene.
Er resonneringstokener verdt kostnaden?
For oppgaver som genuint krever dyp resonnering (matematikk, vitenskap, kompleks analyse), ja. For rutinemessige oppgaver, nei - bruk billigere modeller.
Ikke Bli Overrasket av Resonneringstokener
Resonneringstokener er den største skjulte kostnaden i AI-fakturering i 2026. Nå vet du det - og du kan planlegge for dem.
Få et tilbud på aicredits.co ->
Resonneringstokener til 60 % rabatt. Spar på aicredits.co.