Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.

Din AI-regning er høyere enn du tror (Resonneringstokener)

Du satte opp en OpenAI o3-integrasjon. Prissettingen sier 10 dollar per million input-tokener og 40 dollar per million output-tokener. Du budsjetterer deretter. Så kommer den første månedens regning, og den er 2-3 ganger høyere enn forventet.

Skyldig: Resonneringstokener. OpenAI sine o-serie modeller (og nå resonneringsmoduser hos andre leverandører) genererer skjulte "tenke"-tokener som du blir belastet for, men som du aldri ser i svaret.

Denne guiden forklarer nøyaktig hva resonneringstokener er, hvordan de blåser opp regningen din, og hvordan du kan kontrollere dem gjennom smart bruk og rabatterte kreditter via AI Credits.

Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.

Kom i gang

Hva er Resonneringstokener?

Resonneringstokener er tokener generert av modellen under dens interne tankeprosess, før den produserer det endelige svaret. Med modeller som OpenAI o3, modellen:

Mottar prompten din
Genererer intern resonnering (tankekjede)
Itererer og raffinerer resonneringen sin
Produserer den endelige synlige utdataen

Trinn 2 og 3 genererer tokener du blir belastet for, men som du ikke ser.

Kjøp verifiserte OpenAI, Anthropic, Gemini, AWS, Azure og GCP-kreditter til rabatterte priser.

Kom i gang

Den Egentlige Prisberegningen

Hva du tror du betaler:

For OpenAI o3 (10 $/40 $ per million tokener), en spørring med 5K input + 2K output tokener:

Input-kostnad: 0,05 $
Output-kostnad: 0,08 $
Totalt: 0,13 $

Hva du faktisk betaler:

Samme spørring, men o3 genererer 8K resonneringstokener (talt som output):

Input-kostnad: 0,05 $
Resonneringstokener-kostnad: 0,32 $
Synlig output-kostnad: 0,08 $
Totalt: 0,45 $

Det er 3,5 ganger mer enn forventet. Og du har ingen innsikt i resonneringsdelen.

Modeller Som Bruker Resonneringstokener

OpenAI o-serie

o1, o1-mini - resonnering aktivert som standard
o3, o3 Pro - omfattende resonnering, størst innvirkning
GPT-5 med resonneringsmodus - resonnering når aktivert

Anthropic Claude

Claude Opus 4.6 - utvidet tenkemodus (når aktivert)
Claude Sonnet 4.6 - valgfri utvidet tenking

Google Gemini

Gemini 2.5 Pro - utvidet tenkemodus

DeepSeek

DeepSeek R1 - resonnering aktivert som standard

Vanlig mønster: Enhver modell markedsført som "resonneringsmodell" eller med "tenke"-funksjoner vil generere skjulte resonneringstokener.

Hvor Mange Resonneringstokener Genererer Disse Modellene?

Reelle gjennomsnitt:

Modell	Typiske Resonneringstokener per Spørring
GPT-5 (uten resonnering)	0
OpenAI o1-mini	500-3 000
OpenAI o3	2 000-15 000
OpenAI o3 Pro	5 000-50 000
Claude Opus (tenkemodus)	1 000-10 000
DeepSeek R1	1 000-8 000

Resonneringstokener overgår ofte synlige output-tokener med 5-10 ganger. Din reelle kostnad kan være mye høyere enn "output"-delen antyder.

Slik Beregner Du Reell Kostnad

For resonneringsmodeller, bruk denne korrigerte formelen:

Reell kostnad per spørring =
  (Input-tokener * input-pris)
  + ((Synlig output + resonneringstokener) * output-pris)

For OpenAI o3 med 5K input, 2K synlig output, 8K resonneringstokener:

(5 000 * 10 $/1M) + ((2 000 + 8 000) * 40 $/1M)
= 0,05 $ + 0,40 $
= 0,45 $ per spørring

Multipliser med antall spørringer for å få den reelle månedlige kostnaden.

Slik Reduserer Du Kostnader for Resonneringstokener

1. Bruk Modeller Uten Resonnering Når Mulig

For oppgaver som ikke krever dyp resonnering, bruk standardmodeller:

GPT-5 (1,25 $/10 $) i stedet for o3 (10 $/40 $) for generelt arbeid
Claude Sonnet uten tenkemodus for rutinemessig analyse
Gemini 2.5 Flash for raske svar

Besparelser: 50-90 % ved å unngå resonneringsmodeller for oppgaver uten behov for resonnering.

2. Sett Grenser for Resonneringsbudsjett

OpenAI sin o3 lar deg sette reasoning_effort-parametere:

low - minimal resonnering, billigere
medium - balansert
high - maksimal resonnering, dyrest

Bruk low eller medium med mindre du virkelig trenger maksimal resonneringsdybde.

3. Cache Resonneringsinput

Prompt-caching gjelder også for input til resonneringsmodeller. Cache delene av prompten din som ikke endrer seg.

4. Kjøp Rabatterte Kreditter Via AI Credits

AI Credits selger rabatterte OpenAI-kreditter til opptil 60 % rabatt fra veil pris. For arbeidsmengder med mye resonnering, gir dette de største besparelsene siden resonneringstokener er dyre output-tokener.

5. Bruk Resonneringsmodeller Kun for Endelige Svar

Flerstegspipelines: bruk billige modeller for mellomliggende trinn, bruk bare o3/o3 Pro for den endelige syntesen.

Sammenligning av Reell Kostnad

For en forskningsarbeidsmengde på 10 000 spørringer/måned:

Naiv beregning (ingen resonneringstokener):

o3: 10 000 * 0,13 $ = 1 300 $

Reell beregning (med resonneringstokener):

o3: 10 000 * 0,45 $ = 4 500 $

Med AI Credits til 50 % rabatt:

o3 + AI Credits: 10 000 * 0,225 $ = 2 250 $

Sparer 2 250 $ /måned sammenlignet med den reelle utsalgsprisen.

Ofte Stillete Spørsmål

Hva er resonneringstokener?

Tokener generert av resonneringsmodeller (som OpenAI o3) under deres interne "tenke"-prosess før de produserer det endelige svaret. Du blir belastet for dem, men ser dem aldri.

Hvorfor tar OpenAI betalt for resonneringstokener?

Resonneringstokener bruker ekte GPU-ressurser. OpenAI viderefører kostnaden. Resonneringen muliggjør modellens overlegne resonneringskvalitet, men øker kostnadene.

Hvor mye legger resonneringstokener til regningen min?

Vanligvis 2-3 ganger den naive beregningen. For tunge brukere av o3 Pro, kan resonneringskostnadene dominere regningen fullstendig.

Kan jeg se bruken min av resonneringstokener?

OpenAI sine API-svar inkluderer token-tellinger som viser input, output og resonneringstokener separat. Sjekk bruken din for å se den reelle fordelingen.

Hvordan unngår jeg kostnader for resonneringstokener?

Bruk modeller uten resonnering (GPT-5, Claude Sonnet uten tenking) når resonnering ikke er nødvendig. Sett resonneringsinnsatsen til low eller medium. Kjøp rabatterte kreditter via AI Credits for å dekke kostnadene.

Er resonneringstokener verdt kostnaden?

For oppgaver som genuint krever dyp resonnering (matematikk, vitenskap, kompleks analyse), ja. For rutinemessige oppgaver, nei - bruk billigere modeller.

Ikke Bli Overrasket av Resonneringstokener

Resonneringstokener er den største skjulte kostnaden i AI-fakturering i 2026. Nå vet du det - og du kan planlegge for dem.

Få et tilbud på aicredits.co ->

Resonneringstokener til 60 % rabatt. Spar på aicredits.co.