Köp verifierade OpenAI, Anthropic, Gemini, AWS, Azure och GCP-krediter till rabatterade priser.
Din AI-räkning är högre än du tror (Resonemangstokener)
Du har konfigurerat en OpenAI o3-integration. Prissättningen anger 10 USD per miljon input-tokener och 40 USD per miljon output-tokener. Du budgeterar därefter. Sedan kommer din första månadsräkning och den är 2-3 gånger högre än förväntat.
Kultingen: resonemangstokener. OpenAI:s o-serie modeller (och nu resonemangslägen hos andra leverantörer) genererar dolda "tänkande" tokener som du debiteras för men aldrig ser i svaret.
Den här guiden förklarar exakt vad resonemangstokener är, hur de blåser upp din räkning och hur du kan kontrollera dem genom smart användning och rabatterade krediter via AI Credits.
Köp verifierade OpenAI, Anthropic, Gemini, AWS, Azure och GCP-krediter till rabatterade priser.
Vad är resonemangstokener?
Resonemangstokener är tokener som genereras av modellen under dess interna tankeprocess, innan den producerar det slutliga svaret. Med modeller som OpenAI o3 gör modellen:
- Tar emot din prompt
- Genererar interna resonemang (kedja av tankar)
- Itererar och förfinar sitt resonemang
- Producerar den slutliga synliga utmatningen
Steg 2 och 3 genererar tokener som du debiteras för men inte ser.
Köp verifierade OpenAI, Anthropic, Gemini, AWS, Azure och GCP-krediter till rabatterade priser.
Den verkliga prissättningsmatematiken
Vad du tror att du betalar:
För OpenAI o3 (10 $/40 $ per MTok), en fråga med 5K input + 2K output tokener:
- Inputkostnad: 0,05 $
- Outputkostnad: 0,08 $
- Totalt: 0,13 $
Vad du faktiskt betalar:
Samma fråga, men o3 genererar 8K resonemangstokener (räknas som output):
- Inputkostnad: 0,05 $
- Kostnad för resonemangstokener: 0,32 $
- Kostnad för synlig output: 0,08 $
- Totalt: 0,45 $
Det är 3,5 gånger mer än förväntat. Och du har ingen insyn i resonemangsdelen.
Modeller som använder resonemangstokener
OpenAI o-serie
- o1, o1-mini - resonemang aktiverat som standard
- o3, o3 Pro - omfattande resonemang, störst påverkan
- GPT-5 med resonemangsläge - resonemang när det är aktiverat
Anthropic Claude
- Claude Opus 4.6 - utökat tankeläge (när det är aktiverat)
- Claude Sonnet 4.6 - valfritt utökat tänkande
Google Gemini
- Gemini 2.5 Pro - utökat tankeläge
DeepSeek
- DeepSeek R1 - resonemang aktiverat som standard
Gemensamt mönster: Alla modeller som marknadsförs som "resonemangsmodeller" eller med "tänkande" funktioner kommer att generera dolda resonemangstokener.
Hur många resonemangstokener genererar dessa modeller?
Genomsnitt i verkliga världen:
| Modell | Typiska resonemangstokener per fråga |
|---|---|
| GPT-5 (ingen resonemang) | 0 |
| OpenAI o1-mini | 500-3 000 |
| OpenAI o3 | 2 000-15 000 |
| OpenAI o3 Pro | 5 000-50 000 |
| Claude Opus (tankeläge) | 1 000-10 000 |
| DeepSeek R1 | 1 000-8 000 |
Resonemangstokener överstiger ofta synliga output-tokener med 5-10 gånger. Din verkliga kostnad kan vara mycket högre än vad "output"-delen antyder.
Hur man beräknar den verkliga kostnaden
För resonemangsmodeller, använd denna korrigerade formel:
Verklig kostnad per fråga =
(Inputtokener * inputpris)
+ ((Synlig output + resonemangstokener) * outputpris)
För OpenAI o3 med 5K input, 2K synlig output, 8K resonemangstokener:
- (5 000 * 10 $/1M) + ((2 000 + 8 000) * 40 $/1M)
- = 0,05 $ + 0,40 $
- = 0,45 $ per fråga
Multiplicera med frågevolymen för att få den verkliga månadskostnaden.
Hur man minskar kostnaderna för resonemangstokener
1. Använd modeller utan resonemang när det är möjligt
För uppgifter som inte kräver djupgående resonemang, använd standardmodeller:
- GPT-5 (1,25 $/10 $) istället för o3 (10 $/40 $) för allmänt arbete
- Claude Sonnet utan tankeläge för rutinanalys
- Gemini 2.5 Flash för snabba svar
Besparingar: 50-90 % genom att undvika resonemangsmodeller för uppgifter utan resonemang.
2. Ställ in budgetgränser för resonemang
OpenAI:s o3 låter dig ställa in parametrarna reasoning_effort:
low- minimalt resonemang, billigaremedium- balanserathigh- maximalt resonemang, dyrast
Använd low eller medium om du inte verkligen behöver maximalt resonemangsdjup.
3. Cachelagra input för resonemang
Prompt-cachelagring gäller även för input till resonemangsmodeller. Cachelagra de delar av din prompt som inte ändras.
4. Köp rabatterade krediter via AI Credits
AI Credits säljer rabatterade OpenAI-krediter till upp till 60 % rabatt jämfört med ordinarie pris. För arbetsbelastningar med mycket resonemang ger detta de största besparingarna eftersom resonemangstokener är dyra output-tokener.
5. Använd endast resonemangsmodeller för slutliga svar
Flerstegspipelines: använd billiga modeller för mellansteg, använd endast o3/o3 Pro för den slutliga syntesen.
Jämförelse av verklig kostnad
För en forskningsarbetsbelastning på 10 000 frågor/månad:
Naiv beräkning (inga resonemangstokener):
- o3: 10 000 * 0,13 $ = 1 300 $
Verklig beräkning (med resonemangstokener):
- o3: 10 000 * 0,45 $ = 4 500 $
Med AI Credits till 50 % rabatt:
- o3 + AI Credits: 10 000 * 0,225 $ = 2 250 $
Sparar 2 250 $/månad jämfört med den verkliga ordinarie kostnaden.
Vanliga frågor och svar
Vad är resonemangstokener?
Tokener som genereras av resonemangsmodeller (som OpenAI o3) under deras interna "tänkande" process innan de producerar det slutliga svaret. Du debiteras för dem men ser dem aldrig.
Varför tar OpenAI betalt för resonemangstokener?
Resonemangstokener förbrukar verklig GPU-beräkningskraft. OpenAI vidarebefordrar kostnaden. Resonemanget möjliggör modellens överlägsna resonemangskvalitet men blåser upp kostnaderna.
Hur mycket lägger resonemangstokener till på min räkning?
Vanligtvis 2-3 gånger den naiva beräkningen. För tunga o3 Pro-användare kan kostnaderna för resonemang helt dominera räkningen.
Kan jag se min användning av resonemangstokener?
OpenAI:s API-svar inkluderar tokenträknare som separat visar input, output och resonemangstokener. Kontrollera din användning för att se den verkliga uppdelningen.
Hur undviker jag kostnader för resonemangstokener?
Använd modeller utan resonemang (GPT-5, Claude Sonnet utan tänkande) när resonemang inte behövs. Ställ in reasoning_effort till low eller medium. Köp rabatterade krediter via AI Credits för att kompensera kostnaderna.
Är resonemangstokener värda kostnaden?
För uppgifter som genuint behöver djupgående resonemang (matematik, vetenskap, komplex analys), ja. För rutinmässiga uppgifter, nej - använd billigare modeller.
Bli inte överraskad av resonemangstokener
Resonemangstokener är den största dolda kostnaden i AI-faktureringen 2026. Nu vet du det - och du kan planera för dem.
Få en offert på aicredits.co ->
Resonemangstokener till 60 % rabatt. Spara på aicredits.co.