Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.
Jūsų AI sąskaita didesnė nei manote (apgalvojimo žetonai)
Sukūrėte OpenAI o3 integraciją. Kainodara nurodo 10 USD už milijoną įvesties žetonų ir 40 USD už milijoną išvesties žetonų. Biudžetą formuojate atitinkamai. Tada atvyksta jūsų pirmojo mėnesio sąskaita ir ji yra 2–3 kartus didesnė nei tikėtasi.
Kaltininkas: apgalvojimo žetonai. OpenAI o-serijos modeliai (o dabar ir kitų paslaugų teikėjų apgalvojimo režimai) generuoja paslėptus "mąstymo" žetonus, už kuriuos jums apmokestinama, bet kurių niekada nematote atsakyme.
Šis vadovas paaiškina, kas tiksliai yra apgalvojimo žetonai, kaip jie didina jūsų sąskaitą ir kaip juos kontroliuoti per protingą naudojimą ir nuolaidų kreditus per AI Credits.
Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.
Kas yra apgalvojimo žetonai?
Apgalvojimo žetonai yra žetonai, kuriuos modelis generuoja savo vidinio mąstymo proceso metu, prieš pateikdamas galutinį atsakymą. Naudojant tokius modelius kaip OpenAI o3, modelis:
- Gauna jūsų raginimą
- Generuoja vidinį apgalvojimą (minčių grandinę)
- Iteruoja ir tobulina savo apgalvojimą
- Generuoja galutinį matomą rezultatą
2 ir 3 veiksmai generuoja žetonus, už kuriuos jums apmokestinama, bet kurių nematote.
Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.
Tikroji kainodaros matematika
Ką manote, kad mokate:
Dėl OpenAI o3 (10 USD / 40 USD už MTok), užklausa su 5K įvesties + 2K išvesties žetonų:
- Įvesties kaina: 0,05 USD -Išvesties kaina: 0,08 USD
- Iš viso: 0,13 USD
Ką iš tikrųjų mokate:
Tas pats užklausa, bet o3 generuoja 8K apgalvojimo žetonų (skaičiuojami kaip išvestis): -Įvesties kaina: 0,05 USD -Apgalvojimo žetonų kaina: 0,32 USD -Matomo rezultato kaina: 0,08 USD
- Iš viso: 0,45 USD
Tai 3,5 karto daugiau nei tikėtasi. Ir jūs neturite jokios matomumo į apgalvojimo dalį.
Modeliai, naudojantys apgalvojimo žetonus
OpenAI o-serija
- o1, o1-mini - apgalvojimas įjungtas pagal numatytuosius nustatymus
- o3, o3 Pro - platus apgalvojimas, didžiausias poveikis
- GPT-5 su apgalvojimo režimu - apgalvojimas, kai įjungtas
Anthropic Claude
- Claude Opus 4.6 - pratęstas mąstymo režimas (kai įjungtas)
- Claude Sonnet 4.6 - pasirenkamas pratęstas mąstymas
Google Gemini
- Gemini 2.5 Pro - pratęstas mąstymo režimas
DeepSeek
- DeepSeek R1 - apgalvojimas įjungtas pagal numatytuosius nustatymus
Bendra tendencija: Bet kuris modelis, reklamuojamas kaip "apgalvojimo modelis" ar turintis "mąstymo" funkcijų, generuos paslėptus apgalvojimo žetonus.
Kiek apgalvojimo žetonų generuoja šie modeliai?
Realaus pasaulio vidurkiai:
| Modelis | Tipiniai apgalvojimo žetonai per užklausą |
|---|---|
| GPT-5 (be apgalvojimo) | 0 |
| OpenAI o1-mini | 500–3 000 |
| OpenAI o3 | 2 000–15 000 |
| OpenAI o3 Pro | 5 000–50 000 |
| Claude Opus (mąstymo režimas) | 1 000–10 000 |
| DeepSeek R1 | 1 000–8 000 |
Apgalvojimo žetonai dažnai viršija matomus išvesties žetonus 5–10 kartų. Jūsų reali kaina gali būti daug didesnė nei rodo "išvesties" dalis.
Kaip apskaičiuoti tikrąją kainą
Apgalvojimo modeliams naudokite šią pataisytą formulę:
Tikroji kaina už užklausą =
(Įvesties žetonų * įvesties kaina)
+ ((Matomi išvesties + apgalvojimo žetonai) * išvesties kaina)
Dėl OpenAI o3 su 5K įvesties, 2K matomų išvesties, 8K apgalvojimo žetonų:
- (5 000 * 10 USD/1M) + ((2 000 + 8 000) * 40 USD/1M)
- = 0,05 USD + 0,40 USD
- = 0,45 USD už užklausą
Padauginkite iš užklausų kiekio, kad gautumėte realią mėnesio kainą.
Kaip sumažinti apgalvojimo žetonų išlaidas
1. Naudokite neapgalvojimo modelius, kai įmanoma
Užduotims, kurioms nereikia gilaus apgalvojimo, naudokite standartinius modelius:
- GPT-5 (1,25 USD / 10 USD) vietoj o3 (10 USD / 40 USD) bendram darbui
- Claude Sonnet be mąstymo režimo rutininei analizei
- Gemini 2.5 Flash greitiems atsakymams
Sutaupymai: 50–90 % vengiant apgalvojimo modelių neapgalvojimo užduotims.
2. Nustatykite apgalvojimo biudžeto limitus
OpenAI o3 leidžia nustatyti reasoning_effort parametrus:
low- minimalus apgalvojimas, pigiaumedium- subalansuotashigh- maksimalus apgalvojimas, brangiausias
Naudokite low arba medium, nebent tikrai reikalingas maksimalus apgalvojimo gylis.
3. Talpinkite apgalvojimo įvestis
Ragininimo talpinimas taikomas ir apgalvojimo modelių įvestims. Talpinkite savo raginimo dalis, kurios nesikeičia.
4. Pirkite nuolaidų kreditus per AI Credits
AI Credits parduoda nuolaidų OpenAI kreditus iki 60 % pigiau nei mažmeninė kaina. Dėl didelių apgalvojimo apkrovų tai suteikia didžiausius sutaupymus, nes apgalvojimo žetonai yra brangūs išvesties žetonai.
5. Naudokite apgalvojimo modelius tik galutiniams atsakymams
Daugiapakopiai procesai: naudokite pigius modelius tarpiniams etapams, o3/o3 Pro naudokite tik galutinei sintezei.
Tikrosios kainos palyginimas
Reikalingiems tyrimams, kuriems reikia 10 000 užklausų/mėn.:
Naivus skaičiavimas (be apgalvojimo žetonų):
- o3: 10 000 * 0,13 USD = 1 300 USD
Tikrasis skaičiavimas (su apgalvojimo žetonais):
- o3: 10 000 * 0,45 USD = 4 500 USD
Su AI Credits 50 % nuolaida:
- o3 + AI Credits: 10 000 * 0,225 USD = 2 250 USD
Sutaupote 2 250 USD/mėn. palyginti su tikra mažmenine kaina.
Dažnai užduodami klausimai
Kas yra apgalvojimo žetonai?
Žetonai, generuojami apgalvojimo modelių (pvz., OpenAI o3) vidinio "mąstymo" proceso metu prieš pateikiant galutinį atsakymą. Jums apmokestinama už juos, bet niekada jų nematote.
Kodėl OpenAI ima mokestį už apgalvojimo žetonus?
Apgalvojimo žetonai naudoja realią GPU skaičiavimo galią. OpenAI perduoda išlaidas. Apgalvojimas leidžia modeliui užtikrinti aukštesnę apgalvojimo kokybę, bet didina išlaidas.
Kiek apgalvojimo žetonų papildomai įtraukiama į mano sąskaitą?
Paprastai 2–3 kartus daugiau nei naivus skaičiavimas. Intensyviai naudojantiems o3 Pro apgalvojimo išlaidos gali visiškai dominuoti sąskaitoje.
Ar galiu matyti savo apgalvojimo žetonų naudojimą?
OpenAI API atsakymai apima žetonų skaičius, kurie atskirai rodo įvesties, išvesties ir apgalvojimo žetonus. Patikrinkite savo naudojimą, kad pamatytumėte realų suskirstymą.
Kaip išvengti apgalvojimo žetonų išlaidų?
Naudokite neapgalvojimo modelius (GPT-5, Claude Sonnet be mąstymo), kai apgalvojimas nereikalingas. Nustatykite apgalvojimo pastangas į low arba medium. Pirkite nuolaidų kreditus per AI Credits, kad kompensuotumėte išlaidas.
Ar apgalvojimo žetonai verti kainos?
Užduotims, kurioms tikrai reikia gilaus apgalvojimo (matematika, mokslas, sudėtinga analizė), taip. Rutininėms užduotims – ne, naudokite pigesnius modelius.
Nebūkite nustebinti apgalvojimo žetonų
Apgalvojimo žetonai yra didžiausia paslėpta 2026 m. AI sąskaitų problema. Dabar jūs žinote – ir galite planuoti jas.
Gaukite pasiūlymą aicredits.co ->
Apgalvojimo žetonai su 60 % nuolaida. Sutaupykite aicredits.co.