Paslėptos dirbtinio intelekto samprotavimo žetonų išlaidos 2026 m.

Sąmoningumo žetonai padidina jūsų dirbtinio intelekto sąskaitą 2–3 kartus, nes apie tai net nežinote. Išsamus OpenAI o-serijos ir Claude sąmoningumo išlaidų vadovas, taip pat kaip sutaupyti naudojant AI Credits.

Reasoning TokensOpenAI o3AI Hidden CostsReasoning ModelsAI Credits
AI Credits

Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.

Jūsų AI sąskaita didesnė nei manote (apgalvojimo žetonai)

Sukūrėte OpenAI o3 integraciją. Kainodara nurodo 10 USD už milijoną įvesties žetonų ir 40 USD už milijoną išvesties žetonų. Biudžetą formuojate atitinkamai. Tada atvyksta jūsų pirmojo mėnesio sąskaita ir ji yra 2–3 kartus didesnė nei tikėtasi.

Kaltininkas: apgalvojimo žetonai. OpenAI o-serijos modeliai (o dabar ir kitų paslaugų teikėjų apgalvojimo režimai) generuoja paslėptus "mąstymo" žetonus, už kuriuos jums apmokestinama, bet kurių niekada nematote atsakyme.

Šis vadovas paaiškina, kas tiksliai yra apgalvojimo žetonai, kaip jie didina jūsų sąskaitą ir kaip juos kontroliuoti per protingą naudojimą ir nuolaidų kreditus per AI Credits.


AI Credits

Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.

Kas yra apgalvojimo žetonai?

Apgalvojimo žetonai yra žetonai, kuriuos modelis generuoja savo vidinio mąstymo proceso metu, prieš pateikdamas galutinį atsakymą. Naudojant tokius modelius kaip OpenAI o3, modelis:

  1. Gauna jūsų raginimą
  2. Generuoja vidinį apgalvojimą (minčių grandinę)
  3. Iteruoja ir tobulina savo apgalvojimą
  4. Generuoja galutinį matomą rezultatą

2 ir 3 veiksmai generuoja žetonus, už kuriuos jums apmokestinama, bet kurių nematote.


AI Credits

Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.

Tikroji kainodaros matematika

Ką manote, kad mokate:

Dėl OpenAI o3 (10 USD / 40 USD už MTok), užklausa su 5K įvesties + 2K išvesties žetonų:

  • Įvesties kaina: 0,05 USD -Išvesties kaina: 0,08 USD
  • Iš viso: 0,13 USD

Ką iš tikrųjų mokate:

Tas pats užklausa, bet o3 generuoja 8K apgalvojimo žetonų (skaičiuojami kaip išvestis): -Įvesties kaina: 0,05 USD -Apgalvojimo žetonų kaina: 0,32 USD -Matomo rezultato kaina: 0,08 USD

  • Iš viso: 0,45 USD

Tai 3,5 karto daugiau nei tikėtasi. Ir jūs neturite jokios matomumo į apgalvojimo dalį.


Modeliai, naudojantys apgalvojimo žetonus

OpenAI o-serija

  • o1, o1-mini - apgalvojimas įjungtas pagal numatytuosius nustatymus
  • o3, o3 Pro - platus apgalvojimas, didžiausias poveikis
  • GPT-5 su apgalvojimo režimu - apgalvojimas, kai įjungtas

Anthropic Claude

  • Claude Opus 4.6 - pratęstas mąstymo režimas (kai įjungtas)
  • Claude Sonnet 4.6 - pasirenkamas pratęstas mąstymas

Google Gemini

  • Gemini 2.5 Pro - pratęstas mąstymo režimas

DeepSeek

  • DeepSeek R1 - apgalvojimas įjungtas pagal numatytuosius nustatymus

Bendra tendencija: Bet kuris modelis, reklamuojamas kaip "apgalvojimo modelis" ar turintis "mąstymo" funkcijų, generuos paslėptus apgalvojimo žetonus.


Kiek apgalvojimo žetonų generuoja šie modeliai?

Realaus pasaulio vidurkiai:

ModelisTipiniai apgalvojimo žetonai per užklausą
GPT-5 (be apgalvojimo)0
OpenAI o1-mini500–3 000
OpenAI o32 000–15 000
OpenAI o3 Pro5 000–50 000
Claude Opus (mąstymo režimas)1 000–10 000
DeepSeek R11 000–8 000

Apgalvojimo žetonai dažnai viršija matomus išvesties žetonus 5–10 kartų. Jūsų reali kaina gali būti daug didesnė nei rodo "išvesties" dalis.


Kaip apskaičiuoti tikrąją kainą

Apgalvojimo modeliams naudokite šią pataisytą formulę:

Tikroji kaina už užklausą =
  (Įvesties žetonų * įvesties kaina)
  + ((Matomi išvesties + apgalvojimo žetonai) * išvesties kaina)

Dėl OpenAI o3 su 5K įvesties, 2K matomų išvesties, 8K apgalvojimo žetonų:

  • (5 000 * 10 USD/1M) + ((2 000 + 8 000) * 40 USD/1M)
  • = 0,05 USD + 0,40 USD
  • = 0,45 USD už užklausą

Padauginkite iš užklausų kiekio, kad gautumėte realią mėnesio kainą.


Kaip sumažinti apgalvojimo žetonų išlaidas

1. Naudokite neapgalvojimo modelius, kai įmanoma

Užduotims, kurioms nereikia gilaus apgalvojimo, naudokite standartinius modelius:

  • GPT-5 (1,25 USD / 10 USD) vietoj o3 (10 USD / 40 USD) bendram darbui
  • Claude Sonnet be mąstymo režimo rutininei analizei
  • Gemini 2.5 Flash greitiems atsakymams

Sutaupymai: 50–90 % vengiant apgalvojimo modelių neapgalvojimo užduotims.

2. Nustatykite apgalvojimo biudžeto limitus

OpenAI o3 leidžia nustatyti reasoning_effort parametrus:

  • low - minimalus apgalvojimas, pigiau
  • medium - subalansuotas
  • high - maksimalus apgalvojimas, brangiausias

Naudokite low arba medium, nebent tikrai reikalingas maksimalus apgalvojimo gylis.

3. Talpinkite apgalvojimo įvestis

Ragininimo talpinimas taikomas ir apgalvojimo modelių įvestims. Talpinkite savo raginimo dalis, kurios nesikeičia.

4. Pirkite nuolaidų kreditus per AI Credits

AI Credits parduoda nuolaidų OpenAI kreditus iki 60 % pigiau nei mažmeninė kaina. Dėl didelių apgalvojimo apkrovų tai suteikia didžiausius sutaupymus, nes apgalvojimo žetonai yra brangūs išvesties žetonai.

5. Naudokite apgalvojimo modelius tik galutiniams atsakymams

Daugiapakopiai procesai: naudokite pigius modelius tarpiniams etapams, o3/o3 Pro naudokite tik galutinei sintezei.


Tikrosios kainos palyginimas

Reikalingiems tyrimams, kuriems reikia 10 000 užklausų/mėn.:

Naivus skaičiavimas (be apgalvojimo žetonų):

  • o3: 10 000 * 0,13 USD = 1 300 USD

Tikrasis skaičiavimas (su apgalvojimo žetonais):

  • o3: 10 000 * 0,45 USD = 4 500 USD

Su AI Credits 50 % nuolaida:

  • o3 + AI Credits: 10 000 * 0,225 USD = 2 250 USD

Sutaupote 2 250 USD/mėn. palyginti su tikra mažmenine kaina.


Dažnai užduodami klausimai

Kas yra apgalvojimo žetonai?

Žetonai, generuojami apgalvojimo modelių (pvz., OpenAI o3) vidinio "mąstymo" proceso metu prieš pateikiant galutinį atsakymą. Jums apmokestinama už juos, bet niekada jų nematote.

Kodėl OpenAI ima mokestį už apgalvojimo žetonus?

Apgalvojimo žetonai naudoja realią GPU skaičiavimo galią. OpenAI perduoda išlaidas. Apgalvojimas leidžia modeliui užtikrinti aukštesnę apgalvojimo kokybę, bet didina išlaidas.

Kiek apgalvojimo žetonų papildomai įtraukiama į mano sąskaitą?

Paprastai 2–3 kartus daugiau nei naivus skaičiavimas. Intensyviai naudojantiems o3 Pro apgalvojimo išlaidos gali visiškai dominuoti sąskaitoje.

Ar galiu matyti savo apgalvojimo žetonų naudojimą?

OpenAI API atsakymai apima žetonų skaičius, kurie atskirai rodo įvesties, išvesties ir apgalvojimo žetonus. Patikrinkite savo naudojimą, kad pamatytumėte realų suskirstymą.

Kaip išvengti apgalvojimo žetonų išlaidų?

Naudokite neapgalvojimo modelius (GPT-5, Claude Sonnet be mąstymo), kai apgalvojimas nereikalingas. Nustatykite apgalvojimo pastangas į low arba medium. Pirkite nuolaidų kreditus per AI Credits, kad kompensuotumėte išlaidas.

Ar apgalvojimo žetonai verti kainos?

Užduotims, kurioms tikrai reikia gilaus apgalvojimo (matematika, mokslas, sudėtinga analizė), taip. Rutininėms užduotims – ne, naudokite pigesnius modelius.


Nebūkite nustebinti apgalvojimo žetonų

Apgalvojimo žetonai yra didžiausia paslėpta 2026 m. AI sąskaitų problema. Dabar jūs žinote – ir galite planuoti jas.

Gaukite pasiūlymą aicredits.co ->


Apgalvojimo žetonai su 60 % nuolaida. Sutaupykite aicredits.co.

AI Credits

Pirkite patikrintus OpenAI, Anthropic, Gemini, AWS, Azure ir GCP kreditus su nuolaida.