اعتبارهای تأیید شده OpenAI، Anthropic، Gemini، AWS، Azure و GCP را با قیمت های تخفیف دار خریداری کنید.
صورتحساب هوش مصنوعی شما بیشتر از آنچه فکر می کنید است (توکن های استدلال)
شما یکپارچهسازی OpenAI o3 را راهاندازی کردید. قیمتگذاری ۱۰ دلار در هر میلیون توکن ورودی و ۴۰ دلار در هر میلیون توکن خروجی است. شما بر اساس آن بودجهبندی میکنید. سپس صورتحساب ماه اول شما میرسد و ۲-۳ برابر بیشتر از حد انتظار است.
مقصر: توکنهای استدلال. مدلهای سری o OpenAI (و اکنون حالتهای استدلال در سایر ارائهدهندگان) توکنهای "تفکر" پنهانی تولید میکنند که هزینه آنها را پرداخت میکنید اما هرگز در پاسخ نمیبینید.
این راهنما دقیقاً توضیح میدهد که توکنهای استدلال چیستند، چگونه صورتحساب شما را افزایش میدهند و چگونه از طریق استفاده هوشمندانه و اعتبارات تخفیفدار از طریق AI Credits آنها را کنترل کنید.
اعتبارهای تأیید شده OpenAI، Anthropic، Gemini، AWS، Azure و GCP را با قیمت های تخفیف دار خریداری کنید.
توکنهای استدلال چیستند؟
توکنهای استدلال توکنهایی هستند که مدل در طول فرآیند تفکر داخلی خود قبل از تولید پاسخ نهایی تولید میکند. با مدلهایی مانند OpenAI o3، مدل:
- درخواست شما را دریافت میکند
- استدلال داخلی (زنجیره تفکر) را تولید میکند
- استدلال خود را تکرار و اصلاح میکند
- خروجی نهایی قابل مشاهده را تولید میکند
مراحل ۲ و ۳ توکنهایی را تولید میکنند که هزینه آنها را پرداخت میکنید اما آنها را نمیبینید.
اعتبارهای تأیید شده OpenAI، Anthropic، Gemini، AWS، Azure و GCP را با قیمت های تخفیف دار خریداری کنید.
ریاضیات واقعی قیمتگذاری
آنچه فکر میکنید پرداخت میکنید:
برای OpenAI o3 (۱۰ دلار / ۴۰ دلار در هر MTok)، یک پرس و جو با ۵ هزار توکن ورودی + ۲ هزار توکن خروجی:
- هزینه ورودی: ۰.۰۵ دلار
- هزینه خروجی: ۰.۰۸ دلار
- کل: ۰.۱۳ دلار
آنچه در واقع پرداخت میکنید:
همان پرس و جو، اما o3 تعداد ۸ هزار توکن استدلال را تولید میکند (به عنوان خروجی محاسبه میشود):
- هزینه ورودی: ۰.۰۵ دلار
- هزینه توکنهای استدلال: ۰.۳۲ دلار
- هزینه خروجی قابل مشاهده: ۰.۰۸ دلار
- کل: ۰.۴۵ دلار
این ۳.۵ برابر بیشتر از حد انتظار است. و شما هیچ دیدی نسبت به بخش استدلال ندارید.
مدلهایی که از توکنهای استدلال استفاده میکنند
OpenAI o-series
- o1, o1-mini - استدلال به طور پیشفرض فعال است
- o3, o3 Pro - استدلال گسترده، بیشترین تأثیر
- GPT-5 با حالت استدلال - استدلال در صورت فعال بودن
Anthropic Claude
- Claude Opus 4.6 - حالت تفکر گسترده (در صورت فعال بودن)
- Claude Sonnet 4.6 - تفکر اختیاری گسترده
Google Gemini
- Gemini 2.5 Pro - حالت تفکر گسترده
DeepSeek
- DeepSeek R1 - استدلال به طور پیشفرض فعال است
الگوی رایج: هر مدلی که به عنوان "مدل استدلال" یا با ویژگیهای "تفکر" بازاریابی میشود، توکنهای استدلال پنهان تولید خواهد کرد.
این مدلها چه تعداد توکن استدلال تولید میکنند؟
میانگینهای دنیای واقعی:
| مدل | توکنهای استدلال معمول در هر پرس و جو |
|---|---|
| GPT-5 (بدون استدلال) | ۰ |
| OpenAI o1-mini | ۵۰۰-۳۰۰۰ |
| OpenAI o3 | ۲۰۰۰-۱۵۰۰۰ |
| OpenAI o3 Pro | ۵۰۰۰-۵۰۰۰۰ |
| Claude Opus (حالت تفکر) | ۱۰۰۰-۱۰۰۰۰ |
| DeepSeek R1 | ۱۰۰۰-۸۰۰۰ |
توکنهای استدلال اغلب ۵-۱۰ برابر توکنهای خروجی قابل مشاهده هستند. هزینه واقعی شما میتواند بسیار بیشتر از آنچه بخش "خروجی" نشان میدهد باشد.
نحوه محاسبه هزینه واقعی
برای مدلهای استدلال، از این فرمول اصلاح شده استفاده کنید:
هزینه واقعی در هر پرس و جو =
(توکنهای ورودی * قیمت ورودی)
+ ((خروجی قابل مشاهده + توکنهای استدلال) * قیمت خروجی)
برای OpenAI o3 با ۵ هزار ورودی، ۲ هزار خروجی قابل مشاهده، ۸ هزار توکن استدلال:
- (۵۰۰۰ * ۱۰ دلار / ۱ میلیون) + ((۲۰۰۰ + ۸۰۰۰) * ۴۰ دلار / ۱ میلیون)
- = ۰.۰۵ دلار + ۰.۴۰ دلار
- = ۰.۴۵ دلار در هر پرس و جو
برای به دست آوردن هزینه واقعی ماهانه، آن را در حجم پرس و جو ضرب کنید.
نحوه کاهش هزینههای توکن استدلال
۱. در صورت امکان از مدلهای بدون استدلال استفاده کنید
برای وظایفی که نیاز به استدلال عمیق ندارند، از مدلهای استاندارد استفاده کنید:
- GPT-5 (۱.۲۵ دلار / ۱۰ دلار) به جای o3 (۱۰ دلار / ۴۰ دلار) برای کارهای عمومی
- Claude Sonnet بدون حالت تفکر برای تحلیل معمول
- Gemini 2.5 Flash برای پاسخهای سریع
صرفهجویی: ۵۰-۹۰٪ با اجتناب از مدلهای استدلال برای وظایف غیر استدلالی.
۲. محدودیت بودجه استدلال را تعیین کنید
OpenAI o3 به شما امکان میدهد پارامترهای reasoning_effort را تنظیم کنید:
low- حداقل استدلال، ارزانترmedium- متعادلhigh- حداکثر استدلال، گرانترین
مگر اینکه واقعاً به حداکثر عمق استدلال نیاز داشته باشید، از low یا medium استفاده کنید.
۳. ورودیهای استدلال را کش کنید
کش کردن درخواست به ورودیهای مدل استدلال نیز اعمال میشود. قسمتهایی از درخواست خود را که تغییر نمیکنند کش کنید.
۴. اعتبارات تخفیفدار را از طریق AI Credits بخرید
AI Credits اعتبارات OpenAI را با تخفیف تا ۶۰٪ کمتر از قیمت خردهفروشی میفروشد. برای بارهای کاری با استدلال سنگین، این بیشترین صرفهجویی را به همراه دارد زیرا توکنهای استدلال توکنهای خروجی گرانقیمتی هستند.
۵. از مدلهای استدلال فقط برای پاسخهای نهایی استفاده کنید
خطوط لوله چند مرحلهای: از مدلهای ارزان برای مراحل میانی استفاده کنید، فقط از o3/o3 Pro برای سنتز نهایی استفاده کنید.
مقایسه هزینه واقعی
برای حجم کاری تحقیقاتی ۱۰,۰۰۰ پرس و جو در ماه:
محاسبه سطحی (بدون توکن استدلال):
- o3: ۱۰,۰۰۰ * ۰.۱۳ دلار = ۱,۳۰۰ دلار
محاسبه واقعی (با توکنهای استدلال):
- o3: ۱۰,۰۰۰ * ۰.۴۵ دلار = ۴,۵۰۰ دلار
با AI Credits با تخفیف ۵۰٪:
- o3 + AI Credits: ۱۰,۰۰۰ * ۰.۲۲۵ دلار = ۲,۲۵۰ دلار
صرفهجویی ۲,۲۵۰ دلار در ماه در مقایسه با هزینه واقعی خردهفروشی.
سوالات متداول
توکنهای استدلال چیستند؟
توکنهایی که توسط مدلهای استدلال (مانند OpenAI o3) در طول فرآیند "تفکر" داخلی خود قبل از تولید پاسخ نهایی تولید میشوند. شما هزینه آنها را پرداخت میکنید اما هرگز آنها را نمیبینید.
چرا OpenAI هزینه توکنهای استدلال را دریافت میکند؟
توکنهای استدلال از توان پردازشی واقعی GPU استفاده میکنند. OpenAI هزینه را منتقل میکند. استدلال کیفیت استدلال مدل را بهبود میبخشد اما هزینهها را افزایش میدهد.
توکنهای استدلال چقدر به صورتحساب من اضافه میکنند؟
معمولاً ۲-۳ برابر محاسبه سطحی. برای کاربران سنگین o3 Pro، هزینههای استدلال میتواند به طور کامل صورتحساب را تحت تأثیر قرار دهد.
آیا میتوانم استفاده از توکنهای استدلال خود را ببینم؟
پاسخهای API OpenAI شامل شمارش توکنهایی است که توکنهای ورودی، خروجی و استدلال را به طور جداگانه نشان میدهند. استفاده خود را بررسی کنید تا تفکیک واقعی را ببینید.
چگونه از هزینههای توکن استدلال اجتناب کنم؟
در صورت عدم نیاز به استدلال، از مدلهای بدون استدلال (GPT-5، Claude Sonnet بدون تفکر) استفاده کنید. تلاش استدلال را روی low یا medium تنظیم کنید. اعتبارات تخفیفدار را از طریق AI Credits بخرید تا هزینهها را جبران کنید.
آیا توکنهای استدلال ارزش هزینه را دارند؟
برای وظایفی که واقعاً نیاز به استدلال عمیق دارند (ریاضی، علوم، تحلیل پیچیده)، بله. برای وظایف معمول، خیر - از مدلهای ارزانتر استفاده کنید.
با توکنهای استدلال غافلگیر نشوید
توکنهای استدلال بزرگترین هزینه پنهان در صورتحساب هوش مصنوعی سال ۲۰۲۶ هستند. اکنون شما میدانید - و میتوانید برای آنها برنامهریزی کنید.
در aicredits.co قیمت دریافت کنید ->
توکنهای استدلال با تخفیف ۶۰٪. در aicredits.co صرفهجویی کنید.