検証済みのOpenAI、Anthropic、Gemini、AWS、Azure、GCPクレジットを割引価格で購入。
Together AI:オープンソースモデル推論プラットフォーム
Together AIは、Llama、Mistral、DeepSeek、Qwen、Gemmaなど、200以上のオープンソースAIモデルを統一APIで提供しています。GPUインフラストラクチャを管理せずにオープンソースの柔軟性を求めるチームにとって、Togetherは2026年において最良の選択肢の一つです。
このガイドでは、Together AIの価格設定、無料クレジット、サポートされているモデル、そしてAI Credits経由での割引クレジットを利用して推論予算を拡張する方法について解説します。
検証済みのOpenAI、Anthropic、Gemini、AWS、Azure、GCPクレジットを割引価格で購入。
Together AIの価格プラン
Togetherは、モデルとパラメータ数に基づいて価格設定を行います。例:
| モデルクラス | 例示モデル | 入力/出力(Mトークンあたり) |
|---|---|---|
| Tiny (3B) | Llama 3.2 3B | $0.06/$0.06 |
| Small (8B) | Llama 3.3 8B | $0.18/$0.18 |
| Medium (70B) | Llama 3.3 70B | $0.88/$0.88 |
| Large (405B) | Llama 3.1 405B | $3.50/$3.50 |
| Mixtral 8x22B | $1.20/$1.20 | |
| DeepSeek V3 | $0.27/$1.10 |
特筆すべき機能: OpenAI/Anthropicでは出力が入力の5倍の価格になるのとは異なり、Togetherのほとんどのモデルでは入力と出力の価格が同一です。
検証済みのOpenAI、Anthropic、Gemini、AWS、Azure、GCPクレジットを割引価格で購入。
Together AIの差別化要因
オープンソースモデルの多様性
200以上のオープンソースモデルに1つのAPIからアクセス可能:
- Llamaファミリー(サイズ別3.1、3.2、3.3)
- Mistralモデル(Mixtral、Mistral 7Bバリアント)
- DeepSeek(V3、R1、Coder)
- Qwen(2.5ファミリー)
- Gemma(2ファミリー)
- コード特化型(DeepSeek Coder、CodeLlama)
- 特殊機能(関数呼び出し、ビジョンなど)
同一の入出力価格
OpenAI(GPT-5で入力$1.25 / 出力$10)とは異なり、Togetherは通常、入力と出力で同額を請求します。出力負荷の高いワークロードで大幅な節約が可能です。
ファインチューニング対応
Togetherは、あなたのデータを使用してオープンソースモデルのファインチューニングをサポートしています。OpenAIのファインチューニングよりも安価で、生成されたウェイトはあなたが所有できます。
推論の最適化
Togetherは最適化されたGPUインフラストラクチャを使用して、オープンソースモデルで高速な推論を実現します。時には、元の開発者自身がホストするよりも高速な場合があります。
Together AIの無料クレジット
Togetherは、いくつかの方法で無料クレジットを提供しています:
新規ユーザー特典
- 新規アカウントには、開始クレジットとして**$1~$25**(プロモーションによって変動)
- APIの広範なテストに十分な量
プロモーションクレジット
- 特定のモデルリリースに伴う一時的な付与
- ハッカソンやカンファレンスでの景品
スタートアッププログラム
- 限定的なスタートアップ向けクレジットプログラム
- 申請が必要
無料クレジットを超える大幅な利用には、AI Credits経由で割引クレジットを購入してください。
Together AIの使用タイミング
Together AIを使用すべき場合:
- インフラストラクチャなしでオープンソースモデルを利用したい
- コストが重要で、GPT/Claudeの代わりにLlama/Mistralの使用を検討する
- モデル所有権を伴うファインチューニングが必要
- 最大限のモデル多様性を求める
OpenAI/Anthropicを使用すべき場合:
- 最高のクローズドソースモデル(GPT-5、Claude Opus)が必要
- コーディング品質が最優先(Claude Sonnet 4.6)
- OpenAI固有の機能が必要
両方を組み合わせる:
- 大量のコスト重視のワークロードにはTogetherを使用
- 品質が重要なタスクにはClaude/GPTを使用
- AI Credits経由で割引購入し、両方を活用
コスト比較:Together vs クローズドソース
月間1億トークンの一般的なワークロードの場合:
| プロバイダー | モデル | 月額コスト |
|---|---|---|
| OpenAI | GPT-5 | $1,125 |
| Anthropic | Claude Sonnet 4.6 | $1,800 |
| Together | Llama 3.3 70B | $176 |
| Together | DeepSeek V3 | ~$70 |
Llama 3.3 70Bの品質で十分な場合、大量のワークロードでは、Togetherはクローズドソースの代替手段と比較して6~10倍のコスト削減を実現します。
よくある質問
Together AIの料金はいくらですか?
Togetherはモデルごとに料金設定を行っています。Llama 3.3 70BはMトークンあたり約$0.88(入力/出力)。Mixtral 8x22Bは$1.20。DeepSeek V3は$0.27/$1.10です。すべてAI Credits経由で割引価格で購入可能です。
Together AIはOpenAIより安いですか?
同等のオープンソースモデルであれば、はい。TogetherのLlama 3.3 70Bは、多くのタスクで同等の能力を持つGPT-5よりも劇的に安価です。
Together AIの無料クレジットはありますか?
はい、新規ユーザー向けの開始ボーナス($1~$25)や、時折行われるプロモーションを通じて提供されます。より大規模な利用には、AI Credits経由で割引クレジットを購入してください。
Together AIはどのようなモデルをホストしていますか?
Llama、Mistral、DeepSeek、Qwen、Gemma、Mixtral、および多数のコード特化型バリアントを含む200以上のオープンソースモデルです。
Together AIでモデルのファインチューニングはできますか?
はい。Togetherはあなたのデータを用いたファインチューニングをサポートしており、生成されたモデルウェイトはあなたが所有できます。OpenAIのファインチューニングよりも安価です。
Together AIと直接プロバイダーのどちらを使うべきですか?
オープンソースモデルとコスト削減を求める場合はTogetherを使用してください。クローズドソースのフラッグシップモデルが必要な場合は、直接プロバイダー(OpenAI、Anthropic)を使用してください。AI Credits経由の割引クレジットで両方を組み合わせることも可能です。
Together AI + 割引クレジット = 安価な推論
Togetherはすでに最も安価なAI推論プラットフォームの一つです。 AI Credits経由の割引クレジットを利用すれば、さらに安価になります。
クローズドソースの数分の一のコストでオープンソースAIを利用。aicredits.coで節約。