Compre créditos verificados OpenAI, Anthropic, Gemini, AWS, Azure e GCP a preços com desconto.
Together AI: Plataforma de Inferência de Modelos Open-Source
A Together AI hospeda mais de 200 modelos de IA open-source através de uma API unificada - incluindo Llama, Mistral, DeepSeek, Qwen, Gemma e dezenas de outros. Para equipas que procuram flexibilidade open-source sem gerir infraestrutura de GPU, a Together é uma das melhores opções em 2026.
Este guia aborda os preços da Together AI, créditos gratuitos, modelos suportados e como estender o seu orçamento de inferência com créditos com desconto através de AI Credits.
Compre créditos verificados OpenAI, Anthropic, Gemini, AWS, Azure e GCP a preços com desconto.
Níveis de Preços da Together AI
A Together cobra por modelo e por contagem de parâmetros. Exemplos:
| Classe de Modelo | Modelo de Exemplo | Entrada/Saída (por MTok) |
|---|---|---|
| Tiny (3B) | Llama 3.2 3B | $0.06/$0.06 |
| Small (8B) | Llama 3.3 8B | $0.18/$0.18 |
| Medium (70B) | Llama 3.3 70B | $0.88/$0.88 |
| Large (405B) | Llama 3.1 405B | $3.50/$3.50 |
| Mixtral 8x22B | $1.20/$1.20 | |
| DeepSeek V3 | $0.27/$1.10 |
Recurso Notável: A maioria dos modelos da Together tem preços de entrada/saída idênticos, ao contrário da OpenAI/Anthropic, onde a saída é 5x mais cara que a entrada.
Compre créditos verificados OpenAI, Anthropic, Gemini, AWS, Azure e GCP a preços com desconto.
O Que Torna a Together AI Diferente
Variedade de Modelos Open-Source
Acesso a mais de 200 modelos open-source numa única API:
- Família Llama (3.1, 3.2, 3.3 em vários tamanhos)
- Modelos Mistral (Mixtral, variantes Mistral 7B)
- DeepSeek (V3, R1, Coder)
- Qwen (família 2.5)
- Gemma (família 2)
- Específicos para Código (DeepSeek Coder, CodeLlama)
- Especializados (chamada de função, visão, etc.)
Preços de Entrada/Saída Idênticos
Ao contrário da OpenAI ($1.25 entrada / $10 saída para GPT-5), a Together geralmente cobra o mesmo por entrada e saída. Economias massivas em cargas de trabalho com muita saída.
Fine-Tuning Disponível
A Together suporta o fine-tuning de modelos open-source com os seus dados. Mais barato que o fine-tuning da OpenAI e você detém os pesos resultantes.
Otimização de Inferência
A Together utiliza infraestrutura de GPU otimizada para fornecer inferência rápida em modelos open-source - por vezes mais rápida do que os criadores originais os hospedam.
Créditos Gratuitos da Together AI
A Together oferece créditos gratuitos de várias formas:
Bónus para Novos Utilizadores
- $1-$25 em créditos iniciais para novas contas (varia consoante a promoção)
- Suficiente para testar a API extensivamente
Créditos Promocionais
- Concessões ocasionais para lançamentos de modelos específicos
- Ofertas de hackathons e conferências
Programa para Startups
- Programa limitado de crédito para startups
- Requer candidatura
Para uso substancial além dos créditos gratuitos, compre créditos com desconto através de AI Credits.
Quando Usar a Together AI
Use a Together quando:
- Quer modelos open-source sem infraestrutura
- O custo é importante e está disposto a usar Llama/Mistral em vez de GPT/Claude
- Precisa de fine-tuning com posse do modelo
- Quer a máxima variedade de modelos
Use OpenAI/Anthropic quando:
- Precisa dos melhores modelos fechados (GPT-5, Claude Opus)
- A qualidade do código é primordial (Claude Sonnet 4.6)
- Precisa de funcionalidades específicas da OpenAI
Combine ambas:
- Use a Together para cargas de trabalho de alto volume e sensíveis ao custo
- Use Claude/GPT para tarefas críticas de qualidade
- Compre ambas com desconto através de AI Credits
Comparação de Custos: Together vs. Fechado
Para 100 milhões de tokens/mês de cargas de trabalho gerais:
| Provedor | Modelo | Custo Mensal |
|---|---|---|
| OpenAI | GPT-5 | $1,125 |
| Anthropic | Claude Sonnet 4.6 | $1,800 |
| Together | Llama 3.3 70B | $176 |
| Together | DeepSeek V3 | ~$70 |
Para cargas de trabalho de alto volume onde a qualidade do Llama 3.3 70B é suficiente, a Together oferece economias de 6-10x em comparação com alternativas fechadas.
Perguntas Frequentes
Quanto custa a Together AI?
A Together cobra por modelo. Llama 3.3 70B custa ~$0.88 por MTok de entrada/saída. Mixtral 8x22B é $1.20. DeepSeek V3 é $0.27/$1.10. Todos disponíveis com desconto através de AI Credits.
A Together AI é mais barata que a OpenAI?
Sim, para modelos open-source equivalentes. Llama 3.3 70B na Together é drasticamente mais barato que GPT-5 para capacidade semelhante em muitas tarefas.
Existem créditos gratuitos da Together AI?
Sim, através de bónus iniciais para novos utilizadores ($1-$25) e ofertas promocionais ocasionais. Para uso mais substancial, compre créditos com desconto através de AI Credits.
Que modelos a Together AI hospeda?
Mais de 200 modelos open-source, incluindo Llama, Mistral, DeepSeek, Qwen, Gemma, Mixtral e muitas variantes específicas para código.
Posso fazer fine-tuning de modelos na Together AI?
Sim. A Together suporta fine-tuning com os seus dados e você mantém os pesos do modelo resultante. Mais barato que o fine-tuning da OpenAI.
Devo usar a Together AI ou provedores diretos?
Use a Together para modelos open-source e economias de custo. Use provedores diretos (OpenAI, Anthropic) para os principais modelos fechados. Combine ambos com créditos com desconto através de AI Credits.
Together AI + Créditos com Desconto = Inferência Barata
A Together já é uma das plataformas de inferência de IA mais baratas. Com créditos com desconto através de AI Credits, torna-se ainda mais barata.
Obtenha uma cotação em aicredits.co ->
IA Open-source a uma fração do custo de modelos fechados. Poupe em aicredits.co.