검증된 OpenAI, Anthropic, Gemini, AWS, Azure & GCP 크레딧을 할인가로 구매하세요.
Together AI: 오픈 소스 모델 추론 플랫폼
Together AI는 Llama, Mistral, DeepSeek, Qwen, Gemma를 포함한 200개 이상의 오픈 소스 AI 모델을 통합 API 뒤에 호스팅합니다. GPU 인프라를 관리하지 않고 오픈 소스 유연성을 원하는 팀에게 Together는 2026년에 가장 좋은 옵션 중 하나입니다.
이 가이드에서는 Together AI의 가격 책정, 무료 크레딧, 지원되는 모델 및 AI Credits를 통해 할인된 크레딧으로 추론 예산을 확장하는 방법을 다룹니다.
검증된 OpenAI, Anthropic, Gemini, AWS, Azure & GCP 크레딧을 할인가로 구매하세요.
Together AI 가격 등급
Together는 모델 및 매개변수 수에 따라 가격을 책정합니다. 예:
| 모델 클래스 | 예시 모델 | 입력/출력 (MTok당) |
|---|---|---|
| Tiny (3B) | Llama 3.2 3B | $0.06/$0.06 |
| Small (8B) | Llama 3.3 8B | $0.18/$0.18 |
| Medium (70B) | Llama 3.3 70B | $0.88/$0.88 |
| Large (405B) | Llama 3.1 405B | $3.50/$3.50 |
| Mixtral 8x22B | $1.20/$1.20 | |
| DeepSeek V3 | $0.27/$1.10 |
주목할 만한 기능: 대부분의 Together 모델은 OpenAI/Anthropic에서 출력이 입력보다 5배 비싼 것과 달리 동일한 입력/출력 가격을 갖습니다.
검증된 OpenAI, Anthropic, Gemini, AWS, Azure & GCP 크레딧을 할인가로 구매하세요.
Together AI의 차별점
오픈 소스 모델 다양성
하나의 API에서 200개 이상의 오픈 소스 모델에 액세스:
- Llama 제품군 (크기에 따른 3.1, 3.2, 3.3)
- Mistral 모델 (Mixtral, Mistral 7B 변형)
- DeepSeek (V3, R1, Coder)
- Qwen (2.5 제품군)
- Gemma (2 제품군)
- 코드 특화 (DeepSeek Coder, CodeLlama)
- 특수 기능 (함수 호출, 비전 등)
동일한 입력/출력 가격
OpenAI ($1.25 입력 / $10 출력 for GPT-5)와 달리 Together는 일반적으로 입력과 출력에 대해 동일한 비용을 청구합니다. 출력 집약적인 워크로드에 대한 막대한 절감 효과.
파인튜닝 가능
Together는 자체 데이터로 오픈 소스 모델을 파인튜닝하는 것을 지원합니다. OpenAI 파인튜닝보다 저렴하며 결과 가중치를 소유할 수 있습니다.
추론 최적화
Together는 최적화된 GPU 인프라를 사용하여 오픈 소스 모델에 대한 빠른 추론을 제공합니다. 때로는 원래 제작자가 호스팅하는 것보다 빠릅니다.
Together AI 무료 크레딧
Together는 여러 가지 방법으로 무료 크레딧을 제공합니다.
신규 사용자 보너스
- 신규 계정 가입 시 $1-$25의 시작 크레딧 (프로모션에 따라 다름)
- API를 광범위하게 테스트하기에 충분한 양
프로모션 크레딧
- 특정 모델 출시를 위한 간헐적인 지급
- 해커톤 및 컨퍼런스 경품
스타트업 프로그램
- 제한적인 스타트업 크레딧 프로그램
- 신청 필요
무료 크레딧을 초과하는 상당한 사용량의 경우 AI Credits를 통해 할인된 크레딧을 구매하십시오.
Together AI 사용 시기
Together를 사용해야 할 때:
- 인프라 없이 오픈 소스 모델을 원할 때
- 비용이 중요하고 GPT/Claude 대신 Llama/Mistral을 사용할 의향이 있을 때
- 모델 소유권으로 파인튜닝이 필요할 때
- 최대 모델 다양성을 원할 때
OpenAI/Anthropic을 사용해야 할 때:
- 최고의 폐쇄형 소스 모델(GPT-5, Claude Opus)이 필요할 때
- 코딩 품질이 가장 중요할 때(Claude Sonnet 4.6)
- OpenAI 전용 기능이 필요할 때
둘 다 결합:
- 대량의 비용 민감 워크로드에는 Together를 사용합니다.
- 품질이 중요한 작업에는 Claude/GPT를 사용합니다.
- AI Credits를 통해 할인된 가격으로 모두 구매합니다.
비용 비교: Together vs 폐쇄형 소스
월 1억 토큰의 일반 워크로드의 경우:
| 제공업체 | 모델 | 월별 비용 |
|---|---|---|
| OpenAI | GPT-5 | $1,125 |
| Anthropic | Claude Sonnet 4.6 | $1,800 |
| Together | Llama 3.3 70B | $176 |
| Together | DeepSeek V3 | ~$70 |
Llama 3.3 70B 품질로 충분한 대량 워크로드의 경우, Together는 폐쇄형 소스 대안에 비해 6-10배의 비용 절감 효과를 제공합니다.
자주 묻는 질문
Together AI는 얼마인가요?
Together는 모델별로 가격을 책정합니다. Llama 3.3 70B는 MTok 입력/출력당 약 $0.88입니다. Mixtral 8x22B는 $1.20입니다. DeepSeek V3는 $0.27/$1.10입니다. AI Credits를 통해 할인된 가격으로 모두 이용 가능합니다.
Together AI는 OpenAI보다 저렴한가요?
예, 동등한 오픈 소스 모델의 경우 그렇습니다. Together의 Llama 3.3 70B는 많은 작업에서 유사한 기능에 대해 GPT-5보다 훨씬 저렴합니다.
Together AI 무료 크레딧이 있나요?
예, 신규 사용자 시작 보너스($1-$25) 및 간헐적인 프로모션 지급을 통해 제공됩니다. 더 많은 사용량의 경우 AI Credits를 통해 할인된 크레딧을 구매하십시오.
Together AI는 어떤 모델을 호스팅하나요?
Llama, Mistral, DeepSeek, Qwen, Gemma, Mixtral 및 많은 코드 특화 변형을 포함하여 200개 이상의 오픈 소스 모델을 호스팅합니다.
Together AI에서 모델을 파인튜닝할 수 있나요?
예. Together는 자체 데이터로 파인튜닝을 지원하며 결과 모델 가중치를 소유할 수 있습니다. OpenAI 파인튜닝보다 저렴합니다.
Together AI 또는 직접 제공업체를 사용해야 하나요?
오픈 소스 모델 및 비용 절감을 위해 Together를 사용합니다. 폐쇄형 소스 주력 모델의 경우 직접 제공업체(OpenAI, Anthropic)를 사용합니다. AI Credits를 통해 할인된 크레딧으로 둘 다 결합합니다.
Together AI + 할인된 크레딧 = 저렴한 추론
Together는 이미 가장 저렴한 AI 추론 플랫폼 중 하나입니다. AI Credits를 통해 할인된 크레딧을 사용하면 더욱 저렴해집니다.
폐쇄형 소스 비용의 일부로 오픈 소스 AI를 이용하세요. aicredits.co에서 절약하세요.