AI Models

356 모델 무료 & Paid Cập nhật: 13 hours trước

Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7...

by |4월 2026 |262K context |Miễn phí input |Miễn phí output
262K tokens

그록 4.20 Multi-Agent is a variant of xAI’s Grok 4.20 협업을 위해 설계된, 에이전트 기반 워크플로. 여러 에이전트가 병렬로 작동하여 심층적인 연구를 수행합니다., 좌표 도구 사용, and synthesize information...

by |3 월 2026 |2M context |$2.00/M input |$6.00/M output
2M tokens

그록 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering...

by |3 월 2026 |2M context |$1.25/M input |$2.50/M output
2M tokens

Full-length songs are priced at $0.08 per song. Lyria 3 is Google's family of music generation models, available through the Gemini API. With Lyria 3, you can generate high-quality, 48kHz...

by |3 월 2026 |1M context |Miễn phí input |Miễn phí output
1M tokens

30 second duration clips are priced at $0.04 per clip. Lyria 3 is Google's family of music generation models, available through the Gemini API. With Lyria 3, you can generate...

by |3 월 2026 |1M context |Miễn phí input |Miễn phí output
1M tokens

KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration. It builds on the agentic coding strengths of earlier versions,...

by |3 월 2026 |256K context |$0.3000/M input |$1.20/M output
256K tokens

Reka Edge is an extremely efficient 7B multimodal vision-language model that accepts image/video+text inputs and generates text outputs. This model is optimized specifically to deliver industry-leading performance in image understanding,...

by |3 월 2026 |16K context |$0.1000/M input |$0.1000/M output

MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture. It combines strong multimodal perception with agentic capability - visual grounding, multi-step...

by |3 월 2026 |262K context |$0.4000/M input |$2.00/M output
262K tokens

MiMo-V2-Pro is Xiaomi's flagship foundation model, featuring over 1T total parameters and a 1M context length, deeply optimized for agentic scenarios. It is highly adaptable to general agent frameworks like...

by |3 월 2026 |1M context |$1.00/M input |$3.00/M output
1M tokens

MiniMax-M2.7 is a next-generation large language model designed for autonomous, real-world productivity and continuous improvement. Built to actively participate in its own evolution, M2.7 integrates advanced agentic capabilities through multi-agent...

by |3 월 2026 |205K context |$0.2790/M input |$1.20/M output
205K tokens

GPT-5.4 nano는 GPT-5.4 제품군 중 가장 가볍고 비용 효율적인 변형입니다., 속도가 중요한 대용량 작업에 최적화됨. It supports text and image inputs and is designed for low-latency...

by |3 월 2026 |400K context |$0.2000/M input |$1.25/M output
400K tokens

GPT-5.4 mini는 GPT-5.4의 핵심 기능을 더욱 빠르게 제공합니다., 처리량이 많은 워크로드에 최적화된 보다 효율적인 모델. 추론 전반에 걸쳐 강력한 성능으로 텍스트 및 이미지 입력을 지원합니다., 코딩,...

by |3 월 2026 |400K context |$0.7500/M input |$4.50/M output
400K tokens

미스트랄 스몰 4 Mistral Small 제품군의 다음 주요 릴리스입니다., 여러 주력 Mistral 모델의 기능을 단일 시스템으로 통합. It combines strong reasoning from...

by |3 월 2026 |262K context |$0.1500/M input |$0.6000/M output
262K tokens

GLM-5 Turbo는 OpenClaw 시나리오와 같은 에이전트 중심 환경에서 빠른 추론과 강력한 성능을 위해 설계된 Z.ai의 새로운 모델입니다.. It is deeply optimized for real-world agent workflows...

by |3 월 2026 |203K context |$1.20/M input |$4.00/M output
203K tokens

엔비디아 네모트론 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...

by |3 월 2026 |1M context |Miễn phí input |Miễn phí output
1M tokens

엔비디아 네모트론 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...

by |3 월 2026 |1M context |$0.0900/M input |$0.4500/M output
1M tokens

Seed-2.0-Lite is a versatile, cost‑efficient enterprise workhorse that delivers strong multimodal and agent capabilities while offering noticeably lower latency, making it a practical default choice for most production workloads across...

by |3 월 2026 |262K context |$0.2500/M input |$2.00/M output
262K tokens

Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, 코딩, and visual understanding in an efficient 9B-parameter architecture. It uses a unified vision-language design...

by |3 월 2026 |262K context |$0.0400/M input |$0.1500/M output
262K tokens

GPT-5.4 Pro is OpenAI's most advanced model, building on GPT-5.4's unified architecture with enhanced reasoning capabilities for complex, high-stakes tasks. It features a 1M+ token context window (922K input, 128K...

by |3 월 2026 |1.1M context |$30.00/M input |$180.00/M output
1.1M tokens

GPT-5.4 is OpenAI’s latest frontier model, unifying the Codex and GPT lines into a single system. It features a 1M+ token context window (922K input, 128K output) with support for...

by |3 월 2026 |1.1M context |$2.50/M input |$15.00/M output
1.1M tokens

Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM). Instead of generating tokens sequentially, Mercury 2 produces and refines multiple tokens in parallel, achieving...

by |3 월 2026 |128K context |$0.2500/M input |$0.7500/M output
128K tokens

GPT-5.3 Chat is an update to ChatGPT's most-used model that makes everyday conversations smoother, more useful, and more directly helpful. It delivers more accurate answers with better contextualization and significantly...

by |3 월 2026 |128K context |$1.75/M input |$14.00/M output
128K tokens

쌍둥이자리 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

by |3 월 2026 |1M context |$0.2500/M input |$1.50/M output
1M tokens

Seed-2.0-mini targets latency-sensitive, high-concurrency, and cost-sensitive scenarios, emphasizing fast response and flexible inference deployment. It delivers performance comparable to ByteDance-Seed-1.6, supports 256k context, four reasoning effort modes (minimal/low/medium/high), multimodal understanding,...

by |2월 2026 |262K context |$0.1000/M input |$0.4000/M output
262K tokens

쌍둥이자리 3.1 Flash Image Preview, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines...

by |2월 2026 |131K context |$0.5000/M input |$3.00/M output
131K tokens

Qwen3.5 시리즈 35B-A3B는 선형 주의 메커니즘과 희소 전문가 혼합 모델을 통합하는 하이브리드 아키텍처로 설계된 기본 비전 언어 모델입니다., 더 높은 추론 효율성 달성. Its overall...

by |2월 2026 |262K context |$0.1400/M input |$1.00/M output
262K tokens

Qwen3.5 27B 기본 비전 언어 Dense 모델에는 선형 주의 메커니즘이 통합되어 있습니다., 추론 속도와 성능의 균형을 유지하면서 빠른 응답 시간 제공. Its overall capabilities are comparable to those of...

by |2월 2026 |262K context |$0.1950/M input |$1.56/M output
262K tokens

Qwen3.5 122B-A10B 기본 비전 언어 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. In terms of...

by |2월 2026 |262K context |$0.2600/M input |$2.08/M output
262K tokens

Qwen3.5 기본 비전 언어 플래시 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. Compared to the...

by |2월 2026 |1M context |$0.0650/M input |$0.2600/M output
1M tokens

LFM2-24B-A2B는 효율적인 장치 내 배포를 위해 설계된 하이브리드 아키텍처의 LFM2 제품군에서 가장 큰 모델입니다.. Built as a 24B parameter Mixture-of-Experts model with only 2B active parameters per...

by |2월 2026 |128K context |$0.0300/M input |$0.1200/M output
128K tokens

쌍둥이자리 3.1 Pro Preview Custom Tools는 Gemini의 변형입니다. 3.1 Pro that improves tool selection behavior by preventing overuse of a general bash tool when more efficient third-party...

by |2월 2026 |1M context |$2.00/M input |$12.00/M output
1M tokens

GPT-5.3-Codex는 OpenAI의 가장 진보된 에이전트 코딩 모델입니다., GPT-5.2-Codex의 첨단 소프트웨어 엔지니어링 성능과 GPT-5.2의 광범위한 추론 및 전문 지식 기능을 결합합니다.. It achieves state-of-the-art results...

by |2월 2026 |400K context |$1.75/M input |$14.00/M output
400K tokens

Aion-2.0은 몰입형 롤플레잉 및 스토리텔링에 최적화된 DeepSeek V3.2의 변형입니다.. It is particularly strong at introducing tension, crises, and conflict into stories, making narratives feel more engaging....

by |2월 2026 |131K context |$0.8000/M input |$1.60/M output
131K tokens

쌍둥이자리 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows. Building on the multimodal foundation...

by |2월 2026 |1M context |$2.00/M input |$12.00/M output
1M tokens

Sonnet 4.6 is Anthropic's most capable Sonnet-class model yet, with frontier performance across coding, agents, and professional work. It excels at iterative development, complex codebase navigation, end-to-end project management with...

by |2월 2026 |1M context |$3.00/M input |$15.00/M output
1M tokens

Qwen3.5 기본 비전 언어 시리즈 Plus 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. In a variety of...

by |2월 2026 |1M context |$0.2600/M input |$1.56/M output
1M tokens

Qwen3.5 시리즈 397B-A17B 기본 비전 언어 모델은 선형 주의 메커니즘과 희소 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. It delivers...

by |2월 2026 |262K context |$0.3900/M input |$2.34/M output
262K tokens

MiniMax-M2.5는 실제 생산성을 위해 설계된 SOTA 대규모 언어 모델입니다.. 다양하고 복잡한 실제 디지털 작업 환경에서 교육을 받았습니다., M2.5 builds upon the coding expertise of M2.1...

by |2월 2026 |205K context |Miễn phí input |Miễn phí output
205K tokens

MiniMax-M2.5는 실제 생산성을 위해 설계된 SOTA 대규모 언어 모델입니다.. 다양하고 복잡한 실제 디지털 작업 환경에서 교육을 받았습니다., M2.5 builds upon the coding expertise of M2.1...

by |2월 2026 |205K context |$0.1500/M input |$1.15/M output
205K tokens

GLM-5는 복잡한 시스템 설계 및 장거리 에이전트 워크플로를 위해 설계된 Z.ai의 대표적인 오픈 소스 기반 모델입니다.. 전문 개발자를 위해 제작됨, 대규모 프로그래밍 작업에서 프로덕션급 성능을 제공합니다., rivaling leading...

by |2월 2026 |203K context |$0.6000/M input |$1.92/M output
203K tokens

Qwen3-Max-Thinking은 Qwen3 시리즈의 대표적인 추론 모델입니다., 심층적인 지식이 필요한 고부담 인지 작업을 위해 설계되었습니다., 다단계 추론. 모델 용량과 강화 학습 컴퓨팅을 크게 확장하여, it...

by |2월 2026 |262K context |$0.7800/M input |$3.90/M output
262K tokens

작 4.6 코딩 및 장기 실행 전문 작업을 위한 Anthropic의 가장 강력한 모델입니다.. 단일 프롬프트가 아닌 전체 워크플로에서 작동하는 상담원을 위해 만들어졌습니다., making it especially effective...

by |2월 2026 |1M context |$5.00/M input |$25.00/M output
1M tokens

Qwen3-Coder-Next는 코딩 에이전트 및 로컬 개발 워크플로에 최적화된 개방형 인과 언어 모델입니다.. It uses a sparse MoE design with 80B total parameters and only 3B activated per...

by |2월 2026 |262K context |$0.1100/M input |$0.8000/M output
262K tokens

무료 추론을 얻는 가장 간단한 방법. openrouter/free는 OpenRouter에서 사용 가능한 모델 중에서 무료 모델을 무작위로 선택하는 라우터입니다.. The router smartly filters for models that...

by |2월 2026 |200K context |Miễn phí input |Miễn phí output
200K tokens

단계 3.5 Flash is StepFun's most capable open-source foundation model. Built on a sparse Mixture of Experts (MoE) architecture, it selectively activates only 11B of its 196B parameters per token....

by |Jan 2026 |262K context |$0.1000/M input |$0.3000/M output
262K tokens

Trinity-Large-Preview is a frontier-scale open-weight language model from Arcee, built as a 400B-parameter sparse Mixture-of-Experts with 13B active parameters per token using 4-of-256 expert routing. It excels in creative writing,...

by |Jan 2026 |131K context |$0.1500/M input |$0.4500/M output
131K tokens

Kimi K2.5 is Moonshot AI's native multimodal model, delivering state-of-the-art visual coding capability and a self-directed agent swarm paradigm. Built on Kimi K2 with continued pretraining over approximately 15T mixed...

by |Jan 2026 |262K context |$0.4000/M input |$1.90/M output
262K tokens

Solar Pro 3 is Upstage's powerful Mixture-of-Experts (MoE) language model. With 102B total parameters and 12B active parameters per forward pass, it delivers exceptional performance while maintaining computational efficiency. Optimized...

by |Jan 2026 |128K context |$0.1500/M input |$0.6000/M output
128K tokens

MiniMax M2-her is a dialogue-first large language model built for immersive roleplay, character-driven chat, and expressive multi-turn conversations. Designed to stay consistent in tone and personality, it supports rich message...

by |Jan 2026 |66K context |$0.3000/M input |$1.20/M output
66K tokens

Palmyra X5 is Writer's most advanced model, 기업 전체에서 AI 에이전트를 구축하고 확장하기 위해 특별히 제작되었습니다.. 컨텍스트 창에서 업계 최고의 속도와 효율성을 제공합니다. 1 million...

by |Jan 2026 |1M context |$0.6000/M input |$6.00/M output
1M tokens