Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7...
AI Models
그록 4.20 Multi-Agent is a variant of xAI’s Grok 4.20 협업을 위해 설계된, 에이전트 기반 워크플로. 여러 에이전트가 병렬로 작동하여 심층적인 연구를 수행합니다., 좌표 도구 사용, and synthesize information...
그록 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering...
Full-length songs are priced at $0.08 per song. Lyria 3 is Google's family of music generation models, available through the Gemini API. With Lyria 3, you can generate high-quality, 48kHz...
30 second duration clips are priced at $0.04 per clip. Lyria 3 is Google's family of music generation models, available through the Gemini API. With Lyria 3, you can generate...
KAT-Coder-Pro V2 is the latest high-performance model in KwaiKAT’s KAT-Coder series, designed for complex enterprise-grade software engineering and SaaS integration. It builds on the agentic coding strengths of earlier versions,...
Reka Edge is an extremely efficient 7B multimodal vision-language model that accepts image/video+text inputs and generates text outputs. This model is optimized specifically to deliver industry-leading performance in image understanding,...
MiMo-V2-Omni is a frontier omni-modal model that natively processes image, video, and audio inputs within a unified architecture. It combines strong multimodal perception with agentic capability - visual grounding, multi-step...
MiMo-V2-Pro is Xiaomi's flagship foundation model, featuring over 1T total parameters and a 1M context length, deeply optimized for agentic scenarios. It is highly adaptable to general agent frameworks like...
MiniMax-M2.7 is a next-generation large language model designed for autonomous, real-world productivity and continuous improvement. Built to actively participate in its own evolution, M2.7 integrates advanced agentic capabilities through multi-agent...
GPT-5.4 nano는 GPT-5.4 제품군 중 가장 가볍고 비용 효율적인 변형입니다., 속도가 중요한 대용량 작업에 최적화됨. It supports text and image inputs and is designed for low-latency...
GPT-5.4 mini는 GPT-5.4의 핵심 기능을 더욱 빠르게 제공합니다., 처리량이 많은 워크로드에 최적화된 보다 효율적인 모델. 추론 전반에 걸쳐 강력한 성능으로 텍스트 및 이미지 입력을 지원합니다., 코딩,...
미스트랄 스몰 4 Mistral Small 제품군의 다음 주요 릴리스입니다., 여러 주력 Mistral 모델의 기능을 단일 시스템으로 통합. It combines strong reasoning from...
GLM-5 Turbo는 OpenClaw 시나리오와 같은 에이전트 중심 환경에서 빠른 추론과 강력한 성능을 위해 설계된 Z.ai의 새로운 모델입니다.. It is deeply optimized for real-world agent workflows...
엔비디아 네모트론 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...
엔비디아 네모트론 3 Super is a 120B-parameter open hybrid MoE model, activating just 12B parameters for maximum compute efficiency and accuracy in complex multi-agent applications. Built on a hybrid Mamba-Transformer...
Seed-2.0-Lite is a versatile, cost‑efficient enterprise workhorse that delivers strong multimodal and agent capabilities while offering noticeably lower latency, making it a practical default choice for most production workloads across...
Qwen3.5-9B is a multimodal foundation model from the Qwen3.5 family, designed to deliver strong reasoning, 코딩, and visual understanding in an efficient 9B-parameter architecture. It uses a unified vision-language design...
GPT-5.4 Pro is OpenAI's most advanced model, building on GPT-5.4's unified architecture with enhanced reasoning capabilities for complex, high-stakes tasks. It features a 1M+ token context window (922K input, 128K...
GPT-5.4 is OpenAI’s latest frontier model, unifying the Codex and GPT lines into a single system. It features a 1M+ token context window (922K input, 128K output) with support for...
Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM). Instead of generating tokens sequentially, Mercury 2 produces and refines multiple tokens in parallel, achieving...
GPT-5.3 Chat is an update to ChatGPT's most-used model that makes everyday conversations smoother, more useful, and more directly helpful. It delivers more accurate answers with better contextualization and significantly...
쌍둥이자리 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...
Seed-2.0-mini targets latency-sensitive, high-concurrency, and cost-sensitive scenarios, emphasizing fast response and flexible inference deployment. It delivers performance comparable to ByteDance-Seed-1.6, supports 256k context, four reasoning effort modes (minimal/low/medium/high), multimodal understanding,...
쌍둥이자리 3.1 Flash Image Preview, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines...
Qwen3.5 시리즈 35B-A3B는 선형 주의 메커니즘과 희소 전문가 혼합 모델을 통합하는 하이브리드 아키텍처로 설계된 기본 비전 언어 모델입니다., 더 높은 추론 효율성 달성. Its overall...
Qwen3.5 27B 기본 비전 언어 Dense 모델에는 선형 주의 메커니즘이 통합되어 있습니다., 추론 속도와 성능의 균형을 유지하면서 빠른 응답 시간 제공. Its overall capabilities are comparable to those of...
Qwen3.5 122B-A10B 기본 비전 언어 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. In terms of...
Qwen3.5 기본 비전 언어 플래시 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. Compared to the...
LFM2-24B-A2B는 효율적인 장치 내 배포를 위해 설계된 하이브리드 아키텍처의 LFM2 제품군에서 가장 큰 모델입니다.. Built as a 24B parameter Mixture-of-Experts model with only 2B active parameters per...
쌍둥이자리 3.1 Pro Preview Custom Tools는 Gemini의 변형입니다. 3.1 Pro that improves tool selection behavior by preventing overuse of a general bash tool when more efficient third-party...
GPT-5.3-Codex는 OpenAI의 가장 진보된 에이전트 코딩 모델입니다., GPT-5.2-Codex의 첨단 소프트웨어 엔지니어링 성능과 GPT-5.2의 광범위한 추론 및 전문 지식 기능을 결합합니다.. It achieves state-of-the-art results...
Aion-2.0은 몰입형 롤플레잉 및 스토리텔링에 최적화된 DeepSeek V3.2의 변형입니다.. It is particularly strong at introducing tension, crises, and conflict into stories, making narratives feel more engaging....
쌍둥이자리 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows. Building on the multimodal foundation...
Sonnet 4.6 is Anthropic's most capable Sonnet-class model yet, with frontier performance across coding, agents, and professional work. It excels at iterative development, complex codebase navigation, end-to-end project management with...
Qwen3.5 기본 비전 언어 시리즈 Plus 모델은 선형 주의 메커니즘과 희박한 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. In a variety of...
Qwen3.5 시리즈 397B-A17B 기본 비전 언어 모델은 선형 주의 메커니즘과 희소 전문가 혼합 모델을 통합하는 하이브리드 아키텍처를 기반으로 구축되었습니다., 더 높은 추론 효율성 달성. It delivers...
MiniMax-M2.5는 실제 생산성을 위해 설계된 SOTA 대규모 언어 모델입니다.. 다양하고 복잡한 실제 디지털 작업 환경에서 교육을 받았습니다., M2.5 builds upon the coding expertise of M2.1...
MiniMax-M2.5는 실제 생산성을 위해 설계된 SOTA 대규모 언어 모델입니다.. 다양하고 복잡한 실제 디지털 작업 환경에서 교육을 받았습니다., M2.5 builds upon the coding expertise of M2.1...
GLM-5는 복잡한 시스템 설계 및 장거리 에이전트 워크플로를 위해 설계된 Z.ai의 대표적인 오픈 소스 기반 모델입니다.. 전문 개발자를 위해 제작됨, 대규모 프로그래밍 작업에서 프로덕션급 성능을 제공합니다., rivaling leading...
Qwen3-Max-Thinking은 Qwen3 시리즈의 대표적인 추론 모델입니다., 심층적인 지식이 필요한 고부담 인지 작업을 위해 설계되었습니다., 다단계 추론. 모델 용량과 강화 학습 컴퓨팅을 크게 확장하여, it...
작 4.6 코딩 및 장기 실행 전문 작업을 위한 Anthropic의 가장 강력한 모델입니다.. 단일 프롬프트가 아닌 전체 워크플로에서 작동하는 상담원을 위해 만들어졌습니다., making it especially effective...
Qwen3-Coder-Next는 코딩 에이전트 및 로컬 개발 워크플로에 최적화된 개방형 인과 언어 모델입니다.. It uses a sparse MoE design with 80B total parameters and only 3B activated per...
무료 추론을 얻는 가장 간단한 방법. openrouter/free는 OpenRouter에서 사용 가능한 모델 중에서 무료 모델을 무작위로 선택하는 라우터입니다.. The router smartly filters for models that...
단계 3.5 Flash is StepFun's most capable open-source foundation model. Built on a sparse Mixture of Experts (MoE) architecture, it selectively activates only 11B of its 196B parameters per token....
Trinity-Large-Preview is a frontier-scale open-weight language model from Arcee, built as a 400B-parameter sparse Mixture-of-Experts with 13B active parameters per token using 4-of-256 expert routing. It excels in creative writing,...
Kimi K2.5 is Moonshot AI's native multimodal model, delivering state-of-the-art visual coding capability and a self-directed agent swarm paradigm. Built on Kimi K2 with continued pretraining over approximately 15T mixed...
Solar Pro 3 is Upstage's powerful Mixture-of-Experts (MoE) language model. With 102B total parameters and 12B active parameters per forward pass, it delivers exceptional performance while maintaining computational efficiency. Optimized...
MiniMax M2-her is a dialogue-first large language model built for immersive roleplay, character-driven chat, and expressive multi-turn conversations. Designed to stay consistent in tone and personality, it supports rich message...
Palmyra X5 is Writer's most advanced model, 기업 전체에서 AI 에이전트를 구축하고 확장하기 위해 특별히 제작되었습니다.. 컨텍스트 창에서 업계 최고의 속도와 효율성을 제공합니다. 1 million...







