Модели
385 моделей
gpt-4o
GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая вдвое быстрее и будучи на…
jamba-large-1.7
Jamba Large 1.7 — это новейшая модель в открытом семействе Jamba, предлагающая улучшения в обоснованности, следовании инструкциям и общей эффективности. Построенная на гибридной архитектуре SSM-Transformer с контекстным окном 256K, она…
aion-1.0
Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и кодирование. Она построена на DeepSeek-R1, дополненной другими моделями и техниками, такими как Tree of…
aion-1.0-mini
Модель Aion-1.0-Mini с 32 миллиардами параметров является дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, кодирование и логика. Это модифицированный…
aion-2.0
Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивных ролевых игр и сторителлинга. Он особенно силен в привнесении напряжения, кризисов и конфликтов в истории, делая повествование более увлекательным. Он также обрабатывает…
aion-rp-llama-3.1-8b
Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, варианта Arena-Hard-Auto, специфичного для ролевых игр, где LLM оценивают ответы друг друга. Это базовая модель, прошедшая fine-tuning, а не…
olmo-3-32b-think
Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и продвинутых сценариев следования инструкциям. Её возможности обеспечивают высокую…
nova-2-lite-v1
Nova 2 Lite — это быстрая и экономичная модель рассуждений для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста.
nova-lite-v1
Amazon Nova Lite 1.0 — это очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку изображений, видео и текстовых входных данных для генерации текстовых выходных данных. Amazon Nova Lite может обрабатывать…
nova-micro-v1
Amazon Nova Micro 1.0 — это текстовая модель, которая обеспечивает наименьшую задержку ответа в семействе моделей Amazon Nova при очень низкой стоимости. Обладая длиной контекста в 128 тыс. токенов и оптимизированная по скорости и…
nova-premier-v1
Amazon Nova Premier — самая мощная из мультиканальных моделей Amazon для решения сложных задач рассуждения и для использования в качестве лучшего учителя для дистилляции пользовательских моделей.
nova-pro-v1
Amazon Nova Pro 1.0 — это мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого круга задач. По состоянию на декабрь 2024 года она достигает самых современных…
claude-haiku-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Haiku.
claude-sonnet-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Sonnet.
claude-3-haiku
Claude 3 Haiku — это самая быстрая и компактная модель Anthropic для почти мгновенного отклика. Быстрая и точная целевая производительность.
claude-3.5-haiku
Claude 3.5 Haiku предлагает расширенные возможности в скорости, точности кодирования и использовании инструментов. Разработанная для превосходной работы в приложениях реального времени, она обеспечивает быстрое время отклика, что крайне…
claude-haiku-4.5
Claude Haiku 4.5 — это самая быстрая и эффективная модель Anthropic, обеспечивающая интеллект, близкий к передовому, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Соответствуя…
claude-opus-4
Claude Opus 4 признан лучшей в мире моделью для кодирования на момент выпуска, обеспечивая стабильную производительность в сложных, длительных задачах и агентских рабочих процессах. Он устанавливает новые стандарты в разработке…
claude-opus-4.1
Claude Opus 4.1 — это обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждения и агентных задачах. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные…
claude-opus-4.5
Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use. It offers strong multimodal capabilities, competitive performance across real-world…
claude-opus-4.6
Opus 4.6 is Anthropic’s strongest model for coding and long-running professional tasks. It is built for agents that operate across entire workflows rather than single prompts, making it especially effective for large codebases, complex…
claude-opus-4.6-fast
Вариант [Opus 4.6](/anthropic/claude-opus-4.6) в быстром режиме — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.
claude-opus-4.7
Opus 4.7 is the next generation of Anthropic's Opus family, built for long-running, asynchronous agents. Building on the coding and agentic strengths of Opus 4.6, it delivers stronger performance on complex, multi-step tasks and more…
claude-opus-4.7-fast
Быстрый вариант [Opus 4.7](/anthropic/claude-opus-4.7) — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.
claude-opus-4.8
Claude Opus 4.8 is Anthropic's most capable generally available model in the Opus family. It supports text, image, and file inputs with text output, with reasoning support and a 1M-token context window. It is suited for highly autonomous…
claude-opus-4.8-fast
Fast-mode variant of [Opus 4.8](/anthropic/claude-opus-4.8) - identical capabilities with higher output speed at 2x pricing relative to regular Opus 4.8.
claude-opus-latest
Эта модель всегда перенаправляется на последнюю модель семейства Claude Opus.
claude-sonnet-4
Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя его как в задачах кодирования, так и в задачах рассуждения с улучшенной точностью и управляемостью. Достигая самых современных показателей…
claude-sonnet-4.5
Claude Sonnet 4.5 — это самая передовая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она демонстрирует передовую производительность в тестах кодирования, таких как…
claude-sonnet-4.6
Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовую производительность в кодировании, работе с агентами и профессиональной деятельности. Она превосходно справляется с итеративной…
coder-large
Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она…
maestro-reasoning
Maestro Reasoning — это флагманская аналитическая модель Arcee: производная Qwen 2.5-32B с 32 миллиардами параметров, настроенная с использованием DPO и chain-of-thought RL для пошаговой логики. По сравнению с более ранней 7B…
spotlight
Spotlight — это 7-миллиардная vision-language модель, разработанная на основе Qwen 2.5-VL и доработанная компанией Arcee AI для задач точного сопоставления изображений и текста. Она предлагает контекстное окно размером 32k токенов, что…
trinity-large-thinking
Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7
trinity-mini
Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных…
virtuoso-large
Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она…
bge-base-en-v1.5
Модель встраивания bge-base-en-v1.5 преобразует английские предложения и абзацы в 768-мерные плотные векторы, обеспечивая эффективные, высококачественные семантические встраивания, оптимизированные для поиска, семантического поиска и…
bge-large-en-v1.5
Модель встраивания bge-large-en-v1.5 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические встраивания, оптимизированные для семантического поиска,…
bge-m3
Модель внедрения bge-m3 кодирует предложения, абзацы и длинные документы в 1024-мерное плотное векторное пространство, предоставляя высококачественные семантические внедрения, оптимизированные для многоязычного поиска, семантического…
ernie-4.5-300b-a47b
ERNIE-4.5-300B-A47B — это языковая модель Mixture-of-Experts (MoE) с 300 миллиардами параметров, разработанная Baidu как часть серии ERNIE 4.5. Она активирует 47 миллиардов параметров на токен и поддерживает генерацию текста как на…
ernie-4.5-vl-28b-a3b
Мощная мультимодальная чат-модель Mixture-of-Experts с общим количеством параметров 28B, из которых 3B активируются на каждый токен, обеспечивающая исключительное понимание текста и изображений благодаря инновационной гетерогенной…
ernie-4.5-vl-424b-a47b
ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров, из которых 47 миллиардов активны на каждый токен. Она обучена совместно на текстовых и…
flux.2-flex
FLUX.2 [flex] превосходно справляется с рендерингом сложного текста, типографики и мелких деталей, а также поддерживает редактирование с несколькими ссылками в той же унифицированной архитектуре.
flux.2-klein-4b
FLUX.2 [klein] 4B — это самая быстрая и экономичная модель в семействе FLUX.2, оптимизированная для сценариев использования с высокой пропускной способностью при сохранении превосходного качества изображения.
flux.2-max
FLUX.2 [max] — это новая топовая модель для работы с изображениями от Black Forest Labs, поднимающая качество изображений, понимание запросов и согласованность редактирования на беспрецедентно высокий уровень.
flux.2-pro
Высококлассная модель для генерации и редактирования изображений, ориентированная на передовой уровень визуального качества и надежности. Она обеспечивает строгое соответствие запросам, стабильное освещение, четкие текстуры и…
seed-1.6
Seed 1.6 — это универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном в 256K.
seed-1.6-flash
Seed 1.6 Flash — это сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно размером 256k и может генерировать выходные данные объемом…
seed-2.0-lite
Seed-2.0-Lite — это универсальная, экономичная рабочая лошадка для предприятий, которая обеспечивает мощные мультимодальные и агентные возможности, предлагая при этом заметно меньшую задержку, что делает её практичным выбором по умолчанию…
seed-2.0-mini
Seed-2.0-mini ориентирован на сценарии с низкой задержкой, высокой конкуренцией и чувствительностью к стоимости, делая акцент на быстром отклике и гибком развертывании инференса. Он обеспечивает производительность, сравнимую с…
seedream-4.5
Seedream 4.5 — это новейшая внутренняя модель генерации изображений, разработанная ByteDance. По сравнению с Seedream 4.0, она обеспечивает всесторонние улучшения, особенно в согласованности редактирования, включая лучшее сохранение…
ui-tars-1.5-7b
UI-TARS-1.5 — это мультиканальный визуально-языковой агент, оптимизированный для сред с графическим интерфейсом пользователя (GUI), включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Разработанный ByteDance, он основан…
command-a
Command A — это модель с открытым весом и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в агентских, многоязычных и кодовых сценариях использования. По сравнению с другими…
command-r-08-2024
command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненным поиском (RAG) и использования инструментов. В более широком смысле, он лучше справляется с…
command-r-plus-08-2024
command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с пропускной способностью примерно на 50% выше и задержками на 25% ниже по сравнению с предыдущей версией Command R+, при этом аппаратные требования…
command-r7b-12-2024
Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложного рассуждения…
cogito-v2.1-671b
Cogito v2.1 671B MoE представляет собой одну из сильнейших открытых моделей в мире, соответствующую производительности передовых закрытых и открытых моделей. Эта модель обучена с использованием самообучения с подкреплением для достижения…
deepseek-chat
DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на возможностях следования инструкциям и написания кода предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, согласно опубликованным оценкам, модель…
deepseek-chat-v3-0324
DeepSeek V3, модель с 685 миллиардами параметров и архитектурой Mixture-of-Experts, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek.
deepseek-chat-v3.1
DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates. It extends the DeepSeek-V3 base with a two-phase long-context training process, reaching…
deepseek-v3.1-terminus
DeepSeek-V3.1 Terminus is an update to [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1) that maintains the model's original capabilities while addressing issues reported by users, including language consistency and agent capabilities, further…
deepseek-v3.2
DeepSeek-V3.2 is a large language model designed to harmonize high computational efficiency with strong reasoning and agentic tool-use performance. It introduces DeepSeek Sparse Attention (DSA), a fine-grained sparse attention mechanism…
deepseek-v3.2-exp
DeepSeek-V3.2-Exp is an experimental large language model released by DeepSeek as an intermediate step between V3.1 and future architectures. It introduces DeepSeek Sparse Attention (DSA), a fine-grained sparse attention mechanism designed…
deepseek-v4-flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством параметров 284B и 13B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для быстрого…
deepseek-v4-pro
DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общим количеством параметров 1,6T и 49B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для продвинутого рассуждения,…
deepseek-r1
DeepSeek R1 уже здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Он имеет 671 миллиард параметров, из которых 37 миллиардов активны при проходе вывода.
deepseek-r1-0528
Обновление от 28 мая к [оригинальному DeepSeek R1](/deepseek/deepseek-r1). Производительность наравне с [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671B…
deepseek-r1-distill-llama-70b
DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в…
deepseek-r1-distill-qwen-32b
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various…
rnj-1-instruct
Rnj-1 — это семейство плотных моделей с открытым исходным кодом и 8 миллиардами параметров, разработанное Essential AI и обученное с нуля с акцентом на программирование, математику и научные рассуждения. Модель демонстрирует высокую…
free
The simplest way to get free inference. openrouter/free is a router that selects free models at random from the models available on OpenRouter. The router smartly filters for models that support features needed for your request such as…
gemini-flash-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
gemini-pro-latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
gemini-2.5-flash
Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in "thinking" capabilities, enabling it to provide responses with…
gemini-2.5-flash-lite
Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks…
gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks…
gemini-2.5-pro
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать при формировании ответов…
gemini-2.5-pro-preview-05-06
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с…
gemini-2.5-pro-preview
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной…
gemini-3-flash-preview
Gemini 3 Flash Preview — это высокоскоростная, высокоэффективная модель мышления, разработанная для агентских рабочих процессов, многоходовых чатов и помощи в кодировании. Она обеспечивает производительность рассуждений и использования…
gemini-3.1-flash-lite
Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads. It supports text, image, video, audio, and PDF inputs, and is designed for lightweight agentic workflows, simple data…
gemini-3.1-flash-lite-preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом данных. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini…
gemini-3.1-pro-preview
Gemini 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows. Building on the multimodal foundation…
gemini-3.1-pro-preview-customtools
Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда доступны более эффективные сторонние или…
gemini-3.5-flash
Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution loops, supporting text,…
gemini-embedding-001
gemini-embedding-001 предоставляет унифицированный передовой опыт во всех областях, включая науку, юриспруденцию, финансы и программирование. Эта модель эмбеддингов неизменно занимает лидирующие позиции в многоязычной таблице лидеров…
gemini-embedding-2
Gemini Embedding 2 is Google's first multimodal embedding model. We currently support mapping text and images into a unified vector space for semantic search and retrieval-augmented generation (RAG). It supports input context up to 8,192…
gemini-embedding-2-preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с…
gemma-2-27b-it
Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые использовались для создания [моделей Gemini](/models?q=gemini).
gemma-3-12b-it
Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3-27b-it
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста, а также текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3-4b-it
Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3n-e4b-it
Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальные входные данные, включая текст,…
gemma-4-26b-a4b-it
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на 25,2 млрд общих параметров, только 3,8 млрд активируются на каждый токен во время вывода — обеспечивая качество,…
gemma-4-26b-a4b-it:free
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что…
gemma-4-31b-it
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая ввод текста и изображений с выводом текста. Она имеет контекстное окно в 256 тысяч токенов, настраиваемый режим…
gemma-4-31b-it:free
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом…
gemini-2.5-flash-image
Gemini 2.5 Flash Image, a.k.a. "Nano Banana," is now generally available. It is a state of the art image generation model with contextual understanding. It is capable of image generation, edits, and multi-turn conversations. Aspect ratios…
gemini-3.1-flash-image-preview
Gemini 3.1 Flash Image Preview, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines advanced contextual understanding with fast,…
gemini-3-pro-image-preview
Nano Banana Pro — это самая передовая модель Google для генерации и редактирования изображений, построенная на базе Gemini 3 Pro. Она расширяет возможности оригинальной Nano Banana за счет значительно улучшенного мультимодального мышления,…
granite-4.0-h-micro
Granite-4.0-H-Micro — это модель семейства Granite 4 с 3 миллиардами параметров. Эти модели являются новейшими в серии моделей, выпущенных IBM. Они тонко настроены для вызова инструментов с длинным контекстом.
granite-4.1-8b
Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров от IBM, использующая только декодер, часть семейства Granite 4.1. Она поддерживает контекстное окно в 131K токенов и предназначена для корпоративных задач, включая…
mercury-2
Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM (dLLM) для рассуждений. Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая скорости >1000…
ling-2.6-1t
Ling-2.6-1T — это мгновенная (инструктивная) модель от inclusionAI и флагман компании с триллионом параметров, разработанная для реальных агентов, которым требуется быстрое выполнение и высокая эффективность в масштабе. Она использует…
ling-2.6-flash
Ling-2.6-flash — это мгновенная (инструктивная) модель от inclusionAI с общим количеством параметров 104B и 7.4B активных параметров, разработанная для реальных агентов, которым требуются быстрые ответы, высокая производительность и…
ring-2.6-1t
Ring-2.6-1T — это модель мышления с 1T параметрами и 63B активными параметрами, созданная для реальных рабочих процессов агентов, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для кодирующих…
inflection-3-pi
Inflection 3 Pi обеспечивает работу чат-бота [Pi](https://pi.ai) от Inflection, включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и превосходно справляется со сценариями,…
inflection-3-productivity
Inflection 3 Productivity оптимизирован для следования инструкциям. Он лучше подходит для задач, требующих вывода JSON или точного соблюдения предоставленных рекомендаций. Он имеет доступ к последним новостям.
e5-base-v2
Модель эмбеддингов e5-base-v2 кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как семантический…
e5-large-v2
Модель эмбеддингов e5-large-v2 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические эмбеддинги, оптимизированные для задач извлечения информации,…
multilingual-e5-large
Модель multilingual-e5-large embedding кодирует предложения, абзацы и документы на более чем 90 языках в 1024-мерное плотное векторное пространство, обеспечивая надежные семантические эмбеддинги, оптимизированные для многоязычного поиска,…
kat-coder-pro-v2
KAT-Coder-Pro V2 — это новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, разработанная для сложной корпоративной разработки программного обеспечения и интеграции SaaS. Она основывается на агентных возможностях…
lfm-2-24b-a2b
LFM2-24B-A2B — это крупнейшая модель в семействе гибридных архитектур LFM2, разработанных для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных…
lfm-2.5-1.2b-instruct:free
LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель, настроенная на выполнение инструкций, созданная для быстрого ИИ на устройстве. Она обеспечивает высокое качество чата при размере 1,2 миллиарда параметров, с эффективным…
lfm-2.5-1.2b-thinking:free
LFM2.5-1.2B-Thinking — это легковесная модель, ориентированная на рассуждения, оптимизированная для агентских задач, извлечения данных и RAG, при этом комфортно работающая на периферийных устройствах. Она поддерживает длинный контекст (до…
llama-guard-3-8b
Llama Guard 3 — это предварительно обученная модель Llama-3.1-8B, доработанная для классификации контента по безопасности. Как и предыдущие версии, она может использоваться для классификации контента как во входных данных LLM…
magnum-v4-72b
This is a series of models designed to replicate the prose quality of the Claude 3 models, specifically Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) and Opus(https://openrouter.ai/anthropic/claude-3-opus).
weaver
Попытка воссоздать многословность в стиле Claude, но не ожидайте того же уровня связности или памяти. Предназначено для использования в ролевых играх/нарративных ситуациях.
llama-3-70b-instruct
Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.
llama-3-8b-instruct
Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.
llama-3.1-70b-instruct
Последнее поколение моделей Meta (Llama 3.1) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, оптимизирована для высококачественных диалоговых сценариев использования.
llama-3.1-8b-instruct
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, быстра и эффективна.
llama-3.2-11b-vision-instruct
Llama 3.2 11B Vision — это мультимодальная модель с 11 миллиардами параметров, разработанная для решения задач, сочетающих визуальные и текстовые данные. Она превосходно справляется с такими задачами, как создание подписей к изображениям и…
llama-3.2-1b-instruct
Llama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и многоязычный текстовый анализ. Её меньший размер позволяет ей…
llama-3.2-3b-instruct
Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…
llama-3.2-3b-instruct:free
Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…
llama-3.3-70b-instruct
Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции и…
llama-3.3-70b-instruct:free
Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции, только для…
llama-4-maverick
Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультиязычная модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой проход (всего 400…
llama-4-scout
Llama 4 Scout 17B Instruct (16E) — это языковая модель типа «смесь экспертов» (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и…
llama-guard-4-12b
Llama Guard 4 — это мультимодальная предварительно обученная модель, созданная на основе Llama 4 Scout и доработанная для классификации безопасности контента. Как и предыдущие версии, она может использоваться для классификации контента как…
phi-4
[Microsoft Research](/microsoft) Phi-4 разработан для эффективного выполнения сложных задач рассуждения и может эффективно работать в условиях ограниченной памяти или там, где требуются быстрые ответы.
phi-4-mini-instruct
Phi-4-mini-instruct — это легковесная открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с акцентом на высококачественные, насыщенные рассуждениями данные. Модель принадлежит к семейству…
minimax-m1
MiniMax-M1 — это крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с настраиваемым…
minimax-m2
MiniMax-M2 is a compact, high-efficiency large language model optimized for end-to-end coding and agentic workflows. With 10 billion activated parameters (230 billion total), it delivers near-frontier intelligence across general reasoning,…
minimax-m2-her
MiniMax M2-her — это большая языковая модель, ориентированная на диалог, созданная для иммерсивных ролевых игр, чатов, управляемых персонажами, и выразительных многоходовых бесед. Разработанная для поддержания согласованности тона и…
minimax-m2.1
MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development. With only 10 billion activated parameters, it delivers a major jump in real-world capability…
minimax-m2.5
MiniMax-M2.5 — это современная большая языковая модель (SOTA LLM), разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных и сложных реальных цифровых рабочих средах, M2.5 развивает опыт кодирования M2.1,…
minimax-m2.7
MiniMax-M2.7 — это крупная языковая модель нового поколения, разработанная для автономной, реальной продуктивности и непрерывного совершенствования. Созданная для активного участия в собственной эволюции, M2.7 интегрирует передовые…
minimax-m3
MiniMax-M3 is a multimodal foundation model from MiniMax. It supports text, image, and video inputs with text output, a 1M-token context window, and is suited for long-horizon agentic work, coding, and tool use. It is built on MiniMax…
minimax-01
MiniMax-01 сочетает MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Он имеет 456 миллиардов параметров, при этом 45,9 миллиарда параметров активируются за одно логическое выведение, и может обрабатывать…
mistral-large
Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…
mistral-large-2407
Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…
codestral-2508
Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов.
codestral-embed-2505
Mistral Codestral Embed специально разработан для кода, идеально подходит для встраивания кодовых баз данных, репозиториев и обеспечения работы помощников по кодированию с использованием передовых методов извлечения информации.
devstral-2512
Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная transformer-модель со 123 миллиардами параметров, поддерживающая контекстное окно размером 256K.
ministral-14b-2512
Крупнейшая модель в семействе Ministral 3, Ministral 3 14B, предлагает передовые возможности и производительность, сравнимую с её более крупным аналогом Mistral Small 3.2 24B. Мощная и эффективная языковая модель с возможностями зрения.
ministral-3b-2512
Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.
ministral-8b-2512
Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.
mistral-embed-2312
Mistral Embed — это специализированная модель эмбеддингов для текстовых данных, оптимизированная для семантического поиска и RAG-приложений. Разработанная Mistral AI в конце 2023 года, она генерирует 1024-мерные векторы, которые эффективно…
mistral-large-2512
Mistral Large 3 2512 — это самая мощная на сегодняшний день модель Mistral, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 млрд активных параметров (всего 675 млрд) и выпущенная под лицензией Apache 2.0.
mistral-medium-3
Mistral Medium 3 — это высокопроизводительная языковая модель корпоративного уровня, разработанная для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она сочетает в себе самые современные…
mistral-medium-3.1
Mistral Medium 3.1 — это обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного уровня, разработанной для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она…
mistral-medium-3-5
Mistral Medium 3.5 — это плотная 128B модель от Mistral AI, следующая инструкциям. Она поддерживает текстовые и графические входные данные с текстовым выводом и предназначена для агентских рабочих процессов, кодирования и сложного…
mistral-nemo
Модель с 12 миллиардами параметров и длиной контекста 128 тысяч токенов, разработанная Mistral в сотрудничестве с NVIDIA.
mistral-small-24b-instruct-2501
Mistral Small 3 — это языковая модель с 24 миллиардами параметров, оптимизированная для работы с низкой задержкой при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает как предварительно обученные, так…
mistral-small-3.1-24b-instruct
Mistral Small 3.1 24B Instruct — это обновленный вариант Mistral Small 3 (2501), включающий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в задачах текстового…
mistral-small-3.2-24b-instruct
Mistral-Small-3.2-24B-Instruct-2506 — это обновленная 24B-параметрическая модель от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с версией 3.1, версия 3.2 значительно…
mistral-small-2603
Mistral Small 4 — это следующий крупный релиз в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе мощные способности к рассуждению от Magistral, мультимодальное…
mixtral-8x22b-instruct
Официальная инструктивная fine-tuned версия [Mixtral 8x22B](/models/mistralai/mixtral-8x22b) от Mistral. Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая беспрецедентную экономическую эффективность для своего…
mistral-saba
Mistral Saba — это языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обученная…
kimi-latest
Эта модель всегда перенаправляется на последнюю модель в семействе MoonshotAI Kimi.
kimi-k2
Kimi K2 Instruct — это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных параметров на каждый прямой проход. Она оптимизирована для…
kimi-k2-0905
Kimi K2 0905 — это сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных…
kimi-k2-thinking
Kimi K2 Thinking — это самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 в область агентных рассуждений с длительным горизонтом. Построенная на архитектуре Mixture-of-Experts (MoE) с…
kimi-k2.5
Kimi K2.5 — это нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемой агентной системы. Созданная на базе Kimi K2 с продолженным предварительным обучением на…
kimi-k2.6
Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, разработанная для долгосрочного кодирования, генерации UI/UX на основе кодирования и оркестрации мультиагентов. Она справляется со сложными сквозными задачами…
kimi-k2.6:free
Kimi K2.6 is Moonshot AI's next-generation multimodal model, designed for long-horizon coding, coding-driven UI/UX generation, and multi-agent orchestration. It handles complex end-to-end coding tasks across Python, Rust, and Go, and...
morph-v3-fast
Самая быстрая модель Morph для применения изменений в коде. ~10 500 токенов/сек с точностью 96% для быстрых преобразований кода.
morph-v3-large
Высокоточная модель Morph для сложных изменений кода. ~4500 токенов/сек с точностью 98% для точных преобразований кода.
mythomax-l2-13b
Одна из самых высокопроизводительных и популярных fine-tune-версий Llama 2 13B, с богатыми описаниями и ролевыми играми. #merge
deepseek-v3.1-nex-n1
DeepSeek V3.1 Nex-N1 — это флагманский релиз серии Nex-N1, дообученная модель, разработанная для демонстрации автономности агентов, использования инструментов и продуктивности в реальном мире.
hermes-3-llama-3.1-405b
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждения, многооборотные диалоги, когерентность в…
hermes-3-llama-3.1-405b:free
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждение, многоходовые диалоги, связность в длинном…
hermes-3-llama-3.1-70b
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие,…
hermes-4-405b
Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research. It introduces a hybrid reasoning mode, where the model can choose to deliberate internally with <think>...</think> traces or respond…
hermes-4-70b
Hermes 4 70B is a hybrid reasoning model from Nous Research, built on Meta-Llama-3.1-70B. It introduces the same hybrid mode as the larger 405B release, allowing the model to either respond directly or generate explicit <think>...</think>…
hermes-2-pro-llama-3-8b
Hermes 2 Pro — это обновленная, переобученная версия Nous Hermes 2, состоящая из обновленного и очищенного набора данных OpenHermes 2.5, а также недавно представленного набора данных для вызова функций (Function Calling) и режима JSON…
llama-3.3-nemotron-super-49b-v1.5
Llama-3.3-Nemotron-Super-49B-v1.5 — это модель для рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, разработанная на основе Llama-3.3-70B-Instruct от Meta с контекстом 128K. Она прошла пост-обучение для…
llama-nemotron-embed-vl-1b-v2:free
Модель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для многомодального поиска ответов на вопросы. Модель может встраивать «документы» в виде изображений, текста или изображений и текста...
nemotron-3-nano-30b-a3b
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, предназначенная для разработчиков, создающих специализированные агентные системы ИИ.
nemotron-3-nano-30b-a3b:free
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью...
nemotron-3-nano-omni-30b-a3b-reasoning:free
NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель 30B-A3B, разработанная для функционирования в качестве субагента восприятия и контекста в корпоративных агентских системах. Она принимает текст, изображения, видео и...
nemotron-3-super-120b-a12b
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях.…
nemotron-3-super-120b-a12b:free
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, которая активирует всего 12 миллиардов параметров для достижения максимальной вычислительной эффективности и точности в сложных многоагентных…
nemotron-nano-12b-v2-vl:free
NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель рассуждений с 12 миллиардами параметров, разработанная для понимания видео и анализа документов. Она представляет гибридную архитектуру Transformer-Mamba, сочетающую точность…
nemotron-nano-9b-v2
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная с нуля компанией NVIDIA и предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы и задачи пользователей, сначала генерируя…
nemotron-nano-9b-v2:free
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная и обученная с нуля компанией NVIDIA, предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы пользователей и...
gpt-latest
Эта модель всегда перенаправляется на последнюю модель семейства OpenAI GPT.
gpt-mini-latest
Эта модель всегда перенаправляет на новейшую модель семейства OpenAI GPT Mini.
gpt-audio
Модель gpt-audio — это первая общедоступная аудиомодель от OpenAI. Новый снимок включает улучшенный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Стоимость аудио составляет 32 доллара за…
gpt-audio-mini
Экономичная версия GPT Audio. Новый снимок включает обновленный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Входные данные оцениваются в $0.60 за миллион токенов, а выходные — в $2.40 за…
gpt-chat-latest
GPT Chat Latest указывает на стабильный API-псевдоним OpenAI `chat-latest`, который всегда разрешается в последнюю модель Instant chat, используемую в ChatGPT. По мере того, как OpenAI будет выпускать новые обновления модели Instant в…
gpt-3.5-turbo
GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она способна понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач автодополнения.
gpt-3.5-turbo-0613
GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач завершения.
gpt-3.5-turbo-16k
Эта модель предлагает в четыре раза большую длину контекста по сравнению с gpt-3.5-turbo, что позволяет ей обрабатывать примерно 20 страниц текста за один запрос при более высокой стоимости. Данные для обучения: до сентября 2021 года.
gpt-3.5-turbo-instruct
Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструкционных запросов и исключающим оптимизации, связанные с чатом. Данные обучения: до сентября 2021 года.
gpt-4
Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультиканальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря своим более обширным общим знаниям и продвинутым…
gpt-4-0314
GPT-4-0314 — это первая выпущенная версия GPT-4 с длиной контекста 8192 токена, поддержка которой осуществлялась до 14 июня. Данные для обучения: до сентября 2021 года.
gpt-4-turbo
Новейшая модель GPT-4 Turbo с возможностями зрения. Запросы со зрением теперь могут использовать режим JSON и вызов функций.
gpt-4-1106-preview
Новейшая модель GPT-4 Turbo с возможностями зрения. Запросы со зрением теперь могут использовать режим JSON и вызов функций.
gpt-4-turbo-preview
Предварительная версия модели GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Данные для обучения: до декабря 2023 года.
gpt-4.1
GPT-4.1 — это флагманская большая языковая модель, оптимизированная для расширенного следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион…
gpt-4.1-mini
GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, сопоставимую с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% в сложных тестах на…
gpt-4.1-nano
Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря контекстному окну в 1 миллион токенов и…
gpt-4o-2024-05-13
GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая в два раза быстрее и будучи…
gpt-4o-2024-08-06
Версия GPT-4o от 06.08.2024 предлагает улучшенную производительность в структурированных выходных данных, с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте…
gpt-4o-2024-11-20
Версия GPT-4o от 20.11.2024 предлагает улучшенные возможности творческого письма с более естественным, увлекательным и адаптированным стилем для повышения релевантности и читабельности. Она также лучше работает с загруженными файлами,…
gpt-4o-search-preview
Предварительная версия поиска GPT-4o — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.
gpt-4o-mini
GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.
gpt-4o-mini-2024-07-18
GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.
gpt-4o-mini-search-preview
Предварительная версия поиска GPT-4o mini — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.
gpt-5
GPT-5 — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…
gpt-5-chat
GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-ориентированных бесед в корпоративных приложениях.
gpt-5-codex
GPT-5-Codex is a specialized version of GPT-5 optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…
gpt-5-image
[GPT-5](https://openrouter.ai/openai/gpt-5) Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities. It offers major improvements in reasoning, code quality, and user experience while incorporating GPT Image…
gpt-5-image-mini
GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by [GPT-5 Mini](https://openrouter.ai/openai/gpt-5-mini), with GPT Image 1 Mini for efficient image generation. This natively multimodal model features superior…
gpt-5-mini
GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более лёгких задач, требующих рассуждений. Она обеспечивает те же преимущества GPT-5 в следовании инструкциям и настройке безопасности, но с уменьшенной задержкой и…
gpt-5-nano
GPT-5-Nano — это самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрого взаимодействия и сред со сверхнизкой задержкой. Хотя его глубина рассуждений ограничена по сравнению с более…
gpt-5-pro
GPT-5 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…
gpt-5.1
GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильное общецелевое рассуждение, улучшенное следование инструкциям и более естественный стиль беседы по сравнению с GPT-5. Она использует адаптивное…
gpt-5.1-chat
GPT-5.1 Chat (также известный как Instant) — это быстрый, легковесный представитель семейства 5.1, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы…
gpt-5.1-codex
GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…
gpt-5.1-codex-max
GPT-5.1-Codex-Max — это новейшая агентная модель кодирования от OpenAI, разработанная для длительных задач по разработке программного обеспечения с высоким контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на…
gpt-5.1-codex-mini
GPT-5.1-Codex-Mini — это уменьшенная и более быстрая версия GPT-5.1-Codex
gpt-5.2
GPT-5.2 — это новейшая пограничная модель серии GPT-5, предлагающая более высокую производительность в режиме агента и при работе с длинным контекстом по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического…
gpt-5.2-chat
GPT-5.2 Chat (также известный как Instant) — это быстрый и легковесный член семейства 5.2, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы выборочно…
gpt-5.2-pro
GPT-5.2 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности при работе с длинным контекстом по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих…
gpt-5.2-codex
GPT-5.2-Codex is an upgraded version of GPT-5.1-Codex optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…
gpt-5.3-chat
GPT-5.3 Chat — это обновление самой используемой модели ChatGPT, которое делает повседневные беседы более плавными, полезными и непосредственно помогающими. Оно обеспечивает более точные ответы с лучшей контекстуализацией и значительно…
gpt-5.3-codex
GPT-5.3-Codex — это самая передовая агентная модель кодирования от OpenAI, сочетающая в себе передовую производительность программной инженерии GPT-5.2-Codex с более широкими возможностями рассуждения и профессиональными знаниями GPT-5.2.…
gpt-5.4
GPT-5.4 — это новейшая пограничная модель OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. на вход, 128 тыс. на выход) с поддержкой текстового и графического…
gpt-5.4-image-2
[GPT-5.4](https://openrouter.ai/openai/gpt-5.4) Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2. It enables rich multimodal workflows, allowing users to seamlessly move between…
gpt-5.4-mini
GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и графические входные данные с высокой производительностью в…
gpt-5.4-nano
GPT-5.4 nano — это самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и требующих большого объема обработки. Он поддерживает текстовые и графические входные данные и разработан для…
gpt-5.4-pro
GPT-5.4 Pro — это самая передовая модель OpenAI, основанная на унифицированной архитектуре GPT-5.4 с расширенными возможностями рассуждений для сложных и ответственных задач. Она имеет контекстное окно размером более 1 млн токенов (922…
gpt-5.5
GPT-5.5 — это передовая модель OpenAI, разработанная для сложных профессиональных рабочих нагрузок, основанная на GPT-5.4 с более сильным рассуждением, более высокой надежностью и улучшенной эффективностью токенов для сложных задач. Она…
gpt-5.5-pro
GPT-5.5 Pro — это высокопроизводительная модель OpenAI, оптимизированная для глубокого анализа и точности в сложных, ответственных рабочих нагрузках. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. входных, 128 тыс.…
gpt-oss-120b
gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) с 117 миллиардами параметров от OpenAI, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…
gpt-oss-120b:free
gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) от OpenAI с 117 миллиардами параметров, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…
gpt-oss-20b
gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на один прямой проход, оптимизированную для…
gpt-oss-20b:free
gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на прямой проход, оптимизированную для...
gpt-oss-safeguard-20b
gpt-oss-safeguard-20b — это модель для рассуждений о безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта открытая модель Mixture-of-Experts (MoE) с 21 миллиардом параметров обеспечивает меньшую задержку для задач безопасности,…
o1
Новейшее и самое мощное семейство моделей от OpenAI, o1, разработано для того, чтобы тратить больше времени на обдумывание перед ответом. Серия моделей o1 обучена с использованием крупномасштабного обучения с подкреплением для рассуждений…
o1-pro
Модели серии o1 обучены с использованием обучения с подкреплением, чтобы обдумывать свои ответы и выполнять сложное рассуждение. Модель o1-pro использует больше вычислительных ресурсов, чтобы обдумывать более тщательно и предоставлять…
o3
o3 — это всесторонне развитая и мощная модель, охватывающая различные области. Она устанавливает новый стандарт для задач по математике, естественным наукам, программированию и визуальному мышлению. Она также превосходно справляется с…
o3-deep-research
o3-deep-research — это продвинутая модель OpenAI для глубоких исследований, разработанная для решения сложных, многоэтапных исследовательских задач.
o3-mini
OpenAI o3-mini is a cost-efficient language model optimized for STEM reasoning tasks, particularly excelling in science, mathematics, and coding.
o3-mini-high
OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), но с параметром `reasoning_effort`, установленным на `high`.
o3-pro
The o-series of models are trained with reinforcement learning to think before they answer and perform complex reasoning. The o3-pro model uses more compute to think harder and provide consistently better answers.
o4-mini
OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении мощных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует…
o4-mini-deep-research
o4-mini-deep-research — это более быстрая и доступная модель для глубоких исследований от OpenAI, идеально подходящая для решения сложных, многоэтапных исследовательских задач.
o4-mini-high
OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), но с параметром `reasoning_effort`, установленным на `high`.
text-embedding-3-large
`text-embedding-3-large` — это самая мощная модель встраивания OpenAI для задач как на английском, так и на других языках. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности…
text-embedding-3-small
text-embedding-3-small — это улучшенная, более производительная версия модели встраивания ada от OpenAI. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности между двумя…
text-embedding-ada-002
text-embedding-ada-002 — это устаревшая модель для создания текстовых эмбеддингов от OpenAI.
owl-alpha
Owl Alpha is a high-performance foundation model designed for agentic workloads. Natively supports tool use, and long-context tasks, with strong performance in code generation, automated workflows, and complex instruction execution.…
perceptron-mk1
Perceptron Mk1 (Mark One) — это высококачественная визуально-языковая модель Perceptron для видео и воплощенного мышления.** Она принимает изображения и видео в сочетании с запросами на естественном языке и выдает подробные ответы с…
pplx-embed-v1-0.6b
pplx-embed-v1-0.6B — это одна из передовых моделей встраивания текста от Perplexity, созданная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного поиска текста, а модель с 0.6B…
pplx-embed-v1-4b
pplx-embed-v1 -4B — одна из передовых моделей Perplexity для создания текстовых эмбеддингов, разработанная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного текстового поиска, а модель…
sonar
Sonar — это легковесный, доступный, быстрый и простой в использовании инструмент, теперь с цитированием и возможностью настройки источников. Он разработан для компаний, которым необходимы легковесные функции вопросов и ответов,…
sonar-deep-research
Sonar Deep Research — это модель, ориентированная на исследования, разработанная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора…
sonar-pro
Примечание: Цены Sonar Pro включают цены на поиск Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)
sonar-pro-search
Exclusively available on the OpenRouter API, Sonar Pro's new Pro Search mode is Perplexity's most advanced agentic search system. It is designed for deeper reasoning and analysis. Pricing is based on tokens plus $18 per thousand requests.…
sonar-reasoning-pro
Примечание: В стоимость Sonar Pro включена стоимость поиска Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)
laguna-m.1:free
Laguna M.1 — это флагманская модель кодирующего агента от [Poolside](https://poolside.ai), оптимизированная для сложных задач разработки программного обеспечения. Разработанная для агентских рабочих процессов кодирования, она поддерживает…
laguna-xs.2:free
Laguna XS.2 — это модель второго поколения в классе размера XS от [Poolside](https://poolside.ai), их серии эффективных кодирующих агентов. Она сочетает возможности вызова инструментов и рассуждения с компактным размером, предлагая...
intellect-3
INTELLECT-3 — это модель Mixture-of-Experts с 106 миллиардами параметров (12 миллиардов активных), дообученная на основе GLM-4.5-Air-Base с использованием контролируемой донастройки (SFT) с последующим крупномасштабным обучением с…
qwen-plus-2025-07-28
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-plus-2025-07-28:thinking
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-plus
Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-2.5-7b-instruct
Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:
qwen2.5-vl-72b-instruct
Qwen2.5-VL отлично распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также обладает высокой способностью анализировать тексты, диаграммы, значки, графику и макеты внутри изображений.
qwen3-14b
Qwen3-14B — это плотная причинная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления»…
qwen3-235b-a22b
Qwen3-235B-A22B — это модель Mixture-of-Experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров за один прямой проход. Она поддерживает бесшовное переключение между режимом «мышления» для…
qwen3-235b-a22b-2507
Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на инструкции языковая модель типа Mixture-of-Experts, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров на прямой проход. Она оптимизирована для…
qwen3-235b-a22b-thinking-2507
Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждения. Она активирует 22B из своих 235B параметров за один прямой проход и…
qwen3-30b-a3b
Qwen3, последнее поколение серии больших языковых моделей Qwen, включает в себя как плотную архитектуру, так и архитектуру MoE (mixture-of-experts), чтобы преуспеть в рассуждениях, многоязычной поддержке и продвинутых агентских задачах. Её…
qwen3-30b-a3b-instruct-2507
Qwen3-30B-A3B-Instruct-2507 — это языковая модель Qwen с 30,5 миллиардами параметров, использующая архитектуру MoE, с 3,3 миллиардами активных параметров на вывод. Она работает в немыслящем режиме и предназначена для высококачественного…
qwen3-30b-a3b-thinking-2507
Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений Mixture-of-Experts с 30 миллиардами параметров, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель разработана специально для «режима мышления»,…
qwen3-32b
Qwen3-32B — это причинная языковая модель с плотной архитектурой и 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между…
qwen3-8b
Qwen3-8B — это плотная причинная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивного рассуждения, так и для эффективного диалога. Она поддерживает плавное переключение между…
qwen3-coder-30b-a3b-instruct
Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 миллиардами параметров и 128 экспертами (8 активных за один прямой проход), разработанная для продвинутой генерации кода, понимания репозиториев и использования…
qwen3-coder
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…
qwen3-coder:free
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…
qwen3-coder-flash
Qwen3 Coder Flash — это быстрая и экономичная версия проприетарной модели Qwen3 Coder Plus от Alibaba. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и…
qwen3-coder-next
Qwen3-Coder-Next — это причинная языковая модель с открытым весом, оптимизированная для кодирующих агентов и локальных рабочих процессов разработки. Она использует разреженную MoE-архитектуру с общим количеством параметров 80B и всего 3B…
qwen3-coder-plus
Qwen3 Coder Plus — это проприетарная версия Alibaba модели Qwen3 Coder 480B A35B с открытым исходным кодом. Это мощная модель кодирующего агента, специализирующаяся на автономном программировании посредством вызова инструментов и…
qwen3-embedding-4b
Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…
qwen3-embedding-8b
Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…
qwen3-max
Qwen3-Max — это обновленный релиз, основанный на серии Qwen3, предлагающий значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате знаний с длинным хвостом по сравнению с версией от января 2025 года.…
qwen3-max-thinking
Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для высокоответственных когнитивных задач, требующих глубоких, многошаговых рассуждений. За счет значительного увеличения мощности модели и вычислительных…
qwen3-next-80b-a3b-instruct
Qwen3-Next-80B-A3B-Instruct — это чат-модель из серии Qwen3-Next, настроенная на выполнение инструкций и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с…
qwen3-next-80b-a3b-instruct:free
Qwen3-Next-80B-A3B-Instruct — это чат-модель серии Qwen3-Next, настроенная на инструкции и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с рассуждениями,…
qwen3-next-80b-a3b-thinking
Qwen3-Next-80B-A3B-Thinking — это чат-модель, ориентированная на рассуждения, из линейки Qwen3-Next, которая по умолчанию выводит структурированные трассировки «мышления». Она разработана для решения сложных многошаговых задач:…
qwen3-vl-235b-a22b-instruct
Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct предназначена для общего использования в задачах «зрение-язык» (VQA,…
qwen3-vl-235b-a22b-thinking
Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодального рассуждения в STEM и математике. Серия…
qwen3-vl-30b-a3b-instruct
Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Модель…
qwen3-vl-30b-a3b-thinking
Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно…
qwen3-vl-32b-instruct
Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная визуально-языковая модель, разработанная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Обладая 32 миллиардами параметров, она сочетает глубокое…
qwen3-vl-8b-instruct
Qwen3-VL-8B-Instruct — это мультимодальная визуально-языковая модель из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Она отличается улучшенным мультимодальным слиянием с…
qwen3-vl-8b-thinking
Qwen3-VL-8B-Thinking — это вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, разработанный для продвинутого визуального и текстового анализа в сложных сценах, документах и временных последовательностях. Он…
qwen3.5-397b-a17b
Нативная визуально-языковая модель Qwen3.5 серии 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности инференса. Она…
qwen3.5-plus-02-15
Модели серии Qwen3.5 native vision-language Plus построены на гибридной архитектуре, которая объединяет механизмы линейного внимания с моделями разреженной смеси экспертов (MoE), достигая более высокой эффективности инференса. В различных…
qwen3.5-plus-20260420
Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это…
qwen3.5-122b-a10b
Модель Qwen3.5 122B-A10B native vision-language построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью MoE, достигая более высокой эффективности вывода. По общей производительности эта…
qwen3.5-27b
Модель Qwen3.5 27B native vision-language Dense включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировании скорости вывода и производительности. Её общие возможности сопоставимы с возможностями…
qwen3.5-35b-a3b
Серия Qwen3.5 35B-A3B — это нативная визуально-языковая модель, разработанная с гибридной архитектурой, которая объединяет механизмы линейного внимания и разреженную модель MoE, достигая более высокой эффективности инференса. Её общая…
qwen3.5-9b
Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения мощных возможностей рассуждения, кодирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует…
qwen3.5-flash-02-23
Нативные Flash-модели Qwen3.5 для зрения и языка построены на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. По сравнению с…
qwen3.6-27b
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы — и…
qwen3.6-35b-a3b
Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts,…
qwen3.6-flash
Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании…
qwen3.6-max-preview
Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования…
qwen3.6-plus
Qwen 3.6 Plus основан на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженной маршрутизацией mixture-of-experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он…
qwen3.7-max
Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а…
qwen-2.5-72b-instruct
Qwen2.5 72B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:
qwen-2.5-coder-32b-instruct
Qwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, ориентированных на код (ранее известных как CodeQwen). Qwen2.5-Coder включает следующие улучшения по сравнению с CodeQwen1.5:
recraft-v3
Recraft V3 is an image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios.
recraft-v4
Recraft V4 is an image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios. It delivers stronger compositional judgment, color coherence, and legible embedded…
recraft-v4-pro
Recraft V4 Pro is an image generation model from Recraft. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios, double the resolution of V4. It offers higher fidelity and detail density than…
recraft-v4-pro-vector
Recraft V4 Pro Vector is the vector (SVG) variant of Recraft V4 Pro. It supports text and image inputs and produces vector image output across multiple aspect ratios at the higher fidelity Pro tier. Output is delivered as SVG, suitable for…
recraft-v4-vector
Recraft V4 Vector is the vector (SVG) variant of Recraft V4. It supports text and image inputs and produces vector image output across multiple aspect ratios. Compared to the raster V4, output is delivered as SVG, suitable for icons,…
recraft-v4.1
Recraft V4.1 is an image generation model from Recraft tuned for high aesthetics. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios, with typical generation around 10 seconds. Compared to…
recraft-v4.1-pro
Recraft V4.1 Pro is an image generation model from Recraft tuned for high aesthetics. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios - double the resolution of V4.1 - with typical…
recraft-v4.1-pro-vector
Recraft V4.1 Pro Vector is the vector (SVG) variant of Recraft V4.1 Pro, tuned for high aesthetics. It supports text and image inputs and produces higher-resolution SVG image output across multiple aspect ratios, with typical generation…
recraft-v4.1-utility
Recraft V4.1 Utility is a general-purpose image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios, with typical generation around 10 seconds. The Utility line…
recraft-v4.1-utility-pro
Recraft V4.1 Utility Pro is a general-purpose image generation model from Recraft. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios — double the resolution of V4.1 Utility - with typical…
recraft-v4.1-vector
Recraft V4.1 Vector is the vector (SVG) variant of Recraft V4.1, tuned for high aesthetics. It supports text and image inputs and produces SVG image output across multiple aspect ratios, with typical generation around 13 seconds. Output…
reka-edge
Reka Edge — это чрезвычайно эффективная 7B мультимодальная визуально-языковая модель, которая принимает на вход изображения/видео+текст и генерирует текстовые выходы. Эта модель специально оптимизирована для обеспечения лучшей в отрасли…
reka-flash-3
Reka Flash 3 — это универсальная большая языковая модель с 21 миллиардом параметров, настроенная на выполнение инструкций и разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и…
relace-apply-3
Relace Apply 3 — это специализированная LLM для патчинга кода, которая интегрирует предложенные ИИ изменения непосредственно в ваши исходные файлы. Она может применять обновления от GPT-4o, Claude и других моделей в ваши файлы со средней…
relace-search
Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возврата релевантных файлов по запросу пользователя.
remm-slerp-l2-13b
Повторная попытка создания оригинальной MythoMax-L2-B13, но с обновленными моделями. #merge
l3-lunaris-8b
Lunaris 8B — это универсальная модель общего назначения и для ролевых игр, основанная на Llama 3. Она представляет собой стратегическое объединение нескольких моделей, разработанное для баланса между креативностью, улучшенной логикой и…
l3-euryale-70b
Euryale 70B v2.1 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k).
l3.1-70b-hanami-x1
Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).
l3.1-euryale-70b
Euryale L3.1 70B v2.2 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).
l3.3-euryale-70b
Euryale L3.3 70B — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).
all-minilm-l12-v2
Модель эмбеддингов all-MiniLM-L12-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как…
all-minilm-l6-v2
Модель встраивания all-MiniLM-L6-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, обеспечивая высококачественные семантические представления, которые идеально подходят для последующих задач, таких…
all-mpnet-base-v2
Модель эмбеддингов all-mpnet-base-v2 кодирует предложения и короткие абзацы в 768-мерное плотное векторное пространство, предоставляя высокоточные семантические эмбеддинги, хорошо подходящие для таких задач, как информационный поиск,…
multi-qa-mpnet-base-dot-v1
Модель эмбеддингов multi-qa-mpnet-base-dot-v1 преобразует предложения и короткие абзацы в 768-мерное плотное векторное пространство, генерируя высококачественные семантические эмбеддинги, оптимизированные для поиска ответов на вопросы,…
paraphrase-minilm-l6-v2
Модель встраивания paraphrase-MiniLM-L6-v2 преобразует предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая высококачественные семантические встраивания, оптимизированные для обнаружения перефразирований,…
riverflow-v2-fast
Riverflow V2 Fast is the fastest variant of Sourceful's Riverflow 2.0 lineup, best for production deployments and latency-critical workflows.
riverflow-v2-fast-preview
Riverflow V2 Fast Preview — это самый быстрый вариант из линейки предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным…
riverflow-v2-max-preview
Riverflow V2 Max Preview — это самый мощный вариант в линейке предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным семейством…
riverflow-v2-pro
Riverflow V2 Pro is the most powerful variant of Sourceful's Riverflow 2.0 lineup, best for top-tier control and perfect text rendering.
riverflow-v2-standard-preview
Riverflow V2 Standard Preview — это стандартный вариант линейки предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным…
step-3.5-flash
Шаг 3.5 Flash — самая мощная открытая базовая модель StepFun. Построенная на разреженной архитектуре Mixture of Experts (MoE), она выборочно активирует только 11 миллиардов из своих 196 миллиардов параметров на каждый токен. Это модель…
step-3.7-flash
Step 3.7 Flash is StepFun's latest high-efficiency multimodal Mixture-of-Experts model. It pairs a 196B-parameter language backbone with a vision encoder for native image and video understanding, activating roughly 11B parameters per…
router
Switchpoint AI's router instantly analyzes your request and directs it to the optimal AI from an ever-evolving library.
hunyuan-a13b-instruct
Hunyuan-A13B — это языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует…
hy3-preview
Hy3 preview — это высокоэффективная модель Mixture-of-Experts от Tencent, разработанная для агентских рабочих процессов и использования в производстве. Она поддерживает настраиваемые уровни рассуждений в режимах «отключено», «низкий» и…
cydonia-24b-v4.1
Нецензурированная и креативная модель для письма, основанная на Mistral Small 3.2 24B, с хорошей памятью, соблюдением инструкций и интеллектом.
rocinante-12b
Rocinante 12B разработан для увлекательного повествования и богатой прозы.
skyfall-36b-v2
Skyfall 36B v2 — это улучшенная итерация Mistral Small 2501, специально доработанная для повышения креативности, тонкости письма, ролевых игр и связного повествования.
unslopnemo-12b
UnslopNemo v4.1 — это новейшая разработка от создателя Rocinante, предназначенная для приключенческих и ролевых сценариев.
gte-base
Модель gte-base embedding кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, обеспечивая эффективные и действенные семантические эмбеддинги, оптимизированные для задач определения текстового сходства,…
gte-large
Модель gte-large embedding преобразует английские предложения, абзацы и документы средней длины в 1024-мерное плотное векторное пространство, обеспечивая высококачественные семантические эмбеддинги, оптимизированные для задач…
solar-pro-3
Solar Pro 3 — это мощная языковая модель MoE (Mixture-of-Experts) от Upstage. Обладая 102 миллиардами общих параметров и 12 миллиардами активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении…
dolphin-mistral-24b-venice-edition:free
Venice Uncensored Dolphin Mistral 24B Venice Edition — это тонко настроенный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель разработана как «нецензурированный» LLM, настроенный на…
wizardlm-2-8x22b
WizardLM-2 8x22B — это самая передовая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и стабильно превосходит все существующие современные…
palmyra-x5
Palmyra X5 — это самая передовая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов в масштабах предприятия. Она обеспечивает лучшую в отрасли скорость и эффективность при работе с контекстными окнами до 1…
grok-4.20
Grok 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering consistently precise and truthful…
grok-4.20-multi-agent
Grok 4.20 Multi-Agent — это вариант Grok 4.20 от xAI, разработанный для совместных рабочих процессов на основе агентов. Несколько агентов работают параллельно, чтобы проводить глубокие исследования, координировать использование…
grok-4.3
Grok 4.3 — это модель рассуждений от xAI. Она принимает текстовые и графические входные данные с текстовым выводом и подходит для агентских рабочих процессов, задач по следованию инструкциям и приложений, требующих высокой фактической…
grok-build-0.1
Grok Build 0.1 — это быстрая модель кодирования от xAI, разработанная специально для агентских рабочих процессов разработки программного обеспечения. Она поддерживает текстовые и графические входные данные с текстовым выводом и…
grok-imagine-image-quality
Grok Imagine Image Quality — это быстрая, высококачественная модель для генерации и редактирования изображений от xAI. Она принимает текстовые запросы и опциональные референсные изображения, создавая фотореалистичные результаты в…
mimo-v2-flash
MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a…
mimo-v2.5
MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность агентского уровня Pro примерно при вдвое меньшей стоимости вывода, превосходя MiMo-V2-Omni в мультимодальном восприятии в задачах понимания…
mimo-v2.5-pro
MiMo-V2.5-Pro — это флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентских возможностях, сложном программном инжиниринге и долгосрочных задачах, занимая лидирующие позиции в таких бенчмарках, как ClawEval,…
glm-4-32b
GLM 4 32B — это экономичная базовая языковая модель.
glm-4.5
GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications. It leverages a Mixture-of-Experts (MoE) architecture and supports a context length of up to 128k tokens. GLM-4.5 delivers significantly enhanced…
glm-4.5-air
GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter size.…
glm-4.5-air:free
GLM-4.5-Air — это облегченный вариант нашего новейшего семейства флагманских моделей, также специально разработанный для агент-ориентированных приложений. Как и GLM-4.5, он использует архитектуру Mixture-of-Experts (MoE), но с более…
glm-4.5v
GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video…
glm-4.6
По сравнению с GLM-4.5, это поколение имеет несколько ключевых улучшений:
glm-4.6v
GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128K токенов, обрабатывает…
glm-4.7
GLM-4.7 — это новейшая флагманская модель Z.ai, отличающаяся усовершенствованиями в двух ключевых областях: расширенные возможности программирования и более стабильное многошаговое рассуждение/выполнение. Она демонстрирует значительные…
glm-4.7-flash
Будучи современной моделью класса 30B, GLM-4.7-Flash предлагает новую опцию, которая уравновешивает производительность и эффективность. Она дополнительно оптимизирована для использования в агентском кодировании, усиливая возможности…
glm-5
GLM-5 — это флагманская открытая базовая модель Z.ai, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданная для опытных разработчиков, она обеспечивает производительность производственного…
glm-5-turbo
GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в агент-ориентированных средах, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов,…
glm-5.1
GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в решении долгосрочных задач. В отличие от предыдущих моделей, построенных на взаимодействиях минутного уровня, GLM-5.1 может работать…
glm-5v-turbo
GLM-5V-Turbo — это первая нативная мультимодальная базовая модель агента от Z.ai, созданная для визуального кодирования и задач, управляемых агентами. Она нативно обрабатывает изображения, видео и текстовые входные данные, превосходно…