Модели
361 моделей
gpt-4o
GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая вдвое быстрее и будучи на…
jamba-large-1.7
Jamba Large 1.7 — это новейшая модель в открытом семействе Jamba, предлагающая улучшения в обоснованности, следовании инструкциям и общей эффективности. Построенная на гибридной архитектуре SSM-Transformer с контекстным окном 256K, она…
aion-1.0
Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и кодирование. Она построена на DeepSeek-R1, дополненной другими моделями и техниками, такими как Tree of…
aion-1.0-mini
Модель Aion-1.0-Mini с 32 миллиардами параметров является дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, кодирование и логика. Это модифицированный…
aion-2.0
Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивных ролевых игр и сторителлинга. Он особенно силен в привнесении напряжения, кризисов и конфликтов в истории, делая повествование более увлекательным. Он также обрабатывает…
aion-rp-llama-3.1-8b
Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, варианта Arena-Hard-Auto, специфичного для ролевых игр, где LLM оценивают ответы друг друга. Это базовая модель, прошедшая fine-tuning, а не…
olmo-3-32b-think
Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и продвинутых сценариев следования инструкциям. Её возможности обеспечивают высокую…
nova-2-lite-v1
Nova 2 Lite — это быстрая и экономичная модель рассуждений для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста.
nova-lite-v1
Amazon Nova Lite 1.0 — это очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку изображений, видео и текстовых входных данных для генерации текстовых выходных данных. Amazon Nova Lite может обрабатывать…
nova-micro-v1
Amazon Nova Micro 1.0 — это текстовая модель, которая обеспечивает наименьшую задержку ответа в семействе моделей Amazon Nova при очень низкой стоимости. Обладая длиной контекста в 128 тыс. токенов и оптимизированная по скорости и…
nova-premier-v1
Amazon Nova Premier — самая мощная из мультиканальных моделей Amazon для решения сложных задач рассуждения и для использования в качестве лучшего учителя для дистилляции пользовательских моделей.
nova-pro-v1
Amazon Nova Pro 1.0 — это мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого круга задач. По состоянию на декабрь 2024 года она достигает самых современных…
claude-haiku-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Haiku.
claude-sonnet-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Sonnet.
claude-3-haiku
Claude 3 Haiku — это самая быстрая и компактная модель Anthropic для почти мгновенного отклика. Быстрая и точная целевая производительность.
claude-3.5-haiku
Claude 3.5 Haiku предлагает расширенные возможности в скорости, точности кодирования и использовании инструментов. Разработанная для превосходной работы в приложениях реального времени, она обеспечивает быстрое время отклика, что крайне…
claude-fable-5
Claude Fable 5 — это модель класса Mythos от Anthropic, созданная для автономной работы со знаниями и кодирования. Она поддерживает ввод текста, изображений и файлов с текстовым выводом, с поддержкой рассуждений и...
claude-fable-latest
Эта модель всегда перенаправляется на последнюю модель семейства Claude Fable.
claude-haiku-4.5
Claude Haiku 4.5 — это самая быстрая и эффективная модель Anthropic, обеспечивающая интеллект, близкий к передовому, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Соответствуя…
claude-opus-4
Claude Opus 4 признан лучшей в мире моделью для кодирования на момент выпуска, обеспечивая стабильную производительность в сложных, длительных задачах и агентских рабочих процессах. Он устанавливает новые стандарты в разработке…
claude-opus-4.1
Claude Opus 4.1 — это обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждения и агентных задачах. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные…
claude-opus-4.5
Claude Opus 4.5 — это передовая модель рассуждений от Anthropic, оптимизированная для сложной разработки программного обеспечения, агентных рабочих процессов и длительного использования компьютера. Она предлагает мощные мультимодальные…
claude-opus-4.6
Opus 4.6 — это самая мощная модель Anthropic для кодирования и длительных профессиональных задач. Она создана для агентов, которые работают с целыми рабочими процессами, а не с отдельными prompt'ами, что делает её особенно эффективной для…
claude-opus-4.6-fast
Вариант [Opus 4.6](/anthropic/claude-opus-4.6) в быстром режиме — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.
claude-opus-4.7
Opus 4.7 — это следующее поколение семейства Opus от Anthropic, созданное для долгосрочных асинхронных агентов. Основываясь на сильных сторонах Opus 4.6 в кодировании и агентных возможностях, он обеспечивает более высокую…
claude-opus-4.7-fast
Быстрый вариант [Opus 4.7](/anthropic/claude-opus-4.7) — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.
claude-opus-4.8
Claude Opus 4.8 — это самая мощная общедоступная модель Anthropic в семействе Opus. Она поддерживает ввод текста, изображений и файлов с текстовым выводом, с поддержкой рассуждений и контекстным окном в 1M токенов. Она подходит для…
claude-opus-4.8-fast
Вариант [Opus 4.8](/anthropic/claude-opus-4.8) в быстром режиме — идентичные возможности с более высокой скоростью вывода при удвоенной стоимости относительно обычного Opus 4.8.
claude-opus-latest
Эта модель всегда перенаправляется на последнюю модель семейства Claude Opus.
claude-sonnet-4
Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя его как в задачах кодирования, так и в задачах рассуждения с улучшенной точностью и управляемостью. Достигая самых современных показателей…
claude-sonnet-4.5
Claude Sonnet 4.5 — это самая передовая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она демонстрирует передовую производительность в тестах кодирования, таких как…
claude-sonnet-4.6
Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовую производительность в кодировании, работе с агентами и профессиональной деятельности. Она превосходно справляется с итеративной…
coder-large
Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она…
trinity-large-thinking
Trinity Large Thinking — это мощная open source модель для рассуждений от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских рабочих нагрузках и задачах на рассуждение. Видео запуска:…
trinity-mini
Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных…
virtuoso-large
Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она…
bge-base-en-v1.5
Модель встраивания bge-base-en-v1.5 преобразует английские предложения и абзацы в 768-мерные плотные векторы, обеспечивая эффективные, высококачественные семантические встраивания, оптимизированные для поиска, семантического поиска и…
bge-large-en-v1.5
Модель встраивания bge-large-en-v1.5 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические встраивания, оптимизированные для семантического поиска,…
bge-m3
Модель внедрения bge-m3 кодирует предложения, абзацы и длинные документы в 1024-мерное плотное векторное пространство, предоставляя высококачественные семантические внедрения, оптимизированные для многоязычного поиска, семантического…
ernie-4.5-vl-424b-a47b
ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров, из которых 47 миллиардов активны на каждый токен. Она обучена совместно на текстовых и…
seed-1.6
Seed 1.6 — это универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном в 256K.
seed-1.6-flash
Seed 1.6 Flash — это сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно размером 256k и может генерировать выходные данные объемом…
seed-2.0-lite
Seed-2.0-Lite — это универсальная, экономичная рабочая лошадка для предприятий, которая обеспечивает мощные мультимодальные и агентные возможности, предлагая при этом заметно меньшую задержку, что делает её практичным выбором по умолчанию…
seed-2.0-mini
Seed-2.0-mini ориентирован на сценарии с низкой задержкой, высокой конкуренцией и чувствительностью к стоимости, делая акцент на быстром отклике и гибком развертывании инференса. Он обеспечивает производительность, сравнимую с…
ui-tars-1.5-7b
UI-TARS-1.5 — это мультиканальный визуально-языковой агент, оптимизированный для сред с графическим интерфейсом пользователя (GUI), включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Разработанный ByteDance, он основан…
command-a
Command A — это модель с открытым весом и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в агентских, многоязычных и кодовых сценариях использования. По сравнению с другими…
command-r-08-2024
command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненным поиском (RAG) и использования инструментов. В более широком смысле, он лучше справляется с…
command-r-plus-08-2024
command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с пропускной способностью примерно на 50% выше и задержками на 25% ниже по сравнению с предыдущей версией Command R+, при этом аппаратные требования…
command-r7b-12-2024
Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложного рассуждения…
cogito-v2.1-671b
Cogito v2.1 671B MoE представляет собой одну из сильнейших открытых моделей в мире, соответствующую производительности передовых закрытых и открытых моделей. Эта модель обучена с использованием самообучения с подкреплением для достижения…
deepseek-chat
DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на возможностях следования инструкциям и написания кода предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, согласно опубликованным оценкам, модель…
deepseek-chat-v3-0324
DeepSeek V3, модель с 685 миллиардами параметров и архитектурой Mixture-of-Experts, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek.
deepseek-chat-v3.1
DeepSeek-V3.1 — это большая гибридная модель рассуждений (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и не-мышления с помощью шаблонов prompt. Она расширяет базовую модель DeepSeek-V3 двухфазным процессом…
deepseek-v3.1-terminus
DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщали пользователи, включая языковую согласованность и…
deepseek-v3.2
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными возможностями рассуждений и использования инструментов в качестве агента. Она представляет DeepSeek Sparse…
deepseek-v3.2-exp
DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek в качестве промежуточного шага между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с…
deepseek-v4-flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством параметров 284B и 13B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для быстрого…
deepseek-v4-pro
DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общим количеством параметров 1,6T и 49B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для продвинутого рассуждения,…
deepseek-r1
DeepSeek R1 уже здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Он имеет 671 миллиард параметров, из которых 37 миллиардов активны при проходе вывода.
deepseek-r1-0528
Обновление от 28 мая к [оригинальному DeepSeek R1](/deepseek/deepseek-r1). Производительность наравне с [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671B…
deepseek-r1-distill-llama-70b
DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в…
deepseek-r1-distill-qwen-32b
DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель, основанная на [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Она превосходит o1-mini…
rnj-1-instruct
Rnj-1 — это семейство плотных моделей с открытым исходным кодом и 8 миллиардами параметров, разработанное Essential AI и обученное с нуля с акцентом на программирование, математику и научные рассуждения. Модель демонстрирует высокую…
free
Самый простой способ получить бесплатный инференс. Hubris/free — это маршрутизатор, который случайным образом выбирает бесплатные модели из моделей, доступных на Hubris. Маршрутизатор интеллектуально фильтрует модели, поддерживающие…
gemini-flash-latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
gemini-pro-latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
gemini-2.5-flash
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она включает встроенные возможности «мышления», что позволяет ей…
gemini-2.5-flash-lite
Gemini 2.5 Flash-Lite — это облегченная модель рассуждений в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она предлагает улучшенную пропускную способность, более быструю генерацию токенов и…
gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash-Lite — это облегченная модель рассуждений в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и экономичности. Она предлагает улучшенную пропускную способность, более быструю генерацию токенов и лучшую…
gemini-2.5-pro
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать при формировании ответов…
gemini-2.5-pro-preview-05-06
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с…
gemini-2.5-pro-preview
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной…
gemini-3-flash-preview
Gemini 3 Flash Preview — это высокоскоростная, высокоэффективная модель мышления, разработанная для агентских рабочих процессов, многоходовых чатов и помощи в кодировании. Она обеспечивает производительность рассуждений и использования…
gemini-3.1-flash-lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также…
gemini-3.1-flash-lite-preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом данных. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini…
gemini-3.1-pro-preview
Gemini 3.1 Pro Preview — это передовая модель рассуждений от Google, обеспечивающая повышенную производительность в области разработки программного обеспечения, улучшенную надёжность агентов и более эффективное использование токенов в…
gemini-3.1-pro-preview-customtools
Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда доступны более эффективные сторонние или…
gemini-3.5-flash
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и…
gemini-embedding-001
gemini-embedding-001 предоставляет унифицированный передовой опыт во всех областях, включая науку, юриспруденцию, финансы и программирование. Эта модель эмбеддингов неизменно занимает лидирующие позиции в многоязычной таблице лидеров…
gemini-embedding-2
Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой…
gemini-embedding-2-preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с…
gemma-2-27b-it
Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые использовались для создания [моделей Gemini](/models?q=gemini).
gemma-3-12b-it
Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3-27b-it
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста, а также текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3-4b-it
Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…
gemma-3n-e4b-it
Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальные входные данные, включая текст,…
gemma-4-26b-a4b-it
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на 25,2 млрд общих параметров, только 3,8 млрд активируются на каждый токен во время вывода — обеспечивая качество,…
gemma-4-26b-a4b-it:free
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что…
gemma-4-31b-it
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая ввод текста и изображений с выводом текста. Она имеет контекстное окно в 256 тысяч токенов, настраиваемый режим…
gemma-4-31b-it:free
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом…
lyria-3-clip-preview
30-секундные клипы стоят $0.04 за клип. Lyria 3 — это семейство моделей Google для генерации музыки, доступное через Gemini API. С помощью Lyria 3 вы можете генерировать высококачественное стерео аудио с частотой 48 кГц из текстовых…
lyria-3-pro-preview
Полные песни стоят $0.08 за песню. Lyria 3 — это семейство моделей для генерации музыки от Google, доступное через Gemini API. С помощью Lyria 3 вы можете генерировать высококачественное стерео аудио с частотой 48 кГц из текстовых запросов…
gemini-2.5-flash-image
Gemini 2.5 Flash Image, также известный как «Nano Banana», теперь общедоступен. Это современная модель генерации изображений с контекстным пониманием. Она способна генерировать и редактировать изображения, а также вести многоходовые…
gemini-3.1-flash-image-preview
Предварительная версия Gemini 3.1 Flash Image, также известная как «Nano Banana 2», является новейшей передовой моделью Google для генерации и редактирования изображений, обеспечивающей визуальное качество профессионального уровня на…
gemini-3-pro-image-preview
Nano Banana Pro — это самая передовая модель Google для генерации и редактирования изображений, построенная на базе Gemini 3 Pro. Она расширяет возможности оригинальной Nano Banana за счет значительно улучшенного мультимодального мышления,…
granite-4.0-h-micro
Granite-4.0-H-Micro — это модель семейства Granite 4 с 3 миллиардами параметров. Эти модели являются новейшими в серии моделей, выпущенных IBM. Они тонко настроены для вызова инструментов с длинным контекстом.
granite-4.1-8b
Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров от IBM, использующая только декодер, часть семейства Granite 4.1. Она поддерживает контекстное окно в 131K токенов и предназначена для корпоративных задач, включая…
mercury-2
Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM (dLLM) для рассуждений. Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая скорости >1000…
ling-2.6-1t
Ling-2.6-1T — это мгновенная (инструктивная) модель от inclusionAI и флагман компании с триллионом параметров, разработанная для реальных агентов, которым требуется быстрое выполнение и высокая эффективность в масштабе. Она использует…
ling-2.6-flash
Ling-2.6-flash — это мгновенная (инструктивная) модель от inclusionAI с общим количеством параметров 104B и 7.4B активных параметров, разработанная для реальных агентов, которым требуются быстрые ответы, высокая производительность и…
ring-2.6-1t
Ring-2.6-1T — это модель мышления с 1T параметрами и 63B активными параметрами, созданная для реальных рабочих процессов агентов, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для кодирующих…
inflection-3-pi
Inflection 3 Pi обеспечивает работу чат-бота [Pi](https://pi.ai) от Inflection, включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и превосходно справляется со сценариями,…
inflection-3-productivity
Inflection 3 Productivity оптимизирован для следования инструкциям. Он лучше подходит для задач, требующих вывода JSON или точного соблюдения предоставленных рекомендаций. Он имеет доступ к последним новостям.
e5-base-v2
Модель эмбеддингов e5-base-v2 кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как семантический…
e5-large-v2
Модель эмбеддингов e5-large-v2 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические эмбеддинги, оптимизированные для задач извлечения информации,…
multilingual-e5-large
Модель multilingual-e5-large embedding кодирует предложения, абзацы и документы на более чем 90 языках в 1024-мерное плотное векторное пространство, обеспечивая надежные семантические эмбеддинги, оптимизированные для многоязычного поиска,…
kat-coder-pro-v2
KAT-Coder-Pro V2 — это новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, разработанная для сложной корпоративной разработки программного обеспечения и интеграции SaaS. Она основывается на агентных возможностях…
lfm-2-24b-a2b
LFM2-24B-A2B — это крупнейшая модель в семействе гибридных архитектур LFM2, разработанных для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных…
lfm-2.5-1.2b-instruct:free
LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель, настроенная на выполнение инструкций, созданная для быстрого ИИ на устройстве. Она обеспечивает высокое качество чата при размере 1,2 миллиарда параметров, с эффективным…
lfm-2.5-1.2b-thinking:free
LFM2.5-1.2B-Thinking — это легковесная модель, ориентированная на рассуждения, оптимизированная для агентских задач, извлечения данных и RAG, при этом комфортно работающая на периферийных устройствах. Она поддерживает длинный контекст (до…
llama-guard-3-8b
Llama Guard 3 — это предварительно обученная модель Llama-3.1-8B, доработанная для классификации контента по безопасности. Как и предыдущие версии, она может использоваться для классификации контента как во входных данных LLM…
magnum-v4-72b
Это серия моделей, разработанных для воспроизведения качества прозы моделей Claude 3, в частности Sonnet и Opus.
weaver
Попытка воссоздать многословность в стиле Claude, но не ожидайте того же уровня связности или памяти. Предназначено для использования в ролевых играх/нарративных ситуациях.
llama-3-70b-instruct
Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.
llama-3-8b-instruct
Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.
llama-3.1-70b-instruct
Последнее поколение моделей Meta (Llama 3.1) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, оптимизирована для высококачественных диалоговых сценариев использования.
llama-3.1-8b-instruct
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, быстра и эффективна.
llama-3.2-11b-vision-instruct
Llama 3.2 11B Vision — это мультимодальная модель с 11 миллиардами параметров, разработанная для решения задач, сочетающих визуальные и текстовые данные. Она превосходно справляется с такими задачами, как создание подписей к изображениям и…
llama-3.2-1b-instruct
Llama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и многоязычный текстовый анализ. Её меньший размер позволяет ей…
llama-3.2-3b-instruct
Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…
llama-3.2-3b-instruct:free
Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…
llama-3.3-70b-instruct
Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции и…
llama-3.3-70b-instruct:free
Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции, только для…
llama-4-maverick
Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультиязычная модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой проход (всего 400…
llama-4-scout
Llama 4 Scout 17B Instruct (16E) — это языковая модель типа «смесь экспертов» (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и…
llama-guard-4-12b
Llama Guard 4 — это мультимодальная предварительно обученная модель, созданная на основе Llama 4 Scout и доработанная для классификации безопасности контента. Как и предыдущие версии, она может использоваться для классификации контента как…
phi-4
[Microsoft Research](/microsoft) Phi-4 разработан для эффективного выполнения сложных задач рассуждения и может эффективно работать в условиях ограниченной памяти или там, где требуются быстрые ответы.
phi-4-mini-instruct
Phi-4-mini-instruct — это легковесная открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с акцентом на высококачественные, насыщенные рассуждениями данные. Модель принадлежит к семейству…
minimax-m1
MiniMax-M1 — это крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с настраиваемым…
minimax-m2
MiniMax-M2 — это компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и агентских рабочих процессов. Имея 10 миллиардов активированных параметров (всего 230 миллиардов), она обеспечивает почти…
minimax-m2-her
MiniMax M2-her — это большая языковая модель, ориентированная на диалог, созданная для иммерсивных ролевых игр, чатов, управляемых персонажами, и выразительных многоходовых бесед. Разработанная для поддержания согласованности тона и…
minimax-m2.1
MiniMax-M2.1 — это легковесная, современная большая языковая модель (LLM), оптимизированная для кодирования, агентских рабочих процессов и разработки современных приложений. Имея всего 10 миллиардов активированных параметров, она…
minimax-m2.5
MiniMax-M2.5 — это современная большая языковая модель (SOTA LLM), разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных и сложных реальных цифровых рабочих средах, M2.5 развивает опыт кодирования M2.1,…
minimax-m2.7
MiniMax-M2.7 — это крупная языковая модель нового поколения, разработанная для автономной, реальной продуктивности и непрерывного совершенствования. Созданная для активного участия в собственной эволюции, M2.7 интегрирует передовые…
minimax-m3
MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает текстовые, графические и видеовходы с текстовым выводом, имеет контекстное окно в 1M токенов и подходит для долгосрочной агентной работы, кодирования и…
minimax-01
MiniMax-01 сочетает MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Он имеет 456 миллиардов параметров, при этом 45,9 миллиарда параметров активируются за одно логическое выведение, и может обрабатывать…
mistral-large
Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…
mistral-large-2407
Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…
codestral-2508
Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов.
codestral-embed-2505
Mistral Codestral Embed специально разработан для кода, идеально подходит для встраивания кодовых баз данных, репозиториев и обеспечения работы помощников по кодированию с использованием передовых методов извлечения информации.
devstral-2512
Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная transformer-модель со 123 миллиардами параметров, поддерживающая контекстное окно размером 256K.
ministral-14b-2512
Крупнейшая модель в семействе Ministral 3, Ministral 3 14B, предлагает передовые возможности и производительность, сравнимую с её более крупным аналогом Mistral Small 3.2 24B. Мощная и эффективная языковая модель с возможностями зрения.
ministral-3b-2512
Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.
ministral-8b-2512
Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.
mistral-embed-2312
Mistral Embed — это специализированная модель эмбеддингов для текстовых данных, оптимизированная для семантического поиска и RAG-приложений. Разработанная Mistral AI в конце 2023 года, она генерирует 1024-мерные векторы, которые эффективно…
mistral-large-2512
Mistral Large 3 2512 — это самая мощная на сегодняшний день модель Mistral, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 млрд активных параметров (всего 675 млрд) и выпущенная под лицензией Apache 2.0.
mistral-medium-3
Mistral Medium 3 — это высокопроизводительная языковая модель корпоративного уровня, разработанная для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она сочетает в себе самые современные…
mistral-medium-3.1
Mistral Medium 3.1 — это обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного уровня, разработанной для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она…
mistral-medium-3-5
Mistral Medium 3.5 — это плотная 128B модель от Mistral AI, следующая инструкциям. Она поддерживает текстовые и графические входные данные с текстовым выводом и предназначена для агентских рабочих процессов, кодирования и сложного…
mistral-nemo
Модель с 12 миллиардами параметров и длиной контекста 128 тысяч токенов, разработанная Mistral в сотрудничестве с NVIDIA.
mistral-small-24b-instruct-2501
Mistral Small 3 — это языковая модель с 24 миллиардами параметров, оптимизированная для работы с низкой задержкой при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает как предварительно обученные, так…
mistral-small-3.1-24b-instruct
Mistral Small 3.1 24B Instruct — это обновленный вариант Mistral Small 3 (2501), включающий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в задачах текстового…
mistral-small-3.2-24b-instruct
Mistral-Small-3.2-24B-Instruct-2506 — это обновленная 24B-параметрическая модель от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с версией 3.1, версия 3.2 значительно…
mistral-small-2603
Mistral Small 4 — это следующий крупный релиз в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе мощные способности к рассуждению от Magistral, мультимодальное…
mixtral-8x22b-instruct
Официальная инструктивная fine-tuned версия [Mixtral 8x22B](/models/mistralai/mixtral-8x22b) от Mistral. Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая беспрецедентную экономическую эффективность для своего…
mistral-saba
Mistral Saba — это языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обученная…
voxtral-small-24b-2507
Voxtral Small — это улучшенная версия Mistral Small 3, включающая передовые возможности аудиоввода при сохранении лучшей в своем классе производительности текста. Она превосходно справляется с транскрипцией речи, переводом и пониманием…
kimi-latest
Эта модель всегда перенаправляется на последнюю модель в семействе MoonshotAI Kimi.
kimi-k2
Kimi K2 Instruct — это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных параметров на каждый прямой проход. Она оптимизирована для…
kimi-k2-0905
Kimi K2 0905 — это сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных…
kimi-k2-thinking
Kimi K2 Thinking — это самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 в область агентных рассуждений с длительным горизонтом. Построенная на архитектуре Mixture-of-Experts (MoE) с…
kimi-k2.5
Kimi K2.5 — это нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемой агентной системы. Созданная на базе Kimi K2 с продолженным предварительным обучением на…
kimi-k2.6
Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, разработанная для долгосрочного кодирования, генерации UI/UX на основе кодирования и оркестрации мультиагентов. Она справляется со сложными сквозными задачами…
kimi-k2.6:free
Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, разработанная для долгосрочного кодирования, генерации UI/UX на основе кода и оркестрации мультиагентных систем. Она справляется со сложными сквозными задачами…
morph-v3-fast
Самая быстрая модель Morph для применения изменений в коде. ~10 500 токенов/сек с точностью 96% для быстрых преобразований кода.
morph-v3-large
Высокоточная модель Morph для сложных изменений кода. ~4500 токенов/сек с точностью 98% для точных преобразований кода.
mythomax-l2-13b
Одна из самых высокопроизводительных и популярных fine-tune-версий Llama 2 13B, с богатыми описаниями и ролевыми играми. #merge
nex-n2-pro:free
Nex-N2-Pro — это агентная модель MoE от Nex AGI, с 17 миллиардами активных параметров из 397 миллиардов общих. Построенная на архитектуре Qwen3.5, она принимает текстовые и графические входные данные и производит...
hermes-3-llama-3.1-405b
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждения, многооборотные диалоги, когерентность в…
hermes-3-llama-3.1-405b:free
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждение, многоходовые диалоги, связность в длинном…
hermes-3-llama-3.1-70b
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие,…
hermes-4-405b
Hermes 4 — это крупномасштабная модель рассуждений, построенная на базе Meta-Llama-3.1-405B и выпущенная Nous Research. Она представляет гибридный режим рассуждений, в котором модель может выбирать между внутренним обдумыванием с…
hermes-4-70b
Hermes 4 70B — это гибридная модель рассуждений от Nous Research, построенная на Meta-Llama-3.1-70B. Она представляет тот же гибридный режим, что и более крупная версия 405B, позволяя модели либо отвечать напрямую, либо генерировать явные…
llama-3.3-nemotron-super-49b-v1.5
Llama-3.3-Nemotron-Super-49B-v1.5 — это модель для рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, разработанная на основе Llama-3.3-70B-Instruct от Meta с контекстом 128K. Она прошла пост-обучение для…
llama-nemotron-embed-vl-1b-v2:free
Модель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для многомодального поиска ответов на вопросы. Модель может встраивать «документы» в виде изображений, текста или изображений и текста...
nemotron-3-nano-30b-a3b
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, предназначенная для разработчиков, создающих специализированные агентные системы ИИ.
nemotron-3-nano-30b-a3b:free
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью...
nemotron-3-nano-omni-30b-a3b-reasoning:free
NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель 30B-A3B, разработанная для функционирования в качестве субагента восприятия и контекста в корпоративных агентских системах. Она принимает текст, изображения, видео и...
nemotron-3-super-120b-a12b
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях.…
nemotron-3-super-120b-a12b:free
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, которая активирует всего 12 миллиардов параметров для достижения максимальной вычислительной эффективности и точности в сложных многоагентных…
nemotron-3-ultra-550b-a55b
NVIDIA Nemotron 3 Ultra — это открытая модель от NVIDIA для рассуждений и оркестрации, с 55 млрд активных параметров из 550 млрд общих (MoE). Построенная на гибридной архитектуре Transformer-Mamba mixture-of-experts, она поддерживает…
nemotron-3-ultra-550b-a55b:free
NVIDIA Nemotron 3 Ultra — это открытая модель для рассуждений и оркестрации от NVIDIA, с 55 миллиардами активных параметров из 550 миллиардов общих (MoE). Построенная на гибридной архитектуре Transformer-Mamba mixture-of-experts, она...
nemotron-3.5-content-safety:free
NVIDIA Nemotron 3.5 Content Safety — это компактная 4B-параметрическая мультимодальная модель-ограничитель от NVIDIA, доработанная на основе Google Gemma-3-4B. Она модерирует как входные данные, так и ответы от LLM и VLM, принимая...
nemotron-nano-12b-v2-vl:free
NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель рассуждений с 12 миллиардами параметров, разработанная для понимания видео и анализа документов. Она представляет гибридную архитектуру Transformer-Mamba, сочетающую точность…
nemotron-nano-9b-v2
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная с нуля компанией NVIDIA и предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы и задачи пользователей, сначала генерируя…
nemotron-nano-9b-v2:free
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная и обученная с нуля компанией NVIDIA, предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы пользователей и...
gpt-latest
Эта модель всегда перенаправляется на последнюю модель семейства OpenAI GPT.
gpt-mini-latest
Эта модель всегда перенаправляет на новейшую модель семейства OpenAI GPT Mini.
gpt-audio
Модель gpt-audio — это первая общедоступная аудиомодель от OpenAI. Новый снимок включает улучшенный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Стоимость аудио составляет 32 доллара за…
gpt-audio-mini
Экономичная версия GPT Audio. Новый снимок включает обновленный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Входные данные оцениваются в $0.60 за миллион токенов, а выходные — в $2.40 за…
gpt-chat-latest
GPT Chat Latest указывает на стабильный API-псевдоним OpenAI `chat-latest`, который всегда разрешается в последнюю модель Instant chat, используемую в ChatGPT. По мере того, как OpenAI будет выпускать новые обновления модели Instant в…
gpt-3.5-turbo
GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она способна понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач автодополнения.
gpt-3.5-turbo-0613
GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач завершения.
gpt-3.5-turbo-16k
Эта модель предлагает в четыре раза большую длину контекста по сравнению с gpt-3.5-turbo, что позволяет ей обрабатывать примерно 20 страниц текста за один запрос при более высокой стоимости. Данные для обучения: до сентября 2021 года.
gpt-3.5-turbo-instruct
Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструкционных запросов и исключающим оптимизации, связанные с чатом. Данные обучения: до сентября 2021 года.
gpt-4
Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультиканальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря своим более обширным общим знаниям и продвинутым…
gpt-4-turbo
Новейшая модель GPT-4 Turbo с возможностями зрения. Запросы со зрением теперь могут использовать режим JSON и вызов функций.
gpt-4-turbo-preview
Предварительная версия модели GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Данные для обучения: до декабря 2023 года.
gpt-4.1
GPT-4.1 — это флагманская большая языковая модель, оптимизированная для расширенного следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион…
gpt-4.1-mini
GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, сопоставимую с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% в сложных тестах на…
gpt-4.1-nano
Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря контекстному окну в 1 миллион токенов и…
gpt-4o-2024-05-13
GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая в два раза быстрее и будучи…
gpt-4o-2024-08-06
Версия GPT-4o от 06.08.2024 предлагает улучшенную производительность в структурированных выходных данных, с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте…
gpt-4o-2024-11-20
Версия GPT-4o от 20.11.2024 предлагает улучшенные возможности творческого письма с более естественным, увлекательным и адаптированным стилем для повышения релевантности и читабельности. Она также лучше работает с загруженными файлами,…
gpt-4o-search-preview
Предварительная версия поиска GPT-4o — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.
gpt-4o-mini
GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.
gpt-4o-mini-2024-07-18
GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.
gpt-4o-mini-search-preview
Предварительная версия поиска GPT-4o mini — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.
gpt-5
GPT-5 — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…
gpt-5-chat
GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-ориентированных бесед в корпоративных приложениях.
gpt-5-codex
GPT-5-Codex — это специализированная версия GPT-5, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого…
gpt-5-image
Image сочетает модель GPT-5 от OpenAI с передовыми возможностями генерации изображений. Она предлагает значительные улучшения в рассуждениях, качестве кода и пользовательском опыте, одновременно включая превосходное следование инструкциям,…
gpt-5-image-mini
GPT-5 Image Mini сочетает в себе передовые языковые возможности OpenAI на базе GPT-5 Mini с GPT Image 1 Mini для эффективной генерации изображений. Эта нативно мультимодальная модель отличается превосходным следованием инструкциям,…
gpt-5-mini
GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более лёгких задач, требующих рассуждений. Она обеспечивает те же преимущества GPT-5 в следовании инструкциям и настройке безопасности, но с уменьшенной задержкой и…
gpt-5-nano
GPT-5-Nano — это самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрого взаимодействия и сред со сверхнизкой задержкой. Хотя его глубина рассуждений ограничена по сравнению с более…
gpt-5-pro
GPT-5 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…
gpt-5.1
GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильное общецелевое рассуждение, улучшенное следование инструкциям и более естественный стиль беседы по сравнению с GPT-5. Она использует адаптивное…
gpt-5.1-chat
GPT-5.1 Chat (также известный как Instant) — это быстрый, легковесный представитель семейства 5.1, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы…
gpt-5.1-codex
GPT-5.1-Codex — это специализированная версия GPT-5.1, оптимизированная для разработки программного обеспечения и рабочих процессов кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного,…
gpt-5.1-codex-max
GPT-5.1-Codex-Max — это новейшая агентная модель кодирования от OpenAI, разработанная для длительных задач по разработке программного обеспечения с высоким контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на…
gpt-5.1-codex-mini
GPT-5.1-Codex-Mini — это уменьшенная и более быстрая версия GPT-5.1-Codex
gpt-5.2
GPT-5.2 — это новейшая пограничная модель серии GPT-5, предлагающая более высокую производительность в режиме агента и при работе с длинным контекстом по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического…
gpt-5.2-chat
GPT-5.2 Chat (также известный как Instant) — это быстрый и легковесный член семейства 5.2, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы выборочно…
gpt-5.2-pro
GPT-5.2 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности при работе с длинным контекстом по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих…
gpt-5.2-codex
GPT-5.2-Codex — это обновленная версия GPT-5.1-Codex, оптимизированная для разработки программного обеспечения и рабочих процессов кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого…
gpt-5.3-chat
GPT-5.3 Chat — это обновление самой используемой модели ChatGPT, которое делает повседневные беседы более плавными, полезными и непосредственно помогающими. Оно обеспечивает более точные ответы с лучшей контекстуализацией и значительно…
gpt-5.3-codex
GPT-5.3-Codex — это самая передовая агентная модель кодирования от OpenAI, сочетающая в себе передовую производительность программной инженерии GPT-5.2-Codex с более широкими возможностями рассуждения и профессиональными знаниями GPT-5.2.…
gpt-5.4
GPT-5.4 — это новейшая пограничная модель OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. на вход, 128 тыс. на выход) с поддержкой текстового и графического…
gpt-5.4-image-2
Image 2 сочетает модель GPT-5.4 от OpenAI с передовыми возможностями генерации изображений от GPT Image 2. Это обеспечивает богатые мультимодальные рабочие процессы, позволяя пользователям беспрепятственно переходить между рассуждениями,…
gpt-5.4-mini
GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и графические входные данные с высокой производительностью в…
gpt-5.4-nano
GPT-5.4 nano — это самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и требующих большого объема обработки. Он поддерживает текстовые и графические входные данные и разработан для…
gpt-5.4-pro
GPT-5.4 Pro — это самая передовая модель OpenAI, основанная на унифицированной архитектуре GPT-5.4 с расширенными возможностями рассуждений для сложных и ответственных задач. Она имеет контекстное окно размером более 1 млн токенов (922…
gpt-5.5
GPT-5.5 — это передовая модель OpenAI, разработанная для сложных профессиональных рабочих нагрузок, основанная на GPT-5.4 с более сильным рассуждением, более высокой надежностью и улучшенной эффективностью токенов для сложных задач. Она…
gpt-5.5-pro
GPT-5.5 Pro — это высокопроизводительная модель OpenAI, оптимизированная для глубокого анализа и точности в сложных, ответственных рабочих нагрузках. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. входных, 128 тыс.…
gpt-oss-120b
gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) с 117 миллиардами параметров от OpenAI, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…
gpt-oss-120b:free
gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) от OpenAI с 117 миллиардами параметров, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…
gpt-oss-20b
gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на один прямой проход, оптимизированную для…
gpt-oss-20b:free
gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на прямой проход, оптимизированную для...
gpt-oss-safeguard-20b
gpt-oss-safeguard-20b — это модель для рассуждений о безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта открытая модель Mixture-of-Experts (MoE) с 21 миллиардом параметров обеспечивает меньшую задержку для задач безопасности,…
o1
Новейшее и самое мощное семейство моделей от OpenAI, o1, разработано для того, чтобы тратить больше времени на обдумывание перед ответом. Серия моделей o1 обучена с использованием крупномасштабного обучения с подкреплением для рассуждений…
o1-pro
Модели серии o1 обучены с использованием обучения с подкреплением, чтобы обдумывать свои ответы и выполнять сложное рассуждение. Модель o1-pro использует больше вычислительных ресурсов, чтобы обдумывать более тщательно и предоставлять…
o3
o3 — это всесторонне развитая и мощная модель, охватывающая различные области. Она устанавливает новый стандарт для задач по математике, естественным наукам, программированию и визуальному мышлению. Она также превосходно справляется с…
o3-deep-research
o3-deep-research — это продвинутая модель OpenAI для глубоких исследований, разработанная для решения сложных, многоэтапных исследовательских задач.
o3-mini
OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно превосходно проявляющая себя в науке, математике и кодировании.
o3-mini-high
OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), но с параметром `reasoning_effort`, установленным на `high`.
o3-pro
Модели серии o обучены с использованием обучения с подкреплением, чтобы думать, прежде чем отвечать, и выполнять сложное рассуждение. Модель o3-pro использует больше вычислительных ресурсов, чтобы думать усерднее и предоставлять неизменно…
o4-mini
OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении мощных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует…
o4-mini-deep-research
o4-mini-deep-research — это более быстрая и доступная модель для глубоких исследований от OpenAI, идеально подходящая для решения сложных, многоэтапных исследовательских задач.
o4-mini-high
OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), но с параметром `reasoning_effort`, установленным на `high`.
text-embedding-3-large
`text-embedding-3-large` — это самая мощная модель встраивания OpenAI для задач как на английском, так и на других языках. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности…
text-embedding-3-small
text-embedding-3-small — это улучшенная, более производительная версия модели встраивания ada от OpenAI. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности между двумя…
text-embedding-ada-002
text-embedding-ada-002 — это устаревшая модель для создания текстовых эмбеддингов от OpenAI.
owl-alpha
Owl Alpha — это высокопроизводительная базовая модель, разработанная для агентных рабочих нагрузок. Нативно поддерживает использование инструментов и задачи с длинным контекстом, демонстрируя высокую производительность в генерации кода,…
perceptron-mk1
Perceptron Mk1 (Mark One) — это высококачественная визуально-языковая модель Perceptron для видео и воплощенного мышления.** Она принимает изображения и видео в сочетании с запросами на естественном языке и выдает подробные ответы с…
pplx-embed-v1-0.6b
pplx-embed-v1-0.6B — это одна из передовых моделей встраивания текста от Perplexity, созданная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного поиска текста, а модель с 0.6B…
pplx-embed-v1-4b
pplx-embed-v1 -4B — одна из передовых моделей Perplexity для создания текстовых эмбеддингов, разработанная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного текстового поиска, а модель…
sonar
Sonar — это легковесный, доступный, быстрый и простой в использовании инструмент, теперь с цитированием и возможностью настройки источников. Он разработан для компаний, которым необходимы легковесные функции вопросов и ответов,…
sonar-deep-research
Sonar Deep Research — это модель, ориентированная на исследования, разработанная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора…
sonar-pro
Примечание: Цены Sonar Pro включают цены на поиск Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)
sonar-pro-search
Доступный исключительно через API, новый режим Pro Search модели Sonar Pro является самой передовой агентной поисковой системой Perplexity. Он разработан для более глубокого анализа и рассуждений. Эта модель обеспечивает работу режима Pro…
sonar-reasoning-pro
Примечание: В стоимость Sonar Pro включена стоимость поиска Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)
laguna-m.1:free
Laguna M.1 — это флагманская модель кодирующего агента от [Poolside](https://poolside.ai), оптимизированная для сложных задач разработки программного обеспечения. Разработанная для агентских рабочих процессов кодирования, она поддерживает…
laguna-xs.2:free
Laguna XS.2 — это модель второго поколения в классе размера XS от [Poolside](https://poolside.ai), их серии эффективных кодирующих агентов. Она сочетает возможности вызова инструментов и рассуждения с компактным размером, предлагая...
intellect-3
INTELLECT-3 — это модель Mixture-of-Experts с 106 миллиардами параметров (12 миллиардов активных), дообученная на основе GLM-4.5-Air-Base с использованием контролируемой донастройки (SFT) с последующим крупномасштабным обучением с…
qwen-plus-2025-07-28
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-plus-2025-07-28:thinking
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-plus
Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, обладающую сбалансированным сочетанием производительности, скорости и стоимости.
qwen-2.5-7b-instruct
Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:
qwen2.5-vl-72b-instruct
Qwen2.5-VL отлично распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также обладает высокой способностью анализировать тексты, диаграммы, значки, графику и макеты внутри изображений.
qwen3-14b
Qwen3-14B — это плотная причинная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления»…
qwen3-235b-a22b
Qwen3-235B-A22B — это модель Mixture-of-Experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров за один прямой проход. Она поддерживает бесшовное переключение между режимом «мышления» для…
qwen3-235b-a22b-2507
Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на инструкции языковая модель типа Mixture-of-Experts, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров на прямой проход. Она оптимизирована для…
qwen3-235b-a22b-thinking-2507
Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждения. Она активирует 22B из своих 235B параметров за один прямой проход и…
qwen3-30b-a3b
Qwen3, последнее поколение серии больших языковых моделей Qwen, включает в себя как плотную архитектуру, так и архитектуру MoE (mixture-of-experts), чтобы преуспеть в рассуждениях, многоязычной поддержке и продвинутых агентских задачах. Её…
qwen3-30b-a3b-instruct-2507
Qwen3-30B-A3B-Instruct-2507 — это языковая модель Qwen с 30,5 миллиардами параметров, использующая архитектуру MoE, с 3,3 миллиардами активных параметров на вывод. Она работает в немыслящем режиме и предназначена для высококачественного…
qwen3-30b-a3b-thinking-2507
Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений Mixture-of-Experts с 30 миллиардами параметров, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель разработана специально для «режима мышления»,…
qwen3-32b
Qwen3-32B — это причинная языковая модель с плотной архитектурой и 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между…
qwen3-8b
Qwen3-8B — это плотная причинная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивного рассуждения, так и для эффективного диалога. Она поддерживает плавное переключение между…
qwen3-coder-30b-a3b-instruct
Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 миллиардами параметров и 128 экспертами (8 активных за один прямой проход), разработанная для продвинутой генерации кода, понимания репозиториев и использования…
qwen3-coder
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…
qwen3-coder:free
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…
qwen3-coder-flash
Qwen3 Coder Flash — это быстрая и экономичная версия проприетарной модели Qwen3 Coder Plus от Alibaba. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и…
qwen3-coder-next
Qwen3-Coder-Next — это причинная языковая модель с открытым весом, оптимизированная для кодирующих агентов и локальных рабочих процессов разработки. Она использует разреженную MoE-архитектуру с общим количеством параметров 80B и всего 3B…
qwen3-coder-plus
Qwen3 Coder Plus — это проприетарная версия Alibaba модели Qwen3 Coder 480B A35B с открытым исходным кодом. Это мощная модель кодирующего агента, специализирующаяся на автономном программировании посредством вызова инструментов и…
qwen3-embedding-4b
Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…
qwen3-embedding-8b
Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…
qwen3-max
Qwen3-Max — это обновленный релиз, основанный на серии Qwen3, предлагающий значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате знаний с длинным хвостом по сравнению с версией от января 2025 года.…
qwen3-max-thinking
Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для высокоответственных когнитивных задач, требующих глубоких, многошаговых рассуждений. За счет значительного увеличения мощности модели и вычислительных…
qwen3-next-80b-a3b-instruct
Qwen3-Next-80B-A3B-Instruct — это чат-модель из серии Qwen3-Next, настроенная на выполнение инструкций и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с…
qwen3-next-80b-a3b-instruct:free
Qwen3-Next-80B-A3B-Instruct — это чат-модель серии Qwen3-Next, настроенная на инструкции и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с рассуждениями,…
qwen3-next-80b-a3b-thinking
Qwen3-Next-80B-A3B-Thinking — это чат-модель, ориентированная на рассуждения, из линейки Qwen3-Next, которая по умолчанию выводит структурированные трассировки «мышления». Она разработана для решения сложных многошаговых задач:…
qwen3-vl-235b-a22b-instruct
Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct предназначена для общего использования в задачах «зрение-язык» (VQA,…
qwen3-vl-235b-a22b-thinking
Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодального рассуждения в STEM и математике. Серия…
qwen3-vl-30b-a3b-instruct
Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Модель…
qwen3-vl-30b-a3b-thinking
Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно…
qwen3-vl-32b-instruct
Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная визуально-языковая модель, разработанная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Обладая 32 миллиардами параметров, она сочетает глубокое…
qwen3-vl-8b-instruct
Qwen3-VL-8B-Instruct — это мультимодальная визуально-языковая модель из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Она отличается улучшенным мультимодальным слиянием с…
qwen3-vl-8b-thinking
Qwen3-VL-8B-Thinking — это вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, разработанный для продвинутого визуального и текстового анализа в сложных сценах, документах и временных последовательностях. Он…
qwen3.5-397b-a17b
Нативная визуально-языковая модель Qwen3.5 серии 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности инференса. Она…
qwen3.5-plus-02-15
Модели серии Qwen3.5 native vision-language Plus построены на гибридной архитектуре, которая объединяет механизмы линейного внимания с моделями разреженной смеси экспертов (MoE), достигая более высокой эффективности инференса. В различных…
qwen3.5-plus-20260420
Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это…
qwen3.5-122b-a10b
Модель Qwen3.5 122B-A10B native vision-language построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью MoE, достигая более высокой эффективности вывода. По общей производительности эта…
qwen3.5-27b
Модель Qwen3.5 27B native vision-language Dense включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировании скорости вывода и производительности. Её общие возможности сопоставимы с возможностями…
qwen3.5-35b-a3b
Серия Qwen3.5 35B-A3B — это нативная визуально-языковая модель, разработанная с гибридной архитектурой, которая объединяет механизмы линейного внимания и разреженную модель MoE, достигая более высокой эффективности инференса. Её общая…
qwen3.5-9b
Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения мощных возможностей рассуждения, кодирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует…
qwen3.5-flash-02-23
Нативные Flash-модели Qwen3.5 для зрения и языка построены на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. По сравнению с…
qwen3.6-27b
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы — и…
qwen3.6-35b-a3b
Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts,…
qwen3.6-flash
Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании…
qwen3.6-max-preview
Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования…
qwen3.6-plus
Qwen 3.6 Plus основан на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженной маршрутизацией mixture-of-experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он…
qwen3.7-max
Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а…
qwen3.7-plus
Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, развивая текстовые возможности серии с комплексным обновлением её визуально-языковых способностей, сохраняя…
qwen-2.5-72b-instruct
Qwen2.5 72B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:
qwen-2.5-coder-32b-instruct
Qwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, ориентированных на код (ранее известных как CodeQwen). Qwen2.5-Coder включает следующие улучшения по сравнению с CodeQwen1.5:
reka-edge
Reka Edge — это чрезвычайно эффективная 7B мультимодальная визуально-языковая модель, которая принимает на вход изображения/видео+текст и генерирует текстовые выходы. Эта модель специально оптимизирована для обеспечения лучшей в отрасли…
reka-flash-3
Reka Flash 3 — это универсальная большая языковая модель с 21 миллиардом параметров, настроенная на выполнение инструкций и разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и…
relace-apply-3
Relace Apply 3 — это специализированная LLM для патчинга кода, которая интегрирует предложенные ИИ изменения непосредственно в ваши исходные файлы. Она может применять обновления от GPT-4o, Claude и других моделей в ваши файлы со средней…
relace-search
Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возврата релевантных файлов по запросу пользователя.
remm-slerp-l2-13b
Повторная попытка создания оригинальной MythoMax-L2-B13, но с обновленными моделями. #merge
l3-lunaris-8b
Lunaris 8B — это универсальная модель общего назначения и для ролевых игр, основанная на Llama 3. Она представляет собой стратегическое объединение нескольких моделей, разработанное для баланса между креативностью, улучшенной логикой и…
l3.1-70b-hanami-x1
Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).
l3.1-euryale-70b
Euryale L3.1 70B v2.2 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).
l3.3-euryale-70b
Euryale L3.3 70B — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).
all-minilm-l12-v2
Модель эмбеддингов all-MiniLM-L12-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как…
all-minilm-l6-v2
Модель встраивания all-MiniLM-L6-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, обеспечивая высококачественные семантические представления, которые идеально подходят для последующих задач, таких…
all-mpnet-base-v2
Модель эмбеддингов all-mpnet-base-v2 кодирует предложения и короткие абзацы в 768-мерное плотное векторное пространство, предоставляя высокоточные семантические эмбеддинги, хорошо подходящие для таких задач, как информационный поиск,…
multi-qa-mpnet-base-dot-v1
Модель эмбеддингов multi-qa-mpnet-base-dot-v1 преобразует предложения и короткие абзацы в 768-мерное плотное векторное пространство, генерируя высококачественные семантические эмбеддинги, оптимизированные для поиска ответов на вопросы,…
paraphrase-minilm-l6-v2
Модель встраивания paraphrase-MiniLM-L6-v2 преобразует предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая высококачественные семантические встраивания, оптимизированные для обнаружения перефразирований,…
step-3.5-flash
Шаг 3.5 Flash — самая мощная открытая базовая модель StepFun. Построенная на разреженной архитектуре Mixture of Experts (MoE), она выборочно активирует только 11 миллиардов из своих 196 миллиардов параметров на каждый токен. Это модель…
step-3.7-flash
Step 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу со 196 миллиардами параметров с видеокодером для нативного понимания изображений и видео, активируя примерно…
router
Маршрутизатор Switchpoint AI мгновенно анализирует ваш запрос и направляет его к оптимальному ИИ из постоянно развивающейся библиотеки.
hunyuan-a13b-instruct
Hunyuan-A13B — это языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует…
hy3-preview
Hy3 preview — это высокоэффективная модель Mixture-of-Experts от Tencent, разработанная для агентских рабочих процессов и использования в производстве. Она поддерживает настраиваемые уровни рассуждений в режимах «отключено», «низкий» и…
cydonia-24b-v4.1
Нецензурированная и креативная модель для письма, основанная на Mistral Small 3.2 24B, с хорошей памятью, соблюдением инструкций и интеллектом.
rocinante-12b
Rocinante 12B разработан для увлекательного повествования и богатой прозы.
skyfall-36b-v2
Skyfall 36B v2 — это улучшенная итерация Mistral Small 2501, специально доработанная для повышения креативности, тонкости письма, ролевых игр и связного повествования.
unslopnemo-12b
UnslopNemo v4.1 — это новейшая разработка от создателя Rocinante, предназначенная для приключенческих и ролевых сценариев.
gte-base
Модель gte-base embedding кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, обеспечивая эффективные и действенные семантические эмбеддинги, оптимизированные для задач определения текстового сходства,…
gte-large
Модель gte-large embedding преобразует английские предложения, абзацы и документы средней длины в 1024-мерное плотное векторное пространство, обеспечивая высококачественные семантические эмбеддинги, оптимизированные для задач…
solar-pro-3
Solar Pro 3 — это мощная языковая модель MoE (Mixture-of-Experts) от Upstage. Обладая 102 миллиардами общих параметров и 12 миллиардами активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении…
dolphin-mistral-24b-venice-edition:free
Venice Uncensored Dolphin Mistral 24B Venice Edition — это тонко настроенный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель разработана как «нецензурированный» LLM, настроенный на…
wizardlm-2-8x22b
WizardLM-2 8x22B — это самая передовая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и стабильно превосходит все существующие современные…
palmyra-x5
Palmyra X5 — это самая передовая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов в масштабах предприятия. Она обеспечивает лучшую в отрасли скорость и эффективность при работе с контекстными окнами до 1…
grok-4.20
Grok 4.20 — это модель рассуждений от xAI с лучшей в отрасли скоростью и возможностями вызова агентских инструментов. Она сочетает в себе самый низкий уровень галлюцинаций на рынке со строгим соблюдением prompt, обеспечивая неизменно…
grok-4.20-multi-agent
Grok 4.20 Multi-Agent — это вариант Grok 4.20 от xAI, разработанный для совместных рабочих процессов на основе агентов. Несколько агентов работают параллельно, чтобы проводить глубокие исследования, координировать использование…
grok-4.3
Grok 4.3 — это модель рассуждений от xAI. Она принимает текстовые и графические входные данные с текстовым выводом и подходит для агентских рабочих процессов, задач по следованию инструкциям и приложений, требующих высокой фактической…
grok-build-0.1
Grok Build 0.1 — это быстрая модель кодирования от xAI, разработанная специально для агентских рабочих процессов разработки программного обеспечения. Она поддерживает текстовые и графические входные данные с текстовым выводом и…
mimo-v2-flash
MiMo-V2-Flash — это языковая модель с открытым исходным кодом, разработанная Xiaomi. Это модель Mixture-of-Experts с общим количеством параметров 309B и 15B активных параметров, использующая гибридную архитектуру attention. MiMo-V2-Flash…
mimo-v2.5
MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность агентского уровня Pro примерно при вдвое меньшей стоимости вывода, превосходя MiMo-V2-Omni в мультимодальном восприятии в задачах понимания…
mimo-v2.5-pro
MiMo-V2.5-Pro — это флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентских возможностях, сложном программном инжиниринге и долгосрочных задачах, занимая лидирующие позиции в таких бенчмарках, как ClawEval,…
glm-4.5
GLM-4.5 — это наша новейшая флагманская базовая модель, специально разработанная для агентских приложений. Она использует архитектуру Mixture-of-Experts (MoE) и поддерживает контекстную длину до 128 тысяч токенов. GLM-4.5 значительно…
glm-4.5-air
GLM-4.5-Air — это облегченный вариант нашего новейшего семейства флагманских моделей, также специально разработанный для агент-ориентированных приложений. Как и GLM-4.5, он использует архитектуру Mixture-of-Experts (MoE), но с более…
glm-4.5v
GLM-4.5V — это базовая визуально-языковая модель для мультимодальных агентских приложений. Построенная на архитектуре Mixture-of-Experts (MoE) со 106 миллиардами параметров и 12 миллиардами активированных параметров, она достигает…
glm-4.6
По сравнению с GLM-4.5, это поколение имеет несколько ключевых улучшений:
glm-4.6v
GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128K токенов, обрабатывает…
glm-4.7
GLM-4.7 — это новейшая флагманская модель Z.ai, отличающаяся усовершенствованиями в двух ключевых областях: расширенные возможности программирования и более стабильное многошаговое рассуждение/выполнение. Она демонстрирует значительные…
glm-4.7-flash
Будучи современной моделью класса 30B, GLM-4.7-Flash предлагает новую опцию, которая уравновешивает производительность и эффективность. Она дополнительно оптимизирована для использования в агентском кодировании, усиливая возможности…
glm-5
GLM-5 — это флагманская открытая базовая модель Z.ai, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданная для опытных разработчиков, она обеспечивает производительность производственного…
glm-5-turbo
GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в агент-ориентированных средах, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов,…
glm-5.1
GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в решении долгосрочных задач. В отличие от предыдущих моделей, построенных на взаимодействиях минутного уровня, GLM-5.1 может работать…