Модели

385 моделей

Privacy Mode совместима со всеми моделями
★ featured
openai

gpt-4o

GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая вдвое быстрее и будучи на…

prompt / 1M
251
completion / 1M
1 003
контекст 128kvision · files · tools · json
Открыть →
ai21

jamba-large-1.7

Jamba Large 1.7 — это новейшая модель в открытом семействе Jamba, предлагающая улучшения в обоснованности, следовании инструкциям и общей эффективности. Построенная на гибридной архитектуре SSM-Transformer с контекстным окном 256K, она…

prompt / 1M
201
completion / 1M
803
контекст 256ktools · json
Открыть →
Логотип AionLabsaion-labs

aion-1.0

Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и кодирование. Она построена на DeepSeek-R1, дополненной другими моделями и техниками, такими как Tree of…

prompt / 1M
401
completion / 1M
803
контекст 131k
Открыть →
Логотип AionLabsaion-labs

aion-1.0-mini

Модель Aion-1.0-Mini с 32 миллиардами параметров является дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, кодирование и логика. Это модифицированный…

prompt / 1M
70,22
completion / 1M
140
контекст 131k
Открыть →
Логотип AionLabsaion-labs

aion-2.0

Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивных ролевых игр и сторителлинга. Он особенно силен в привнесении напряжения, кризисов и конфликтов в истории, делая повествование более увлекательным. Он также обрабатывает…

prompt / 1M
80,25
completion / 1M
161
контекст 131k
Открыть →
Логотип AionLabsaion-labs

aion-rp-llama-3.1-8b

Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, варианта Arena-Hard-Auto, специфичного для ролевых игр, где LLM оценивают ответы друг друга. Это базовая модель, прошедшая fine-tuning, а не…

prompt / 1M
80,25
completion / 1M
161
контекст 33k
Открыть →
Aallenai

olmo-3-32b-think

Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и продвинутых сценариев следования инструкциям. Её возможности обеспечивают высокую…

prompt / 1M
15,05
completion / 1M
50,16
контекст 66kjson
Открыть →
Логотип Amazonamazon

nova-2-lite-v1

Nova 2 Lite — это быстрая и экономичная модель рассуждений для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста.

prompt / 1M
30,10
completion / 1M
251
контекст 1Mvision · video · files · tools
Открыть →
Логотип Amazonamazon

nova-lite-v1

Amazon Nova Lite 1.0 — это очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку изображений, видео и текстовых входных данных для генерации текстовых выходных данных. Amazon Nova Lite может обрабатывать…

prompt / 1M
6,02
completion / 1M
24,08
контекст 300kvision · tools
Открыть →
Логотип Amazonamazon

nova-micro-v1

Amazon Nova Micro 1.0 — это текстовая модель, которая обеспечивает наименьшую задержку ответа в семействе моделей Amazon Nova при очень низкой стоимости. Обладая длиной контекста в 128 тыс. токенов и оптимизированная по скорости и…

prompt / 1M
3,51
completion / 1M
14,04
контекст 128ktools
Открыть →
Логотип Amazonamazon

nova-premier-v1

Amazon Nova Premier — самая мощная из мультиканальных моделей Amazon для решения сложных задач рассуждения и для использования в качестве лучшего учителя для дистилляции пользовательских моделей.

prompt / 1M
251
completion / 1M
1 254
контекст 1Mvision · tools
Открыть →
Логотип Amazonamazon

nova-pro-v1

Amazon Nova Pro 1.0 — это мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого круга задач. По состоянию на декабрь 2024 года она достигает самых современных…

prompt / 1M
80,25
completion / 1M
321
контекст 300kvision · tools
Открыть →
anthropic

claude-haiku-latest

Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Haiku.

prompt / 1M
100
completion / 1M
502
контекст 200kvision · files · tools · json
Открыть →
anthropic

claude-sonnet-latest

Эта модель всегда перенаправляет на последнюю модель из семейства Anthropic Claude Sonnet.

prompt / 1M
301
completion / 1M
1 505
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-3-haiku

Claude 3 Haiku — это самая быстрая и компактная модель Anthropic для почти мгновенного отклика. Быстрая и точная целевая производительность.

prompt / 1M
25,08
completion / 1M
125
контекст 200kvision · tools
Открыть →
anthropic

claude-3.5-haiku

Claude 3.5 Haiku предлагает расширенные возможности в скорости, точности кодирования и использовании инструментов. Разработанная для превосходной работы в приложениях реального времени, она обеспечивает быстрое время отклика, что крайне…

prompt / 1M
80,25
completion / 1M
401
контекст 200kvision · tools
Открыть →
anthropic

claude-haiku-4.5

Claude Haiku 4.5 — это самая быстрая и эффективная модель Anthropic, обеспечивающая интеллект, близкий к передовому, при значительно меньших затратах и задержках по сравнению с более крупными моделями Claude. Соответствуя…

prompt / 1M
100
completion / 1M
502
контекст 200kvision · files · tools · json
Открыть →
anthropic

claude-opus-4

Claude Opus 4 признан лучшей в мире моделью для кодирования на момент выпуска, обеспечивая стабильную производительность в сложных, длительных задачах и агентских рабочих процессах. Он устанавливает новые стандарты в разработке…

prompt / 1M
1 505
completion / 1M
7 524
контекст 200kvision · files · tools
Открыть →
anthropic

claude-opus-4.1

Claude Opus 4.1 — это обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждения и агентных задачах. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные…

prompt / 1M
1 505
completion / 1M
7 524
контекст 200kvision · files · tools · json
Открыть →
anthropic

claude-opus-4.5

Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use. It offers strong multimodal capabilities, competitive performance across real-world…

prompt / 1M
502
completion / 1M
2 508
контекст 200kfiles · vision · tools · json
Открыть →
anthropic

claude-opus-4.6

Opus 4.6 is Anthropic’s strongest model for coding and long-running professional tasks. It is built for agents that operate across entire workflows rather than single prompts, making it especially effective for large codebases, complex…

prompt / 1M
502
completion / 1M
2 508
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-4.6-fast

Вариант [Opus 4.6](/anthropic/claude-opus-4.6) в быстром режиме — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.

prompt / 1M
3 010
completion / 1M
15 048
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-4.7

Opus 4.7 is the next generation of Anthropic's Opus family, built for long-running, asynchronous agents. Building on the coding and agentic strengths of Opus 4.6, it delivers stronger performance on complex, multi-step tasks and more…

prompt / 1M
502
completion / 1M
2 508
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-4.7-fast

Быстрый вариант [Opus 4.7](/anthropic/claude-opus-4.7) — идентичные возможности с более высокой скоростью вывода по премиальной цене, в 6 раз превышающей обычную.

prompt / 1M
3 010
completion / 1M
15 048
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-4.8

Claude Opus 4.8 is Anthropic's most capable generally available model in the Opus family. It supports text, image, and file inputs with text output, with reasoning support and a 1M-token context window. It is suited for highly autonomous…

prompt / 1M
502
completion / 1M
2 508
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-4.8-fast

Fast-mode variant of [Opus 4.8](/anthropic/claude-opus-4.8) - identical capabilities with higher output speed at 2x pricing relative to regular Opus 4.8.

prompt / 1M
1 003
completion / 1M
5 016
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-opus-latest

Эта модель всегда перенаправляется на последнюю модель семейства Claude Opus.

prompt / 1M
502
completion / 1M
2 508
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-sonnet-4

Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя его как в задачах кодирования, так и в задачах рассуждения с улучшенной точностью и управляемостью. Достигая самых современных показателей…

prompt / 1M
301
completion / 1M
1 505
контекст 1Mvision · files · tools
Открыть →
anthropic

claude-sonnet-4.5

Claude Sonnet 4.5 — это самая передовая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она демонстрирует передовую производительность в тестах кодирования, таких как…

prompt / 1M
301
completion / 1M
1 505
контекст 1Mvision · files · tools · json
Открыть →
anthropic

claude-sonnet-4.6

Sonnet 4.6 — это самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовую производительность в кодировании, работе с агентами и профессиональной деятельности. Она превосходно справляется с итеративной…

prompt / 1M
301
completion / 1M
1 505
контекст 1Mvision · files · tools · json
Открыть →
Логотип Arcee AIarcee-ai

coder-large

Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она…

prompt / 1M
50,16
completion / 1M
80,25
контекст 33k
Открыть →
Логотип Arcee AIarcee-ai

maestro-reasoning

Maestro Reasoning — это флагманская аналитическая модель Arcee: производная Qwen 2.5-32B с 32 миллиардами параметров, настроенная с использованием DPO и chain-of-thought RL для пошаговой логики. По сравнению с более ранней 7B…

prompt / 1M
90,29
completion / 1M
331
контекст 131k
Открыть →
Логотип Arcee AIarcee-ai

spotlight

Spotlight — это 7-миллиардная vision-language модель, разработанная на основе Qwen 2.5-VL и доработанная компанией Arcee AI для задач точного сопоставления изображений и текста. Она предлагает контекстное окно размером 32k токенов, что…

prompt / 1M
18,06
completion / 1M
18,06
контекст 131kvision
Открыть →
Логотип Arcee AIarcee-ai

trinity-large-thinking

Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7

prompt / 1M
22,07
completion / 1M
85,27
контекст 262ktools · json
Открыть →
Логотип Arcee AIarcee-ai

trinity-mini

Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных…

prompt / 1M
4,51
completion / 1M
15,05
контекст 131ktools · json
Открыть →
Логотип Arcee AIarcee-ai

virtuoso-large

Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она…

prompt / 1M
75,24
completion / 1M
120
контекст 131ktools
Открыть →
baai

bge-base-en-v1.5

Модель встраивания bge-base-en-v1.5 преобразует английские предложения и абзацы в 768-мерные плотные векторы, обеспечивая эффективные, высококачественные семантические встраивания, оптимизированные для поиска, семантического поиска и…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
baai

bge-large-en-v1.5

Модель встраивания bge-large-en-v1.5 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические встраивания, оптимизированные для семантического поиска,…

prompt / 1M
1,00
completion / 1M
0
контекст 8kjson
Открыть →
baai

bge-m3

Модель внедрения bge-m3 кодирует предложения, абзацы и длинные документы в 1024-мерное плотное векторное пространство, предоставляя высококачественные семантические внедрения, оптимизированные для многоязычного поиска, семантического…

prompt / 1M
1,00
completion / 1M
0
контекст 8kjson
Открыть →
Логотип Baidubaidu

ernie-4.5-300b-a47b

ERNIE-4.5-300B-A47B — это языковая модель Mixture-of-Experts (MoE) с 300 миллиардами параметров, разработанная Baidu как часть серии ERNIE 4.5. Она активирует 47 миллиардов параметров на токен и поддерживает генерацию текста как на…

prompt / 1M
28,09
completion / 1M
110
контекст 131kjson
Открыть →
Логотип Baidubaidu

ernie-4.5-vl-28b-a3b

Мощная мультимодальная чат-модель Mixture-of-Experts с общим количеством параметров 28B, из которых 3B активируются на каждый токен, обеспечивающая исключительное понимание текста и изображений благодаря инновационной гетерогенной…

prompt / 1M
14,04
completion / 1M
56,18
контекст 131kvision · tools
Открыть →
Логотип Baidubaidu

ernie-4.5-vl-424b-a47b

ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров, из которых 47 миллиардов активны на каждый токен. Она обучена совместно на текстовых и…

prompt / 1M
42,13
completion / 1M
125
контекст 131kvision
Открыть →
black-forest-labs

flux.2-flex

FLUX.2 [flex] превосходно справляется с рендерингом сложного текста, типографики и мелких деталей, а также поддерживает редактирование с несколькими ссылками в той же унифицированной архитектуре.

6,02за /megapixel
6,02за /megapixel
контекст 67kvision
Открыть →
black-forest-labs

flux.2-klein-4b

FLUX.2 [klein] 4B — это самая быстрая и экономичная модель в семействе FLUX.2, оптимизированная для сценариев использования с высокой пропускной способностью при сохранении превосходного качества изображения.

1,41за /megapixel
контекст 41kvision
Открыть →
black-forest-labs

flux.2-max

FLUX.2 [max] — это новая топовая модель для работы с изображениями от Black Forest Labs, поднимающая качество изображений, понимание запросов и согласованность редактирования на беспрецедентно высокий уровень.

7,03за /megapixel
контекст 47kvision
Открыть →
black-forest-labs

flux.2-pro

Высококлассная модель для генерации и редактирования изображений, ориентированная на передовой уровень визуального качества и надежности. Она обеспечивает строгое соответствие запросам, стабильное освещение, четкие текстуры и…

3,01за /megapixel
контекст 47kvision
Открыть →
Логотип ByteDancebytedance-seed

seed-1.6

Seed 1.6 — это универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном в 256K.

prompt / 1M
25,08
completion / 1M
201
контекст 262kvision · video · tools · json
Открыть →
Логотип ByteDancebytedance-seed

seed-1.6-flash

Seed 1.6 Flash — это сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно размером 256k и может генерировать выходные данные объемом…

prompt / 1M
7,52
completion / 1M
30,10
контекст 262kvision · video · tools · json
Открыть →
Логотип ByteDancebytedance-seed

seed-2.0-lite

Seed-2.0-Lite — это универсальная, экономичная рабочая лошадка для предприятий, которая обеспечивает мощные мультимодальные и агентные возможности, предлагая при этом заметно меньшую задержку, что делает её практичным выбором по умолчанию…

prompt / 1M
25,08
completion / 1M
201
контекст 262kvision · video · tools · json
Открыть →
Логотип ByteDancebytedance-seed

seed-2.0-mini

Seed-2.0-mini ориентирован на сценарии с низкой задержкой, высокой конкуренцией и чувствительностью к стоимости, делая акцент на быстром отклике и гибком развертывании инференса. Он обеспечивает производительность, сравнимую с…

prompt / 1M
10,03
completion / 1M
40,13
контекст 262kvision · video · tools · json
Открыть →
Логотип ByteDancebytedance-seed

seedream-4.5

Seedream 4.5 — это новейшая внутренняя модель генерации изображений, разработанная ByteDance. По сравнению с Seedream 4.0, она обеспечивает всесторонние улучшения, особенно в согласованности редактирования, включая лучшее сохранение…

4,02за /image
контекст 4kvision
Открыть →
Логотип ByteDancebytedance

ui-tars-1.5-7b

UI-TARS-1.5 — это мультиканальный визуально-языковой агент, оптимизированный для сред с графическим интерфейсом пользователя (GUI), включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Разработанный ByteDance, он основан…

prompt / 1M
10,03
completion / 1M
20,06
контекст 128kvision
Открыть →
Логотип Coherecohere

command-a

Command A — это модель с открытым весом и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в агентских, многоязычных и кодовых сценариях использования. По сравнению с другими…

prompt / 1M
251
completion / 1M
1 003
контекст 256kjson
Открыть →
Логотип Coherecohere

command-r-08-2024

command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненным поиском (RAG) и использования инструментов. В более широком смысле, он лучше справляется с…

prompt / 1M
15,05
completion / 1M
60,19
контекст 128ktools · json
Открыть →
Логотип Coherecohere

command-r-plus-08-2024

command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с пропускной способностью примерно на 50% выше и задержками на 25% ниже по сравнению с предыдущей версией Command R+, при этом аппаратные требования…

prompt / 1M
251
completion / 1M
1 003
контекст 128ktools · json
Открыть →
Логотип Coherecohere

command-r7b-12-2024

Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложного рассуждения…

prompt / 1M
3,76
completion / 1M
15,05
контекст 128kjson
Открыть →
Ddeepcogito

cogito-v2.1-671b

Cogito v2.1 671B MoE представляет собой одну из сильнейших открытых моделей в мире, соответствующую производительности передовых закрытых и открытых моделей. Эта модель обучена с использованием самообучения с подкреплением для достижения…

prompt / 1M
125
completion / 1M
125
контекст 128kjson
Открыть →
Логотип DeepSeekdeepseek

deepseek-chat

DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на возможностях следования инструкциям и написания кода предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, согласно опубликованным оценкам, модель…

prompt / 1M
20,08
completion / 1M
80,26
контекст 131ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-chat-v3-0324

DeepSeek V3, модель с 685 миллиардами параметров и архитектурой Mixture-of-Experts, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek.

prompt / 1M
20,06
completion / 1M
77,25
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-chat-v3.1

DeepSeek-V3.1 is a large hybrid reasoning model (671B parameters, 37B active) that supports both thinking and non-thinking modes via prompt templates. It extends the DeepSeek-V3 base with a two-phase long-context training process, reaching…

prompt / 1M
21,07
completion / 1M
79,25
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-v3.1-terminus

DeepSeek-V3.1 Terminus is an update to [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1) that maintains the model's original capabilities while addressing issues reported by users, including language consistency and agent capabilities, further…

prompt / 1M
27,09
completion / 1M
95,30
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-v3.2

DeepSeek-V3.2 is a large language model designed to harmonize high computational efficiency with strong reasoning and agentic tool-use performance. It introduces DeepSeek Sparse Attention (DSA), a fine-grained sparse attention mechanism…

prompt / 1M
22,95
completion / 1M
34,43
контекст 131ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-v3.2-exp

DeepSeek-V3.2-Exp is an experimental large language model released by DeepSeek as an intermediate step between V3.1 and future architectures. It introduces DeepSeek Sparse Attention (DSA), a fine-grained sparse attention mechanism designed…

prompt / 1M
27,09
completion / 1M
41,13
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-v4-flash

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством параметров 284B и 13B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для быстрого…

prompt / 1M
9,86
completion / 1M
19,72
контекст 1Mtools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-v4-pro

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общим количеством параметров 1,6T и 49B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для продвинутого рассуждения,…

prompt / 1M
43,64
completion / 1M
87,28
контекст 1Mtools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-r1

DeepSeek R1 уже здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Он имеет 671 миллиард параметров, из которых 37 миллиардов активны при проходе вывода.

prompt / 1M
70,22
completion / 1M
251
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-r1-0528

Обновление от 28 мая к [оригинальному DeepSeek R1](/deepseek/deepseek-r1). Производительность наравне с [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671B…

prompt / 1M
50,16
completion / 1M
216
контекст 164ktools · json
Открыть →
Логотип DeepSeekdeepseek

deepseek-r1-distill-llama-70b

DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в…

prompt / 1M
70,22
completion / 1M
80,25
контекст 131kjson
Открыть →
Логотип DeepSeekdeepseek

deepseek-r1-distill-qwen-32b

DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various…

prompt / 1M
29,09
completion / 1M
29,09
контекст 128kjson
Открыть →
Eessentialai

rnj-1-instruct

Rnj-1 — это семейство плотных моделей с открытым исходным кодом и 8 миллиардами параметров, разработанное Essential AI и обученное с нуля с акцентом на программирование, математику и научные рассуждения. Модель демонстрирует высокую…

prompt / 1M
15,05
completion / 1M
15,05
контекст 33ktools · json
Открыть →
● бесплатно
Hhubris

free

The simplest way to get free inference. openrouter/free is a router that selects free models at random from the models available on OpenRouter. The router smartly filters for models that support features needed for your request such as…

prompt / 1M
0
completion / 1M
0
контекст 200kvision · tools · json
Открыть →
Логотип Google Geminigoogle

gemini-flash-latest

Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.

1,41за /request
контекст 1Mvision · video · files · audio
Открыть →
Логотип Google Geminigoogle

gemini-pro-latest

Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.

1,41за /request
контекст 1Maudio · files · vision · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-flash

Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in "thinking" capabilities, enabling it to provide responses with…

prompt / 1M
30,10
completion / 1M
251
контекст 1Mfiles · vision · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks…

prompt / 1M
10,03
completion / 1M
40,13
контекст 1Mvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-flash-lite-preview-09-2025

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks…

prompt / 1M
10,03
completion / 1M
40,13
контекст 1Mvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-pro

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать при формировании ответов…

prompt / 1M
125
completion / 1M
1 003
контекст 1Mvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-pro-preview-05-06

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать при формировании ответов с…

prompt / 1M
125
completion / 1M
1 003
контекст 1Mvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-2.5-pro-preview

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной…

prompt / 1M
125
completion / 1M
1 003
контекст 1Mfiles · vision · audio · tools
Открыть →
Логотип Google Geminigoogle

gemini-3-flash-preview

Gemini 3 Flash Preview — это высокоскоростная, высокоэффективная модель мышления, разработанная для агентских рабочих процессов, многоходовых чатов и помощи в кодировании. Она обеспечивает производительность рассуждений и использования…

1,41за /request
контекст 1Mvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-3.1-flash-lite

Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads. It supports text, image, video, audio, and PDF inputs, and is designed for lightweight agentic workflows, simple data…

1,41за /request
контекст 1Mvision · video · files · audio
Открыть →
Логотип Google Geminigoogle

gemini-3.1-flash-lite-preview

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом данных. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini…

1,41за /request
контекст 1Mvision · video · files · audio
Открыть →
Логотип Google Geminigoogle

gemini-3.1-pro-preview

Gemini 3.1 Pro Preview is Google’s frontier reasoning model, delivering enhanced software engineering performance, improved agentic reliability, and more efficient token usage across complex workflows. Building on the multimodal foundation…

1,41за /request
контекст 1Maudio · files · vision · video
Открыть →
Логотип Google Geminigoogle

gemini-3.1-pro-preview-customtools

Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда доступны более эффективные сторонние или…

prompt / 1M
201
completion / 1M
1 204
контекст 1Maudio · vision · video · files
Открыть →
Логотип Google Geminigoogle

gemini-3.5-flash

Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution loops, supporting text,…

1,41за /request
контекст 1Mvision · video · files · audio
Открыть →
Логотип Google Geminigoogle

gemini-embedding-001

gemini-embedding-001 предоставляет унифицированный передовой опыт во всех областях, включая науку, юриспруденцию, финансы и программирование. Эта модель эмбеддингов неизменно занимает лидирующие позиции в многоязычной таблице лидеров…

prompt / 1M
15,05
completion / 1M
0
контекст 20kjson
Открыть →
Логотип Google Geminigoogle

gemini-embedding-2

Gemini Embedding 2 is Google's first multimodal embedding model. We currently support mapping text and images into a unified vector space for semantic search and retrieval-augmented generation (RAG). It supports input context up to 8,192…

prompt / 1M
20,06
completion / 1M
0
контекст 8kvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemini-embedding-2-preview

Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с…

prompt / 1M
20,06
completion / 1M
0
контекст 8kvision · files · audio · video
Открыть →
Логотип Google Geminigoogle

gemma-2-27b-it

Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые использовались для создания [моделей Gemini](/models?q=gemini).

prompt / 1M
65,21
completion / 1M
65,21
контекст 8kjson
Открыть →
Логотип Google Geminigoogle

gemma-3-12b-it

Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…

prompt / 1M
4,01
completion / 1M
13,04
контекст 131kvision · tools · json
Открыть →
Логотип Google Geminigoogle

gemma-3-27b-it

Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста, а также текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…

prompt / 1M
8,03
completion / 1M
16,05
контекст 131kvision · tools · json
Открыть →
Логотип Google Geminigoogle

gemma-3-4b-it

Gemma 3 представляет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные математические, логические и…

prompt / 1M
4,01
completion / 1M
8,03
контекст 131kvision · json
Открыть →
Логотип Google Geminigoogle

gemma-3n-e4b-it

Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальные входные данные, включая текст,…

prompt / 1M
6,02
completion / 1M
12,04
контекст 33k
Открыть →
Логотип Google Geminigoogle

gemma-4-26b-a4b-it

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на 25,2 млрд общих параметров, только 3,8 млрд активируются на каждый токен во время вывода — обеспечивая качество,…

prompt / 1M
6,02
completion / 1M
33,11
контекст 262kvision · video · tools · json
Открыть →
● бесплатно
Логотип Google Geminigoogle

gemma-4-26b-a4b-it:free

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что…

prompt / 1M
0
completion / 1M
0
контекст 262kvision · video · tools · json
Открыть →
Логотип Google Geminigoogle

gemma-4-31b-it

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая ввод текста и изображений с выводом текста. Она имеет контекстное окно в 256 тысяч токенов, настраиваемый режим…

prompt / 1M
12,04
completion / 1M
37,12
контекст 262kvision · video · tools · json
Открыть →
● бесплатно
Логотип Google Geminigoogle

gemma-4-31b-it:free

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом…

prompt / 1M
0
completion / 1M
0
контекст 262kvision · video · tools · json
Открыть →
Логотип Google Geminigoogle

gemini-2.5-flash-image

Gemini 2.5 Flash Image, a.k.a. "Nano Banana," is now generally available. It is a state of the art image generation model with contextual understanding. It is capable of image generation, edits, and multi-turn conversations. Aspect ratios…

prompt / 1M
30,10
completion / 1M
251
контекст 33kvision · json
Открыть →
Логотип Google Geminigoogle

gemini-3.1-flash-image-preview

Gemini 3.1 Flash Image Preview, a.k.a. "Nano Banana 2," is Google’s latest state of the art image generation and editing model, delivering Pro-level visual quality at Flash speed. It combines advanced contextual understanding with fast,…

1,41за /request
контекст 131kvision · json
Открыть →
Логотип Google Geminigoogle

gemini-3-pro-image-preview

Nano Banana Pro — это самая передовая модель Google для генерации и редактирования изображений, построенная на базе Gemini 3 Pro. Она расширяет возможности оригинальной Nano Banana за счет значительно улучшенного мультимодального мышления,…

1,41за /request
контекст 66kvision · json
Открыть →
ibm-granite

granite-4.0-h-micro

Granite-4.0-H-Micro — это модель семейства Granite 4 с 3 миллиардами параметров. Эти модели являются новейшими в серии моделей, выпущенных IBM. Они тонко настроены для вызова инструментов с длинным контекстом.

prompt / 1M
1,71
completion / 1M
11,24
контекст 131k
Открыть →
ibm-granite

granite-4.1-8b

Granite 4.1 8B — это плотная языковая модель с 8 миллиардами параметров от IBM, использующая только декодер, часть семейства Granite 4.1. Она поддерживает контекстное окно в 131K токенов и предназначена для корпоративных задач, включая…

prompt / 1M
5,02
completion / 1M
10,03
контекст 131ktools · json
Открыть →
Iinception

mercury-2

Mercury 2 — это чрезвычайно быстрая LLM для рассуждений и первая диффузионная LLM (dLLM) для рассуждений. Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая скорости >1000…

prompt / 1M
25,08
completion / 1M
75,24
контекст 128ktools · json
Открыть →
Iinclusionai

ling-2.6-1t

Ling-2.6-1T — это мгновенная (инструктивная) модель от inclusionAI и флагман компании с триллионом параметров, разработанная для реальных агентов, которым требуется быстрое выполнение и высокая эффективность в масштабе. Она использует…

prompt / 1M
7,52
completion / 1M
62,70
контекст 262ktools · json
Открыть →
Iinclusionai

ling-2.6-flash

Ling-2.6-flash — это мгновенная (инструктивная) модель от inclusionAI с общим количеством параметров 104B и 7.4B активных параметров, разработанная для реальных агентов, которым требуются быстрые ответы, высокая производительность и…

prompt / 1M
1,00
completion / 1M
3,01
контекст 262ktools · json
Открыть →
Iinclusionai

ring-2.6-1t

Ring-2.6-1T — это модель мышления с 1T параметрами и 63B активными параметрами, созданная для реальных рабочих процессов агентов, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для кодирующих…

prompt / 1M
30,10
completion / 1M
251
контекст 262ktools · json
Открыть →
inflection

inflection-3-pi

Inflection 3 Pi обеспечивает работу чат-бота [Pi](https://pi.ai) от Inflection, включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и превосходно справляется со сценариями,…

prompt / 1M
251
completion / 1M
1 003
контекст 8k
Открыть →
inflection

inflection-3-productivity

Inflection 3 Productivity оптимизирован для следования инструкциям. Он лучше подходит для задач, требующих вывода JSON или точного соблюдения предоставленных рекомендаций. Он имеет доступ к последним новостям.

prompt / 1M
251
completion / 1M
1 003
контекст 8k
Открыть →
Iintfloat

e5-base-v2

Модель эмбеддингов e5-base-v2 кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как семантический…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Iintfloat

e5-large-v2

Модель эмбеддингов e5-large-v2 отображает английские предложения, абзацы и документы в 1024-мерное плотное векторное пространство, обеспечивая высокоточные семантические эмбеддинги, оптимизированные для задач извлечения информации,…

prompt / 1M
1,00
completion / 1M
0
контекст 8kjson
Открыть →
Iintfloat

multilingual-e5-large

Модель multilingual-e5-large embedding кодирует предложения, абзацы и документы на более чем 90 языках в 1024-мерное плотное векторное пространство, обеспечивая надежные семантические эмбеддинги, оптимизированные для многоязычного поиска,…

prompt / 1M
1,00
completion / 1M
0
контекст 8kjson
Открыть →
Kkwaipilot

kat-coder-pro-v2

KAT-Coder-Pro V2 — это новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, разработанная для сложной корпоративной разработки программного обеспечения и интеграции SaaS. Она основывается на агентных возможностях…

prompt / 1M
30,10
completion / 1M
120
контекст 256ktools · json
Открыть →
liquid

lfm-2-24b-a2b

LFM2-24B-A2B — это крупнейшая модель в семействе гибридных архитектур LFM2, разработанных для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных…

prompt / 1M
3,01
completion / 1M
12,04
контекст 128k
Открыть →
● бесплатно
liquid

lfm-2.5-1.2b-instruct:free

LFM2.5-1.2B-Instruct — это компактная, высокопроизводительная модель, настроенная на выполнение инструкций, созданная для быстрого ИИ на устройстве. Она обеспечивает высокое качество чата при размере 1,2 миллиарда параметров, с эффективным…

prompt / 1M
0
completion / 1M
0
контекст 33k
Открыть →
● бесплатно
liquid

lfm-2.5-1.2b-thinking:free

LFM2.5-1.2B-Thinking — это легковесная модель, ориентированная на рассуждения, оптимизированная для агентских задач, извлечения данных и RAG, при этом комфортно работающая на периферийных устройствах. Она поддерживает длинный контекст (до…

prompt / 1M
0
completion / 1M
0
контекст 33k
Открыть →
Логотип Metameta-llama

llama-guard-3-8b

Llama Guard 3 — это предварительно обученная модель Llama-3.1-8B, доработанная для классификации контента по безопасности. Как и предыдущие версии, она может использоваться для классификации контента как во входных данных LLM…

prompt / 1M
48,55
completion / 1M
3,01
контекст 131k
Открыть →
Aanthracite-org

magnum-v4-72b

This is a series of models designed to replicate the prose quality of the Claude 3 models, specifically Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) and Opus(https://openrouter.ai/anthropic/claude-3-opus).

prompt / 1M
301
completion / 1M
502
контекст 33kjson
Открыть →
Mmancer

weaver

Попытка воссоздать многословность в стиле Claude, но не ожидайте того же уровня связности или памяти. Предназначено для использования в ролевых играх/нарративных ситуациях.

prompt / 1M
75,24
completion / 1M
100
контекст 8kjson
Открыть →
Логотип Metameta-llama

llama-3-70b-instruct

Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.

prompt / 1M
51,16
completion / 1M
74,24
контекст 8k
Открыть →
Логотип Metameta-llama

llama-3-8b-instruct

Последнее поколение моделей Meta (Llama 3) было выпущено в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, была оптимизирована для высококачественных диалоговых сценариев использования.

prompt / 1M
4,01
completion / 1M
4,01
контекст 8kjson
Открыть →
Логотип Metameta-llama

llama-3.1-70b-instruct

Последнее поколение моделей Meta (Llama 3.1) было выпущено в различных размерах и вариантах. Эта 70B версия, настроенная для инструкций, оптимизирована для высококачественных диалоговых сценариев использования.

prompt / 1M
40,13
completion / 1M
40,13
контекст 131ktools · json
Открыть →
Логотип Metameta-llama

llama-3.1-8b-instruct

Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта 8B версия, настроенная для инструкций, быстра и эффективна.

prompt / 1M
2,01
completion / 1M
5,02
контекст 131ktools · json
Открыть →
Логотип Metameta-llama

llama-3.2-11b-vision-instruct

Llama 3.2 11B Vision — это мультимодальная модель с 11 миллиардами параметров, разработанная для решения задач, сочетающих визуальные и текстовые данные. Она превосходно справляется с такими задачами, как создание подписей к изображениям и…

prompt / 1M
24,58
completion / 1M
24,58
контекст 131kvision · json
Открыть →
Логотип Metameta-llama

llama-3.2-1b-instruct

Llama 3.2 1B — это языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и многоязычный текстовый анализ. Её меньший размер позволяет ей…

prompt / 1M
2,71
completion / 1M
20,16
контекст 131k
Открыть →
Логотип Metameta-llama

llama-3.2-3b-instruct

Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…

prompt / 1M
5,11
completion / 1M
33,61
контекст 131k
Открыть →
● бесплатно
Логотип Metameta-llama

llama-3.2-3b-instruct:free

Llama 3.2 3B — это мультиязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для решения сложных задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработанная с…

prompt / 1M
0
completion / 1M
0
контекст 131k
Открыть →
Логотип Metameta-llama

llama-3.3-70b-instruct

Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции и…

prompt / 1M
10,03
completion / 1M
32,10
контекст 131ktools · json
Открыть →
● бесплатно
Логотип Metameta-llama

llama-3.3-70b-instruct:free

Мультиязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и настроенная на инструкции генеративная модель с 70B параметрами (ввод текста/вывод текста). Модель Llama 3.3, настроенная на инструкции, только для…

prompt / 1M
0
completion / 1M
0
контекст 131ktools
Открыть →
Логотип Metameta-llama

llama-4-maverick

Llama 4 Maverick 17B Instruct (128E) — это высокопроизводительная мультиязычная модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой проход (всего 400…

prompt / 1M
15,05
completion / 1M
60,19
контекст 1Mvision · tools · json
Открыть →
Логотип Metameta-llama

llama-4-scout

Llama 4 Scout 17B Instruct (16E) — это языковая модель типа «смесь экспертов» (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и…

prompt / 1M
8,03
completion / 1M
30,10
контекст 10Mvision · tools · json
Открыть →
Логотип Metameta-llama

llama-guard-4-12b

Llama Guard 4 — это мультимодальная предварительно обученная модель, созданная на основе Llama 4 Scout и доработанная для классификации безопасности контента. Как и предыдущие версии, она может использоваться для классификации контента как…

prompt / 1M
18,06
completion / 1M
18,06
контекст 164kvision · json
Открыть →
Логотип Microsoftmicrosoft

phi-4

[Microsoft Research](/microsoft) Phi-4 разработан для эффективного выполнения сложных задач рассуждения и может эффективно работать в условиях ограниченной памяти или там, где требуются быстрые ответы.

prompt / 1M
6,52
completion / 1M
14,04
контекст 16kjson
Открыть →
Логотип Microsoftmicrosoft

phi-4-mini-instruct

Phi-4-mini-instruct — это легковесная открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах, с акцентом на высококачественные, насыщенные рассуждениями данные. Модель принадлежит к семейству…

prompt / 1M
8,03
completion / 1M
35,11
контекст 131kjson
Открыть →
Логотип MiniMaxminimax

minimax-m1

MiniMax-M1 — это крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с настраиваемым…

prompt / 1M
40,13
completion / 1M
221
контекст 1Mtools
Открыть →
Логотип MiniMaxminimax

minimax-m2

MiniMax-M2 is a compact, high-efficiency large language model optimized for end-to-end coding and agentic workflows. With 10 billion activated parameters (230 billion total), it delivers near-frontier intelligence across general reasoning,…

prompt / 1M
25,58
completion / 1M
100
контекст 205ktools · json
Открыть →
Логотип MiniMaxminimax

minimax-m2-her

MiniMax M2-her — это большая языковая модель, ориентированная на диалог, созданная для иммерсивных ролевых игр, чатов, управляемых персонажами, и выразительных многоходовых бесед. Разработанная для поддержания согласованности тона и…

prompt / 1M
30,10
completion / 1M
120
контекст 66k
Открыть →
Логотип MiniMaxminimax

minimax-m2.1

MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development. With only 10 billion activated parameters, it delivers a major jump in real-world capability…

prompt / 1M
29,09
completion / 1M
95,30
контекст 205ktools · json
Открыть →
Логотип MiniMaxminimax

minimax-m2.5

MiniMax-M2.5 — это современная большая языковая модель (SOTA LLM), разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных и сложных реальных цифровых рабочих средах, M2.5 развивает опыт кодирования M2.1,…

prompt / 1M
15,05
completion / 1M
115
контекст 205ktools · json
Открыть →
Логотип MiniMaxminimax

minimax-m2.7

MiniMax-M2.7 — это крупная языковая модель нового поколения, разработанная для автономной, реальной продуктивности и непрерывного совершенствования. Созданная для активного участия в собственной эволюции, M2.7 интегрирует передовые…

prompt / 1M
27,99
completion / 1M
120
контекст 205ktools · json
Открыть →
Логотип MiniMaxminimax

minimax-m3

MiniMax-M3 is a multimodal foundation model from MiniMax. It supports text, image, and video inputs with text output, a 1M-token context window, and is suited for long-horizon agentic work, coding, and tool use. It is built on MiniMax…

prompt / 1M
30,10
completion / 1M
120
контекст 1Mvision · video · tools · json
Открыть →
Логотип MiniMaxminimax

minimax-01

MiniMax-01 сочетает MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Он имеет 456 миллиардов параметров, при этом 45,9 миллиарда параметров активируются за одно логическое выведение, и может обрабатывать…

prompt / 1M
20,06
completion / 1M
110
контекст 1Mvision
Открыть →
Логотип Mistral AImistralai

mistral-large

Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…

prompt / 1M
201
completion / 1M
602
контекст 128kfiles · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-large-2407

Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Прочитайте объявление о…

prompt / 1M
201
completion / 1M
602
контекст 131kfiles · tools · json
Открыть →
Логотип Mistral AImistralai

codestral-2508

Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов.

prompt / 1M
30,10
completion / 1M
90,29
контекст 256kfiles · tools · json
Открыть →
Логотип Mistral AImistralai

codestral-embed-2505

Mistral Codestral Embed специально разработан для кода, идеально подходит для встраивания кодовых баз данных, репозиториев и обеспечения работы помощников по кодированию с использованием передовых методов извлечения информации.

prompt / 1M
15,05
completion / 1M
0
контекст 8kjson
Открыть →
Логотип Mistral AImistralai

devstral-2512

Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная transformer-модель со 123 миллиардами параметров, поддерживающая контекстное окно размером 256K.

prompt / 1M
40,13
completion / 1M
201
контекст 262kfiles · tools · json
Открыть →
Логотип Mistral AImistralai

ministral-14b-2512

Крупнейшая модель в семействе Ministral 3, Ministral 3 14B, предлагает передовые возможности и производительность, сравнимую с её более крупным аналогом Mistral Small 3.2 24B. Мощная и эффективная языковая модель с возможностями зрения.

prompt / 1M
20,06
completion / 1M
20,06
контекст 262kvision · tools · json
Открыть →
Логотип Mistral AImistralai

ministral-3b-2512

Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.

prompt / 1M
10,03
completion / 1M
10,03
контекст 131kvision · tools · json
Открыть →
Логотип Mistral AImistralai

ministral-8b-2512

Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная миниатюрная языковая модель с возможностями зрения.

prompt / 1M
15,05
completion / 1M
15,05
контекст 262kvision · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-embed-2312

Mistral Embed — это специализированная модель эмбеддингов для текстовых данных, оптимизированная для семантического поиска и RAG-приложений. Разработанная Mistral AI в конце 2023 года, она генерирует 1024-мерные векторы, которые эффективно…

prompt / 1M
10,03
completion / 1M
0
контекст 8kjson
Открыть →
Логотип Mistral AImistralai

mistral-large-2512

Mistral Large 3 2512 — это самая мощная на сегодняшний день модель Mistral, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 млрд активных параметров (всего 675 млрд) и выпущенная под лицензией Apache 2.0.

prompt / 1M
50,16
completion / 1M
150
контекст 262kvision · files · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-medium-3

Mistral Medium 3 — это высокопроизводительная языковая модель корпоративного уровня, разработанная для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она сочетает в себе самые современные…

prompt / 1M
40,13
completion / 1M
201
контекст 131kvision · files · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-medium-3.1

Mistral Medium 3.1 — это обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного уровня, разработанной для обеспечения передовых возможностей при значительно сниженных эксплуатационных расходах. Она…

prompt / 1M
40,13
completion / 1M
201
контекст 131kvision · files · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-medium-3-5

Mistral Medium 3.5 — это плотная 128B модель от Mistral AI, следующая инструкциям. Она поддерживает текстовые и графические входные данные с текстовым выводом и предназначена для агентских рабочих процессов, кодирования и сложного…

prompt / 1M
150
completion / 1M
752
контекст 262kvision · files · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-nemo

Модель с 12 миллиардами параметров и длиной контекста 128 тысяч токенов, разработанная Mistral в сотрудничестве с NVIDIA.

prompt / 1M
2,01
completion / 1M
3,01
контекст 131ktools · json
Открыть →
Логотип Mistral AImistralai

mistral-small-24b-instruct-2501

Mistral Small 3 — это языковая модель с 24 миллиардами параметров, оптимизированная для работы с низкой задержкой при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает как предварительно обученные, так…

prompt / 1M
5,02
completion / 1M
8,03
контекст 33kjson
Открыть →
Логотип Mistral AImistralai

mistral-small-3.1-24b-instruct

Mistral Small 3.1 24B Instruct — это обновленный вариант Mistral Small 3 (2501), включающий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в задачах текстового…

prompt / 1M
35,21
completion / 1M
55,68
контекст 128kvision
Открыть →
Логотип Mistral AImistralai

mistral-small-3.2-24b-instruct

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная 24B-параметрическая модель от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с версией 3.1, версия 3.2 значительно…

prompt / 1M
7,52
completion / 1M
20,06
контекст 128kvision · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-small-2603

Mistral Small 4 — это следующий крупный релиз в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе мощные способности к рассуждению от Magistral, мультимодальное…

prompt / 1M
15,05
completion / 1M
60,19
контекст 262kvision · tools · json
Открыть →
Логотип Mistral AImistralai

mixtral-8x22b-instruct

Официальная инструктивная fine-tuned версия [Mixtral 8x22B](/models/mistralai/mixtral-8x22b) от Mistral. Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая беспрецедентную экономическую эффективность для своего…

prompt / 1M
201
completion / 1M
602
контекст 66kfiles · tools · json
Открыть →
Логотип Mistral AImistralai

mistral-saba

Mistral Saba — это языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обученная…

prompt / 1M
20,06
completion / 1M
60,19
контекст 33kfiles · tools · json
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-latest

Эта модель всегда перенаправляется на последнюю модель в семействе MoonshotAI Kimi.

prompt / 1M
68,62
completion / 1M
343
контекст 262kvision · tools · json
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-k2

Kimi K2 Instruct — это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных параметров на каждый прямой проход. Она оптимизирована для…

prompt / 1M
57,18
completion / 1M
231
контекст 131ktools
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-k2-0905

Kimi K2 0905 — это сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим количеством параметров в 1 триллион и 32 миллиардами активных…

prompt / 1M
60,19
completion / 1M
251
контекст 262ktools · json
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-k2-thinking

Kimi K2 Thinking — это самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 в область агентных рассуждений с длительным горизонтом. Построенная на архитектуре Mixture-of-Experts (MoE) с…

prompt / 1M
60,19
completion / 1M
251
контекст 262ktools · json
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-k2.5

Kimi K2.5 — это нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемой агентной системы. Созданная на базе Kimi K2 с продолженным предварительным обучением на…

prompt / 1M
40,13
completion / 1M
191
контекст 262kvision · tools · json
Открыть →
Логотип Moonshot Kimimoonshotai

kimi-k2.6

Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, разработанная для долгосрочного кодирования, генерации UI/UX на основе кодирования и оркестрации мультиагентов. Она справляется со сложными сквозными задачами…

prompt / 1M
68,62
completion / 1M
343
контекст 262kvision · tools · json
Открыть →
● бесплатно
Логотип Moonshot Kimimoonshotai

kimi-k2.6:free

Kimi K2.6 is Moonshot AI's next-generation multimodal model, designed for long-horizon coding, coding-driven UI/UX generation, and multi-agent orchestration. It handles complex end-to-end coding tasks across Python, Rust, and Go, and...

prompt / 1M
0
completion / 1M
0
контекст 262kvision · tools
Открыть →
Логотип Morphmorph

morph-v3-fast

Самая быстрая модель Morph для применения изменений в коде. ~10 500 токенов/сек с точностью 96% для быстрых преобразований кода.

prompt / 1M
80,25
completion / 1M
120
контекст 82k
Открыть →
Логотип Morphmorph

morph-v3-large

Высокоточная модель Morph для сложных изменений кода. ~4500 токенов/сек с точностью 98% для точных преобразований кода.

prompt / 1M
90,29
completion / 1M
191
контекст 262k
Открыть →
Ggryphe

mythomax-l2-13b

Одна из самых высокопроизводительных и популярных fine-tune-версий Llama 2 13B, с богатыми описаниями и ролевыми играми. #merge

prompt / 1M
6,02
completion / 1M
6,02
контекст 4kjson
Открыть →
Nnex-agi

deepseek-v3.1-nex-n1

DeepSeek V3.1 Nex-N1 — это флагманский релиз серии Nex-N1, дообученная модель, разработанная для демонстрации автономности агентов, использования инструментов и продуктивности в реальном мире.

prompt / 1M
13,54
completion / 1M
50,16
контекст 131ktools · json
Открыть →
nousresearch

hermes-3-llama-3.1-405b

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждения, многооборотные диалоги, когерентность в…

prompt / 1M
100
completion / 1M
100
контекст 131kjson
Открыть →
● бесплатно
nousresearch

hermes-3-llama-3.1-405b:free

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие, рассуждение, многоходовые диалоги, связность в длинном…

prompt / 1M
0
completion / 1M
0
контекст 131k
Открыть →
nousresearch

hermes-3-llama-3.1-70b

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, значительно улучшенное ролевое взаимодействие,…

prompt / 1M
30,10
completion / 1M
30,10
контекст 131kjson
Открыть →
nousresearch

hermes-4-405b

Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research. It introduces a hybrid reasoning mode, where the model can choose to deliberate internally with <think>...</think> traces or respond…

prompt / 1M
100
completion / 1M
301
контекст 131kjson
Открыть →
nousresearch

hermes-4-70b

Hermes 4 70B is a hybrid reasoning model from Nous Research, built on Meta-Llama-3.1-70B. It introduces the same hybrid mode as the larger 405B release, allowing the model to either respond directly or generate explicit <think>...</think>…

prompt / 1M
13,04
completion / 1M
40,13
контекст 131kjson
Открыть →
nousresearch

hermes-2-pro-llama-3-8b

Hermes 2 Pro — это обновленная, переобученная версия Nous Hermes 2, состоящая из обновленного и очищенного набора данных OpenHermes 2.5, а также недавно представленного набора данных для вызова функций (Function Calling) и режима JSON…

prompt / 1M
14,04
completion / 1M
14,04
контекст 8kjson
Открыть →
Логотип NVIDIAnvidia

llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 — это модель для рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, разработанная на основе Llama-3.3-70B-Instruct от Meta с контекстом 128K. Она прошла пост-обучение для…

prompt / 1M
10,03
completion / 1M
40,13
контекст 131ktools · json
Открыть →
● бесплатно
Логотип NVIDIAnvidia

llama-nemotron-embed-vl-1b-v2:free

Модель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для многомодального поиска ответов на вопросы. Модель может встраивать «документы» в виде изображений, текста или изображений и текста...

prompt / 1M
0
completion / 1M
0
контекст 131kvision
Открыть →
Логотип NVIDIAnvidia

nemotron-3-nano-30b-a3b

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, предназначенная для разработчиков, создающих специализированные агентные системы ИИ.

prompt / 1M
5,02
completion / 1M
20,06
контекст 262ktools · json
Открыть →
● бесплатно
Логотип NVIDIAnvidia

nemotron-3-nano-30b-a3b:free

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью...

prompt / 1M
0
completion / 1M
0
контекст 256ktools
Открыть →
● бесплатно
Логотип NVIDIAnvidia

nemotron-3-nano-omni-30b-a3b-reasoning:free

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель 30B-A3B, разработанная для функционирования в качестве субагента восприятия и контекста в корпоративных агентских системах. Она принимает текст, изображения, видео и...

prompt / 1M
0
completion / 1M
0
контекст 256kaudio · vision · video · tools
Открыть →
Логотип NVIDIAnvidia

nemotron-3-super-120b-a12b

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях.…

prompt / 1M
9,03
completion / 1M
45,14
контекст 1Mtools · json
Открыть →
● бесплатно
Логотип NVIDIAnvidia

nemotron-3-super-120b-a12b:free

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, которая активирует всего 12 миллиардов параметров для достижения максимальной вычислительной эффективности и точности в сложных многоагентных…

prompt / 1M
0
completion / 1M
0
контекст 1Mtools · json
Открыть →
● бесплатно
Логотип NVIDIAnvidia

nemotron-nano-12b-v2-vl:free

NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель рассуждений с 12 миллиардами параметров, разработанная для понимания видео и анализа документов. Она представляет гибридную архитектуру Transformer-Mamba, сочетающую точность…

prompt / 1M
0
completion / 1M
0
контекст 128kvision · video · tools
Открыть →
Логотип NVIDIAnvidia

nemotron-nano-9b-v2

NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная с нуля компанией NVIDIA и предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы и задачи пользователей, сначала генерируя…

prompt / 1M
4,01
completion / 1M
16,05
контекст 131ktools · json
Открыть →
● бесплатно
Логотип NVIDIAnvidia

nemotron-nano-9b-v2:free

NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), разработанная и обученная с нуля компанией NVIDIA, предназначенная для решения как логических, так и нелогических задач. Она отвечает на запросы пользователей и...

prompt / 1M
0
completion / 1M
0
контекст 128ktools · json
Открыть →
openai

gpt-latest

Эта модель всегда перенаправляется на последнюю модель семейства OpenAI GPT.

prompt / 1M
502
completion / 1M
3 010
контекст 1.1Mfiles · vision · tools · json
Открыть →
openai

gpt-mini-latest

Эта модель всегда перенаправляет на новейшую модель семейства OpenAI GPT Mini.

prompt / 1M
75,24
completion / 1M
451
контекст 400kfiles · vision · tools · json
Открыть →
openai

gpt-audio

Модель gpt-audio — это первая общедоступная аудиомодель от OpenAI. Новый снимок включает улучшенный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Стоимость аудио составляет 32 доллара за…

prompt / 1M
251
completion / 1M
1 003
контекст 128kaudio · tools · json
Открыть →
openai

gpt-audio-mini

Экономичная версия GPT Audio. Новый снимок включает обновленный декодер для более естественного звучания голосов и обеспечивает лучшую согласованность голоса. Входные данные оцениваются в $0.60 за миллион токенов, а выходные — в $2.40 за…

prompt / 1M
60,19
completion / 1M
241
контекст 128kaudio · tools · json
Открыть →
openai

gpt-chat-latest

GPT Chat Latest указывает на стабильный API-псевдоним OpenAI `chat-latest`, который всегда разрешается в последнюю модель Instant chat, используемую в ChatGPT. По мере того, как OpenAI будет выпускать новые обновления модели Instant в…

prompt / 1M
502
completion / 1M
3 010
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-3.5-turbo

GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она способна понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач автодополнения.

prompt / 1M
50,16
completion / 1M
150
контекст 16ktools · json
Открыть →
openai

gpt-3.5-turbo-0613

GPT-3.5 Turbo — это самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, а также оптимизирована для чата и традиционных задач завершения.

prompt / 1M
100
completion / 1M
201
контекст 4ktools · json
Открыть →
openai

gpt-3.5-turbo-16k

Эта модель предлагает в четыре раза большую длину контекста по сравнению с gpt-3.5-turbo, что позволяет ей обрабатывать примерно 20 страниц текста за один запрос при более высокой стоимости. Данные для обучения: до сентября 2021 года.

prompt / 1M
301
completion / 1M
401
контекст 16ktools · json
Открыть →
openai

gpt-3.5-turbo-instruct

Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструкционных запросов и исключающим оптимизации, связанные с чатом. Данные обучения: до сентября 2021 года.

prompt / 1M
150
completion / 1M
201
контекст 4kjson
Открыть →
openai

gpt-4

Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультиканальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря своим более обширным общим знаниям и продвинутым…

prompt / 1M
3 010
completion / 1M
6 019
контекст 8ktools · json
Открыть →
openai

gpt-4-0314

GPT-4-0314 — это первая выпущенная версия GPT-4 с длиной контекста 8192 токена, поддержка которой осуществлялась до 14 июня. Данные для обучения: до сентября 2021 года.

prompt / 1M
3 010
completion / 1M
6 019
контекст 8ktools · json
Открыть →
openai

gpt-4-turbo

Новейшая модель GPT-4 Turbo с возможностями зрения. Запросы со зрением теперь могут использовать режим JSON и вызов функций.

prompt / 1M
1 003
completion / 1M
3 010
контекст 128kvision · tools · json
Открыть →
openai

gpt-4-1106-preview

Новейшая модель GPT-4 Turbo с возможностями зрения. Запросы со зрением теперь могут использовать режим JSON и вызов функций.

prompt / 1M
1 003
completion / 1M
3 010
контекст 128ktools · json
Открыть →
openai

gpt-4-turbo-preview

Предварительная версия модели GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми выходными данными, параллельным вызовом функций и многим другим. Данные для обучения: до декабря 2023 года.

prompt / 1M
1 003
completion / 1M
3 010
контекст 128ktools · json
Открыть →
openai

gpt-4.1

GPT-4.1 — это флагманская большая языковая модель, оптимизированная для расширенного следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион…

prompt / 1M
201
completion / 1M
803
контекст 1Mvision · files · tools · json
Открыть →
openai

gpt-4.1-mini

GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, сопоставимую с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% в сложных тестах на…

prompt / 1M
40,13
completion / 1M
161
контекст 1Mvision · files · tools · json
Открыть →
openai

gpt-4.1-nano

Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря контекстному окну в 1 миллион токенов и…

prompt / 1M
10,03
completion / 1M
40,13
контекст 1Mvision · files · tools · json
Открыть →
openai

gpt-4o-2024-05-13

GPT-4o («o» от «omni») — это новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с выводом текста. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), при этом работая в два раза быстрее и будучи…

prompt / 1M
502
completion / 1M
1 505
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-4o-2024-08-06

Версия GPT-4o от 06.08.2024 предлагает улучшенную производительность в структурированных выходных данных, с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте…

prompt / 1M
251
completion / 1M
1 003
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-4o-2024-11-20

Версия GPT-4o от 20.11.2024 предлагает улучшенные возможности творческого письма с более естественным, увлекательным и адаптированным стилем для повышения релевантности и читабельности. Она также лучше работает с загруженными файлами,…

prompt / 1M
251
completion / 1M
1 003
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-4o-search-preview

Предварительная версия поиска GPT-4o — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

3,52за /request
контекст 128kjson
Открыть →
openai

gpt-4o-mini

GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.

prompt / 1M
15,05
completion / 1M
60,19
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-4o-mini-2024-07-18

GPT-4o mini — это новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая как текстовые, так и графические входные данные с текстовыми выходными данными.

prompt / 1M
15,05
completion / 1M
60,19
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-4o-mini-search-preview

Предварительная версия поиска GPT-4o mini — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

2,76за /request
контекст 128kjson
Открыть →
openai

gpt-5

GPT-5 — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…

prompt / 1M
125
completion / 1M
1 003
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5-chat

GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-ориентированных бесед в корпоративных приложениях.

prompt / 1M
125
completion / 1M
1 003
контекст 128kfiles · vision · json
Открыть →
openai

gpt-5-codex

GPT-5-Codex is a specialized version of GPT-5 optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…

prompt / 1M
125
completion / 1M
1 003
контекст 400kvision · tools · json
Открыть →
openai

gpt-5-image

[GPT-5](https://openrouter.ai/openai/gpt-5) Image combines OpenAI's GPT-5 model with state-of-the-art image generation capabilities. It offers major improvements in reasoning, code quality, and user experience while incorporating GPT Image…

prompt / 1M
1 003
completion / 1M
1 003
контекст 400kvision · files · json
Открыть →
openai

gpt-5-image-mini

GPT-5 Image Mini combines OpenAI's advanced language capabilities, powered by [GPT-5 Mini](https://openrouter.ai/openai/gpt-5-mini), with GPT Image 1 Mini for efficient image generation. This natively multimodal model features superior…

prompt / 1M
251
completion / 1M
201
контекст 400kfiles · vision · json
Открыть →
openai

gpt-5-mini

GPT-5 Mini — это компактная версия GPT-5, разработанная для решения более лёгких задач, требующих рассуждений. Она обеспечивает те же преимущества GPT-5 в следовании инструкциям и настройке безопасности, но с уменьшенной задержкой и…

prompt / 1M
25,08
completion / 1M
201
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5-nano

GPT-5-Nano — это самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрого взаимодействия и сред со сверхнизкой задержкой. Хотя его глубина рассуждений ограничена по сравнению с более…

prompt / 1M
5,02
completion / 1M
40,13
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5-pro

GPT-5 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и…

prompt / 1M
1 505
completion / 1M
12 038
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5.1

GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильное общецелевое рассуждение, улучшенное следование инструкциям и более естественный стиль беседы по сравнению с GPT-5. Она использует адаптивное…

prompt / 1M
125
completion / 1M
1 003
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5.1-chat

GPT-5.1 Chat (также известный как Instant) — это быстрый, легковесный представитель семейства 5.1, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы…

prompt / 1M
125
completion / 1M
1 003
контекст 128kfiles · vision · tools · json
Открыть →
openai

gpt-5.1-codex

GPT-5.1-Codex is a specialized version of GPT-5.1 optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…

prompt / 1M
125
completion / 1M
1 003
контекст 400kvision · tools · json
Открыть →
openai

gpt-5.1-codex-max

GPT-5.1-Codex-Max — это новейшая агентная модель кодирования от OpenAI, разработанная для длительных задач по разработке программного обеспечения с высоким контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на…

prompt / 1M
125
completion / 1M
1 003
контекст 400kvision · tools · json
Открыть →
openai

gpt-5.1-codex-mini

GPT-5.1-Codex-Mini — это уменьшенная и более быстрая версия GPT-5.1-Codex

prompt / 1M
25,08
completion / 1M
201
контекст 400kvision · tools · json
Открыть →
openai

gpt-5.2

GPT-5.2 — это новейшая пограничная модель серии GPT-5, предлагающая более высокую производительность в режиме агента и при работе с длинным контекстом по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического…

prompt / 1M
176
completion / 1M
1 404
контекст 400kfiles · vision · tools · json
Открыть →
openai

gpt-5.2-chat

GPT-5.2 Chat (также известный как Instant) — это быстрый и легковесный член семейства 5.2, оптимизированный для чата с низкой задержкой, сохраняющий при этом сильный общий интеллект. Он использует адаптивное рассуждение, чтобы выборочно…

prompt / 1M
176
completion / 1M
1 404
контекст 128kfiles · vision · tools · json
Открыть →
openai

gpt-5.2-pro

GPT-5.2 Pro — это самая передовая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности при работе с длинным контекстом по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих…

prompt / 1M
2 107
completion / 1M
16 853
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5.2-codex

GPT-5.2-Codex is an upgraded version of GPT-5.1-Codex optimized for software engineering and coding workflows. It is designed for both interactive development sessions and long, independent execution of complex engineering tasks. The model…

prompt / 1M
176
completion / 1M
1 404
контекст 400kvision · tools · json
Открыть →
openai

gpt-5.3-chat

GPT-5.3 Chat — это обновление самой используемой модели ChatGPT, которое делает повседневные беседы более плавными, полезными и непосредственно помогающими. Оно обеспечивает более точные ответы с лучшей контекстуализацией и значительно…

prompt / 1M
176
completion / 1M
1 404
контекст 128kvision · files · tools · json
Открыть →
openai

gpt-5.3-codex

GPT-5.3-Codex — это самая передовая агентная модель кодирования от OpenAI, сочетающая в себе передовую производительность программной инженерии GPT-5.2-Codex с более широкими возможностями рассуждения и профессиональными знаниями GPT-5.2.…

prompt / 1M
176
completion / 1M
1 404
контекст 400kvision · files · tools · json
Открыть →
openai

gpt-5.4

GPT-5.4 — это новейшая пограничная модель OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. на вход, 128 тыс. на выход) с поддержкой текстового и графического…

prompt / 1M
251
completion / 1M
1 505
контекст 1.1Mvision · files · tools · json
Открыть →
openai

gpt-5.4-image-2

[GPT-5.4](https://openrouter.ai/openai/gpt-5.4) Image 2 combines OpenAI's GPT-5.4 model with state-of-the-art image generation capabilities from GPT Image 2. It enables rich multimodal workflows, allowing users to seamlessly move between…

prompt / 1M
803
completion / 1M
1 505
контекст 272kvision · files · json
Открыть →
openai

gpt-5.4-mini

GPT-5.4 mini переносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и графические входные данные с высокой производительностью в…

prompt / 1M
75,24
completion / 1M
451
контекст 400kfiles · vision · tools · json
Открыть →
openai

gpt-5.4-nano

GPT-5.4 nano — это самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и требующих большого объема обработки. Он поддерживает текстовые и графические входные данные и разработан для…

prompt / 1M
20,06
completion / 1M
125
контекст 400kfiles · vision · tools · json
Открыть →
openai

gpt-5.4-pro

GPT-5.4 Pro — это самая передовая модель OpenAI, основанная на унифицированной архитектуре GPT-5.4 с расширенными возможностями рассуждений для сложных и ответственных задач. Она имеет контекстное окно размером более 1 млн токенов (922…

prompt / 1M
3 010
completion / 1M
18 057
контекст 1.1Mvision · files · tools · json
Открыть →
openai

gpt-5.5

GPT-5.5 — это передовая модель OpenAI, разработанная для сложных профессиональных рабочих нагрузок, основанная на GPT-5.4 с более сильным рассуждением, более высокой надежностью и улучшенной эффективностью токенов для сложных задач. Она…

prompt / 1M
502
completion / 1M
3 010
контекст 1.1Mfiles · vision · tools · json
Открыть →
openai

gpt-5.5-pro

GPT-5.5 Pro — это высокопроизводительная модель OpenAI, оптимизированная для глубокого анализа и точности в сложных, ответственных рабочих нагрузках. Она имеет контекстное окно размером более 1 млн токенов (922 тыс. входных, 128 тыс.…

prompt / 1M
3 010
completion / 1M
18 057
контекст 1.1Mfiles · vision · tools · json
Открыть →
openai

gpt-oss-120b

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) с 117 миллиардами параметров от OpenAI, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…

prompt / 1M
3,91
completion / 1M
18,06
контекст 131ktools · json
Открыть →
● бесплатно
openai

gpt-oss-120b:free

gpt-oss-120b — это открытая языковая модель Mixture-of-Experts (MoE) от OpenAI с 117 миллиардами параметров, разработанная для высокоинтеллектуальных, агентных и универсальных производственных сценариев использования. Она активирует 5,1…

prompt / 1M
0
completion / 1M
0
контекст 131ktools
Открыть →
openai

gpt-oss-20b

gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на один прямой проход, оптимизированную для…

prompt / 1M
2,91
completion / 1M
14,04
контекст 131ktools · json
Открыть →
● бесплатно
openai

gpt-oss-20b:free

gpt-oss-20b — это открытая модель с 21 миллиардом параметров, выпущенная OpenAI по лицензии Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров на прямой проход, оптимизированную для...

prompt / 1M
0
completion / 1M
0
контекст 131ktools
Открыть →
openai

gpt-oss-safeguard-20b

gpt-oss-safeguard-20b — это модель для рассуждений о безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта открытая модель Mixture-of-Experts (MoE) с 21 миллиардом параметров обеспечивает меньшую задержку для задач безопасности,…

prompt / 1M
7,52
completion / 1M
30,10
контекст 131ktools · json
Открыть →
openai

o1

Новейшее и самое мощное семейство моделей от OpenAI, o1, разработано для того, чтобы тратить больше времени на обдумывание перед ответом. Серия моделей o1 обучена с использованием крупномасштабного обучения с подкреплением для рассуждений…

prompt / 1M
1 505
completion / 1M
6 019
контекст 200kvision · files · tools · json
Открыть →
openai

o1-pro

Модели серии o1 обучены с использованием обучения с подкреплением, чтобы обдумывать свои ответы и выполнять сложное рассуждение. Модель o1-pro использует больше вычислительных ресурсов, чтобы обдумывать более тщательно и предоставлять…

prompt / 1M
15 048
completion / 1M
60 191
контекст 200kvision · files · json
Открыть →
openai

o3

o3 — это всесторонне развитая и мощная модель, охватывающая различные области. Она устанавливает новый стандарт для задач по математике, естественным наукам, программированию и визуальному мышлению. Она также превосходно справляется с…

prompt / 1M
201
completion / 1M
803
контекст 200kvision · files · tools · json
Открыть →
openai

o3-deep-research

o3-deep-research — это продвинутая модель OpenAI для глубоких исследований, разработанная для решения сложных, многоэтапных исследовательских задач.

prompt / 1M
1 003
completion / 1M
4 013
контекст 200kvision · files · tools · json
Открыть →
openai

o3-mini

OpenAI o3-mini is a cost-efficient language model optimized for STEM reasoning tasks, particularly excelling in science, mathematics, and coding.

prompt / 1M
110
completion / 1M
441
контекст 200kfiles · tools · json
Открыть →
openai

o3-mini-high

OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), но с параметром `reasoning_effort`, установленным на `high`.

prompt / 1M
110
completion / 1M
441
контекст 200kfiles · tools · json
Открыть →
openai

o3-pro

The o-series of models are trained with reinforcement learning to think before they answer and perform complex reasoning. The o3-pro model uses more compute to think harder and provide consistently better answers.

prompt / 1M
2 006
completion / 1M
8 025
контекст 200kfiles · vision · tools · json
Открыть →
openai

o4-mini

OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении мощных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует…

prompt / 1M
110
completion / 1M
441
контекст 200kvision · files · tools · json
Открыть →
openai

o4-mini-deep-research

o4-mini-deep-research — это более быстрая и доступная модель для глубоких исследований от OpenAI, идеально подходящая для решения сложных, многоэтапных исследовательских задач.

prompt / 1M
201
completion / 1M
803
контекст 200kfiles · vision · tools · json
Открыть →
openai

o4-mini-high

OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), но с параметром `reasoning_effort`, установленным на `high`.

prompt / 1M
110
completion / 1M
441
контекст 200kvision · files · tools · json
Открыть →
openai

text-embedding-3-large

`text-embedding-3-large` — это самая мощная модель встраивания OpenAI для задач как на английском, так и на других языках. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности…

prompt / 1M
13,04
completion / 1M
0
контекст 8kjson
Открыть →
openai

text-embedding-3-small

text-embedding-3-small — это улучшенная, более производительная версия модели встраивания ada от OpenAI. Встраивания (embeddings) — это числовое представление текста, которое можно использовать для измерения связанности между двумя…

prompt / 1M
2,01
completion / 1M
0
контекст 8kjson
Открыть →
openai

text-embedding-ada-002

text-embedding-ada-002 — это устаревшая модель для создания текстовых эмбеддингов от OpenAI.

prompt / 1M
10,03
completion / 1M
0
контекст 8kjson
Открыть →
● бесплатно
Hhubris

owl-alpha

Owl Alpha is a high-performance foundation model designed for agentic workloads. Natively supports tool use, and long-context tasks, with strong performance in code generation, automated workflows, and complex instruction execution.…

prompt / 1M
0
completion / 1M
0
контекст 1Mtools · json
Открыть →
Pperceptron

perceptron-mk1

Perceptron Mk1 (Mark One) — это высококачественная визуально-языковая модель Perceptron для видео и воплощенного мышления.** Она принимает изображения и видео в сочетании с запросами на естественном языке и выдает подробные ответы с…

prompt / 1M
15,05
completion / 1M
150
контекст 33kvision · video
Открыть →
Логотип Perplexityperplexity

pplx-embed-v1-0.6b

pplx-embed-v1-0.6B — это одна из передовых моделей встраивания текста от Perplexity, созданная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного поиска текста, а модель с 0.6B…

prompt / 1M
0,400
completion / 1M
0
контекст 32k
Открыть →
Логотип Perplexityperplexity

pplx-embed-v1-4b

pplx-embed-v1 -4B — одна из передовых моделей Perplexity для создания текстовых эмбеддингов, разработанная для полномасштабного поиска в реальных условиях. pplx-embed-v1 оптимизирована для стандартного плотного текстового поиска, а модель…

prompt / 1M
3,01
completion / 1M
0
контекст 32k
Открыть →
Логотип Perplexityperplexity

sonar

Sonar — это легковесный, доступный, быстрый и простой в использовании инструмент, теперь с цитированием и возможностью настройки источников. Он разработан для компаний, которым необходимы легковесные функции вопросов и ответов,…

0,510за /request
контекст 127kvision
Открыть →
Логотип Perplexityperplexity

sonar-deep-research

Sonar Deep Research — это модель, ориентированная на исследования, разработанная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора…

0,510за /request
контекст 128k
Открыть →
Логотип Perplexityperplexity

sonar-pro

Примечание: Цены Sonar Pro включают цены на поиск Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)

0,510за /request
контекст 200kvision
Открыть →
Логотип Perplexityperplexity

sonar-pro-search

Exclusively available on the OpenRouter API, Sonar Pro's new Pro Search mode is Perplexity's most advanced agentic search system. It is designed for deeper reasoning and analysis. Pricing is based on tokens plus $18 per thousand requests.…

1,81за /request
контекст 200kvision
Открыть →
Логотип Perplexityperplexity

sonar-reasoning-pro

Примечание: В стоимость Sonar Pro включена стоимость поиска Perplexity. Подробности см. [здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro)

0,510за /request
контекст 128kvision
Открыть →
● бесплатно
Ppoolside

laguna-m.1:free

Laguna M.1 — это флагманская модель кодирующего агента от [Poolside](https://poolside.ai), оптимизированная для сложных задач разработки программного обеспечения. Разработанная для агентских рабочих процессов кодирования, она поддерживает…

prompt / 1M
0
completion / 1M
0
контекст 262ktools
Открыть →
● бесплатно
Ppoolside

laguna-xs.2:free

Laguna XS.2 — это модель второго поколения в классе размера XS от [Poolside](https://poolside.ai), их серии эффективных кодирующих агентов. Она сочетает возможности вызова инструментов и рассуждения с компактным размером, предлагая...

prompt / 1M
0
completion / 1M
0
контекст 262ktools
Открыть →
Pprime-intellect

intellect-3

INTELLECT-3 — это модель Mixture-of-Experts с 106 миллиардами параметров (12 миллиардов активных), дообученная на основе GLM-4.5-Air-Base с использованием контролируемой донастройки (SFT) с последующим крупномасштабным обучением с…

prompt / 1M
20,06
completion / 1M
110
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen-plus-2025-07-28

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.

prompt / 1M
26,08
completion / 1M
78,25
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen-plus-2025-07-28:thinking

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.

prompt / 1M
26,08
completion / 1M
78,25
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen-plus

Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, обладающую сбалансированным сочетанием производительности, скорости и стоимости.

prompt / 1M
26,08
completion / 1M
78,25
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen-2.5-7b-instruct

Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:

prompt / 1M
4,01
completion / 1M
10,03
контекст 131k
Открыть →
Логотип Qwenqwen

qwen2.5-vl-72b-instruct

Qwen2.5-VL отлично распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также обладает высокой способностью анализировать тексты, диаграммы, значки, графику и макеты внутри изображений.

prompt / 1M
25,08
completion / 1M
75,24
контекст 131kvision · json
Открыть →
Логотип Qwenqwen

qwen3-14b

Qwen3-14B — это плотная причинная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления»…

prompt / 1M
10,03
completion / 1M
24,08
контекст 132ktools · json
Открыть →
Логотип Qwenqwen

qwen3-235b-a22b

Qwen3-235B-A22B — это модель Mixture-of-Experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров за один прямой проход. Она поддерживает бесшовное переключение между режимом «мышления» для…

prompt / 1M
45,64
completion / 1M
183
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-235b-a22b-2507

Qwen3-235B-A22B-Instruct-2507 — это многоязычная, настроенная на инструкции языковая модель типа Mixture-of-Experts, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров на прямой проход. Она оптимизирована для…

prompt / 1M
7,12
completion / 1M
10,03
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-235b-a22b-thinking-2507

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждения. Она активирует 22B из своих 235B параметров за один прямой проход и…

prompt / 1M
10,03
completion / 1M
10,03
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-30b-a3b

Qwen3, последнее поколение серии больших языковых моделей Qwen, включает в себя как плотную архитектуру, так и архитектуру MoE (mixture-of-experts), чтобы преуспеть в рассуждениях, многоязычной поддержке и продвинутых агентских задачах. Её…

prompt / 1M
9,03
completion / 1M
45,14
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-30b-a3b-instruct-2507

Qwen3-30B-A3B-Instruct-2507 — это языковая модель Qwen с 30,5 миллиардами параметров, использующая архитектуру MoE, с 3,3 миллиардами активных параметров на вывод. Она работает в немыслящем режиме и предназначена для высококачественного…

prompt / 1M
4,29
completion / 1M
17,21
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-30b-a3b-thinking-2507

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений Mixture-of-Experts с 30 миллиардами параметров, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель разработана специально для «режима мышления»,…

prompt / 1M
8,03
completion / 1M
40,13
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-32b

Qwen3-32B — это причинная языковая модель с плотной архитектурой и 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между…

prompt / 1M
8,03
completion / 1M
28,09
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-8b

Qwen3-8B — это плотная причинная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивного рассуждения, так и для эффективного диалога. Она поддерживает плавное переключение между…

prompt / 1M
5,02
completion / 1M
40,13
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen3-coder-30b-a3b-instruct

Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 миллиардами параметров и 128 экспертами (8 активных за один прямой проход), разработанная для продвинутой генерации кода, понимания репозиториев и использования…

prompt / 1M
7,02
completion / 1M
27,09
контекст 160ktools · json
Открыть →
Логотип Qwenqwen

qwen3-coder

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…

prompt / 1M
22,07
completion / 1M
181
контекст 1Mtools · json
Открыть →
● бесплатно
Логотип Qwenqwen

qwen3-coder:free

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентских задач кодирования, таких как вызов функций, использование инструментов и рассуждения в…

prompt / 1M
0
completion / 1M
0
контекст 1Mtools
Открыть →
Логотип Qwenqwen

qwen3-coder-flash

Qwen3 Coder Flash — это быстрая и экономичная версия проприетарной модели Qwen3 Coder Plus от Alibaba. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и…

prompt / 1M
19,56
completion / 1M
97,81
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen3-coder-next

Qwen3-Coder-Next — это причинная языковая модель с открытым весом, оптимизированная для кодирующих агентов и локальных рабочих процессов разработки. Она использует разреженную MoE-архитектуру с общим количеством параметров 80B и всего 3B…

prompt / 1M
11,04
completion / 1M
80,25
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-coder-plus

Qwen3 Coder Plus — это проприетарная версия Alibaba модели Qwen3 Coder 480B A35B с открытым исходным кодом. Это мощная модель кодирующего агента, специализирующаяся на автономном программировании посредством вызова инструментов и…

prompt / 1M
65,21
completion / 1M
326
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen3-embedding-4b

Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…

prompt / 1M
2,01
completion / 1M
0
контекст 33kjson
Открыть →
Логотип Qwenqwen

qwen3-embedding-8b

Серия моделей Qwen3 Embedding — это новейшая проприетарная модель семейства Qwen, специально разработанная для задач встраивания и ранжирования текста. Эта серия унаследовала исключительные многоязычные возможности, понимание длинных…

prompt / 1M
1,00
completion / 1M
0
контекст 32kjson
Открыть →
Логотип Qwenqwen

qwen3-max

Qwen3-Max — это обновленный релиз, основанный на серии Qwen3, предлагающий значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате знаний с длинным хвостом по сравнению с версией от января 2025 года.…

prompt / 1M
78,25
completion / 1M
391
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-max-thinking

Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для высокоответственных когнитивных задач, требующих глубоких, многошаговых рассуждений. За счет значительного увеличения мощности модели и вычислительных…

prompt / 1M
78,25
completion / 1M
391
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-next-80b-a3b-instruct

Qwen3-Next-80B-A3B-Instruct — это чат-модель из серии Qwen3-Next, настроенная на выполнение инструкций и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с…

prompt / 1M
9,03
completion / 1M
110
контекст 262ktools · json
Открыть →
● бесплатно
Логотип Qwenqwen

qwen3-next-80b-a3b-instruct:free

Qwen3-Next-80B-A3B-Instruct — это чат-модель серии Qwen3-Next, настроенная на инструкции и оптимизированная для быстрых, стабильных ответов без следов «размышлений». Она предназначена для решения сложных задач, связанных с рассуждениями,…

prompt / 1M
0
completion / 1M
0
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-next-80b-a3b-thinking

Qwen3-Next-80B-A3B-Thinking — это чат-модель, ориентированная на рассуждения, из линейки Qwen3-Next, которая по умолчанию выводит структурированные трассировки «мышления». Она разработана для решения сложных многошаговых задач:…

prompt / 1M
9,78
completion / 1M
78,25
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-235b-a22b-instruct

Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct предназначена для общего использования в задачах «зрение-язык» (VQA,…

prompt / 1M
20,06
completion / 1M
88,28
контекст 262kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-235b-a22b-thinking

Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодального рассуждения в STEM и математике. Серия…

prompt / 1M
26,08
completion / 1M
261
контекст 131kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-30b-a3b-instruct

Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Модель…

prompt / 1M
13,04
completion / 1M
52,17
контекст 262kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-30b-a3b-thinking

Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Её вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно…

prompt / 1M
13,04
completion / 1M
157
контекст 131kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-32b-instruct

Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная визуально-языковая модель, разработанная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Обладая 32 миллиардами параметров, она сочетает глубокое…

prompt / 1M
10,43
completion / 1M
41,73
контекст 262kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-8b-instruct

Qwen3-VL-8B-Instruct — это мультимодальная визуально-языковая модель из серии Qwen3-VL, созданная для высокоточного понимания и рассуждения на основе текста, изображений и видео. Она отличается улучшенным мультимодальным слиянием с…

prompt / 1M
8,03
completion / 1M
50,16
контекст 256kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3-vl-8b-thinking

Qwen3-VL-8B-Thinking — это вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, разработанный для продвинутого визуального и текстового анализа в сложных сценах, документах и временных последовательностях. Он…

prompt / 1M
11,74
completion / 1M
137
контекст 256kvision · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-397b-a17b

Нативная визуально-языковая модель Qwen3.5 серии 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности инференса. Она…

prompt / 1M
39,12
completion / 1M
235
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-plus-02-15

Модели серии Qwen3.5 native vision-language Plus построены на гибридной архитектуре, которая объединяет механизмы линейного внимания с моделями разреженной смеси экспертов (MoE), достигая более высокой эффективности инференса. В различных…

prompt / 1M
26,08
completion / 1M
157
контекст 1Mvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-plus-20260420

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это…

prompt / 1M
30,10
completion / 1M
181
контекст 1Mvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-122b-a10b

Модель Qwen3.5 122B-A10B native vision-language построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью MoE, достигая более высокой эффективности вывода. По общей производительности эта…

prompt / 1M
26,08
completion / 1M
209
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-27b

Модель Qwen3.5 27B native vision-language Dense включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировании скорости вывода и производительности. Её общие возможности сопоставимы с возможностями…

prompt / 1M
19,56
completion / 1M
157
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-35b-a3b

Серия Qwen3.5 35B-A3B — это нативная визуально-языковая модель, разработанная с гибридной архитектурой, которая объединяет механизмы линейного внимания и разреженную модель MoE, достигая более высокой эффективности инференса. Её общая…

prompt / 1M
14,04
completion / 1M
100
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-9b

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения мощных возможностей рассуждения, кодирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует…

prompt / 1M
4,01
completion / 1M
15,05
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.5-flash-02-23

Нативные Flash-модели Qwen3.5 для зрения и языка построены на гибридной архитектуре, которая объединяет механизм линейного внимания с разреженной моделью Mixture-of-Experts, достигая более высокой эффективности вывода. По сравнению с…

prompt / 1M
6,52
completion / 1M
26,08
контекст 1Mvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.6-27b

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы — и…

prompt / 1M
29,09
completion / 1M
321
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.6-35b-a3b

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts,…

prompt / 1M
14,04
completion / 1M
100
контекст 262kvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.6-flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании…

prompt / 1M
18,81
completion / 1M
113
контекст 1Mvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.6-max-preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования…

prompt / 1M
104
completion / 1M
626
контекст 262ktools · json
Открыть →
Логотип Qwenqwen

qwen3.6-plus

Qwen 3.6 Plus основан на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженной маршрутизацией mixture-of-experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он…

prompt / 1M
32,60
completion / 1M
196
контекст 1Mvision · video · tools · json
Открыть →
Логотип Qwenqwen

qwen3.7-max

Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а…

prompt / 1M
125
completion / 1M
376
контекст 1Mtools · json
Открыть →
Логотип Qwenqwen

qwen-2.5-72b-instruct

Qwen2.5 72B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:

prompt / 1M
36,11
completion / 1M
40,13
контекст 131ktools · json
Открыть →
Логотип Qwenqwen

qwen-2.5-coder-32b-instruct

Qwen2.5-Coder — это новейшая серия больших языковых моделей Qwen, ориентированных на код (ранее известных как CodeQwen). Qwen2.5-Coder включает следующие улучшения по сравнению с CodeQwen1.5:

prompt / 1M
66,21
completion / 1M
100
контекст 128k
Открыть →
recraft

recraft-v3

Recraft V3 is an image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios.

4,02за /image
контекст 66kvision
Открыть →
recraft

recraft-v4

Recraft V4 is an image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios. It delivers stronger compositional judgment, color coherence, and legible embedded…

4,02за /image
контекст 66kvision
Открыть →
recraft

recraft-v4-pro

Recraft V4 Pro is an image generation model from Recraft. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios, double the resolution of V4. It offers higher fidelity and detail density than…

25,08за /image
контекст 66kvision
Открыть →
recraft

recraft-v4-pro-vector

Recraft V4 Pro Vector is the vector (SVG) variant of Recraft V4 Pro. It supports text and image inputs and produces vector image output across multiple aspect ratios at the higher fidelity Pro tier. Output is delivered as SVG, suitable for…

30,10за /image
контекст 66kvision
Открыть →
recraft

recraft-v4-vector

Recraft V4 Vector is the vector (SVG) variant of Recraft V4. It supports text and image inputs and produces vector image output across multiple aspect ratios. Compared to the raster V4, output is delivered as SVG, suitable for icons,…

8,03за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1

Recraft V4.1 is an image generation model from Recraft tuned for high aesthetics. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios, with typical generation around 10 seconds. Compared to…

4,02за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1-pro

Recraft V4.1 Pro is an image generation model from Recraft tuned for high aesthetics. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios - double the resolution of V4.1 - with typical…

25,08за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1-pro-vector

Recraft V4.1 Pro Vector is the vector (SVG) variant of Recraft V4.1 Pro, tuned for high aesthetics. It supports text and image inputs and produces higher-resolution SVG image output across multiple aspect ratios, with typical generation…

30,10за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1-utility

Recraft V4.1 Utility is a general-purpose image generation model from Recraft. It supports text and image inputs with image output at ~1K resolution across multiple aspect ratios, with typical generation around 10 seconds. The Utility line…

4,02за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1-utility-pro

Recraft V4.1 Utility Pro is a general-purpose image generation model from Recraft. It supports text and image inputs with image output at ~2K resolution across multiple aspect ratios — double the resolution of V4.1 Utility - with typical…

25,08за /image
контекст 66kvision
Открыть →
recraft

recraft-v4.1-vector

Recraft V4.1 Vector is the vector (SVG) variant of Recraft V4.1, tuned for high aesthetics. It supports text and image inputs and produces SVG image output across multiple aspect ratios, with typical generation around 13 seconds. Output…

8,03за /image
контекст 66kvision
Открыть →
Rrekaai

reka-edge

Reka Edge — это чрезвычайно эффективная 7B мультимодальная визуально-языковая модель, которая принимает на вход изображения/видео+текст и генерирует текстовые выходы. Эта модель специально оптимизирована для обеспечения лучшей в отрасли…

prompt / 1M
10,03
completion / 1M
10,03
контекст 16kvision · video · tools
Открыть →
Rrekaai

reka-flash-3

Reka Flash 3 — это универсальная большая языковая модель с 21 миллиардом параметров, настроенная на выполнение инструкций и разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и…

prompt / 1M
10,03
completion / 1M
20,06
контекст 66k
Открыть →
relace

relace-apply-3

Relace Apply 3 — это специализированная LLM для патчинга кода, которая интегрирует предложенные ИИ изменения непосредственно в ваши исходные файлы. Она может применять обновления от GPT-4o, Claude и других моделей в ваши файлы со средней…

prompt / 1M
85,27
completion / 1M
125
контекст 256k
Открыть →
relace

relace-search

Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возврата релевантных файлов по запросу пользователя.

prompt / 1M
100
completion / 1M
301
контекст 256ktools
Открыть →
Uundi95

remm-slerp-l2-13b

Повторная попытка создания оригинальной MythoMax-L2-B13, но с обновленными моделями. #merge

prompt / 1M
45,14
completion / 1M
65,21
контекст 6kjson
Открыть →
Ssao10k

l3-lunaris-8b

Lunaris 8B — это универсальная модель общего назначения и для ролевых игр, основанная на Llama 3. Она представляет собой стратегическое объединение нескольких моделей, разработанное для баланса между креативностью, улучшенной логикой и…

prompt / 1M
4,01
completion / 1M
5,02
контекст 8kjson
Открыть →
Ssao10k

l3-euryale-70b

Euryale 70B v2.1 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k).

prompt / 1M
148
completion / 1M
148
контекст 8ktools
Открыть →
Ssao10k

l3.1-70b-hanami-x1

Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).

prompt / 1M
301
completion / 1M
301
контекст 16k
Открыть →
Ssao10k

l3.1-euryale-70b

Euryale L3.1 70B v2.2 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).

prompt / 1M
85,27
completion / 1M
85,27
контекст 131ktools · json
Открыть →
Ssao10k

l3.3-euryale-70b

Euryale L3.3 70B — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Она является преемником [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).

prompt / 1M
65,21
completion / 1M
75,24
контекст 131kjson
Открыть →
Ssentence-transformers

all-minilm-l12-v2

Модель эмбеддингов all-MiniLM-L12-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая эффективные и высококачественные семантические эмбеддинги, оптимизированные для таких задач, как…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Ssentence-transformers

all-minilm-l6-v2

Модель встраивания all-MiniLM-L6-v2 отображает предложения и короткие абзацы в 384-мерное плотное векторное пространство, обеспечивая высококачественные семантические представления, которые идеально подходят для последующих задач, таких…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Ssentence-transformers

all-mpnet-base-v2

Модель эмбеддингов all-mpnet-base-v2 кодирует предложения и короткие абзацы в 768-мерное плотное векторное пространство, предоставляя высокоточные семантические эмбеддинги, хорошо подходящие для таких задач, как информационный поиск,…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Ssentence-transformers

multi-qa-mpnet-base-dot-v1

Модель эмбеддингов multi-qa-mpnet-base-dot-v1 преобразует предложения и короткие абзацы в 768-мерное плотное векторное пространство, генерируя высококачественные семантические эмбеддинги, оптимизированные для поиска ответов на вопросы,…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Ssentence-transformers

paraphrase-minilm-l6-v2

Модель встраивания paraphrase-MiniLM-L6-v2 преобразует предложения и короткие абзацы в 384-мерное плотное векторное пространство, создавая высококачественные семантические встраивания, оптимизированные для обнаружения перефразирований,…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Ssourceful

riverflow-v2-fast

Riverflow V2 Fast is the fastest variant of Sourceful's Riverflow 2.0 lineup, best for production deployments and latency-critical workflows.

2,01за /image
3,01за /font
20,07за /reference
контекст 8kvision
Открыть →
Ssourceful

riverflow-v2-fast-preview

Riverflow V2 Fast Preview — это самый быстрый вариант из линейки предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным…

3,01за /image
контекст 8kvision
Открыть →
Ssourceful

riverflow-v2-max-preview

Riverflow V2 Max Preview — это самый мощный вариант в линейке предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным семейством…

7,53за /image
контекст 8kvision
Открыть →
Ssourceful

riverflow-v2-pro

Riverflow V2 Pro is the most powerful variant of Sourceful's Riverflow 2.0 lineup, best for top-tier control and perfect text rendering.

15,05за /image
3,01за /font
20,07за /reference
контекст 8kvision
Открыть →
Ssourceful

riverflow-v2-standard-preview

Riverflow V2 Standard Preview — это стандартный вариант линейки предварительных версий Riverflow V2 от Sourceful. Эта предварительная версия превосходит по производительности семейство Riverflow 1 и является первым унифицированным…

3,52за /image
контекст 8kvision
Открыть →
Логотип StepFunstepfun

step-3.5-flash

Шаг 3.5 Flash — самая мощная открытая базовая модель StepFun. Построенная на разреженной архитектуре Mixture of Experts (MoE), она выборочно активирует только 11 миллиардов из своих 196 миллиардов параметров на каждый токен. Это модель…

prompt / 1M
9,03
completion / 1M
30,10
контекст 262ktools · json
Открыть →
Логотип StepFunstepfun

step-3.7-flash

Step 3.7 Flash is StepFun's latest high-efficiency multimodal Mixture-of-Experts model. It pairs a 196B-parameter language backbone with a vision encoder for native image and video understanding, activating roughly 11B parameters per…

prompt / 1M
20,06
completion / 1M
115
контекст 256kvision · video · tools · json
Открыть →
Sswitchpoint

router

Switchpoint AI's router instantly analyzes your request and directs it to the optimal AI from an ever-evolving library.

prompt / 1M
85,27
completion / 1M
341
контекст 131k
Открыть →
Логотип Tencent Hunyuantencent

hunyuan-a13b-instruct

Hunyuan-A13B — это языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует…

prompt / 1M
14,04
completion / 1M
57,18
контекст 131kjson
Открыть →
Логотип Tencent Hunyuantencent

hy3-preview

Hy3 preview — это высокоэффективная модель Mixture-of-Experts от Tencent, разработанная для агентских рабочих процессов и использования в производстве. Она поддерживает настраиваемые уровни рассуждений в режимах «отключено», «низкий» и…

prompt / 1M
6,32
completion / 1M
21,07
контекст 262ktools
Открыть →
Tthedrummer

cydonia-24b-v4.1

Нецензурированная и креативная модель для письма, основанная на Mistral Small 3.2 24B, с хорошей памятью, соблюдением инструкций и интеллектом.

prompt / 1M
30,10
completion / 1M
50,16
контекст 131k
Открыть →
Tthedrummer

rocinante-12b

Rocinante 12B разработан для увлекательного повествования и богатой прозы.

prompt / 1M
17,05
completion / 1M
43,14
контекст 33ktools · json
Открыть →
Tthedrummer

skyfall-36b-v2

Skyfall 36B v2 — это улучшенная итерация Mistral Small 2501, специально доработанная для повышения креативности, тонкости письма, ролевых игр и связного повествования.

prompt / 1M
55,18
completion / 1M
80,25
контекст 33k
Открыть →
Tthedrummer

unslopnemo-12b

UnslopNemo v4.1 — это новейшая разработка от создателя Rocinante, предназначенная для приключенческих и ролевых сценариев.

prompt / 1M
40,13
completion / 1M
40,13
контекст 33ktools · json
Открыть →
Tthenlper

gte-base

Модель gte-base embedding кодирует английские предложения и абзацы в 768-мерное плотное векторное пространство, обеспечивая эффективные и действенные семантические эмбеддинги, оптимизированные для задач определения текстового сходства,…

prompt / 1M
0,500
completion / 1M
0
контекст 8kjson
Открыть →
Tthenlper

gte-large

Модель gte-large embedding преобразует английские предложения, абзацы и документы средней длины в 1024-мерное плотное векторное пространство, обеспечивая высококачественные семантические эмбеддинги, оптимизированные для задач…

prompt / 1M
1,00
completion / 1M
0
контекст 8kjson
Открыть →
Uupstage

solar-pro-3

Solar Pro 3 — это мощная языковая модель MoE (Mixture-of-Experts) от Upstage. Обладая 102 миллиардами общих параметров и 12 миллиардами активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении…

prompt / 1M
15,05
completion / 1M
60,19
контекст 128ktools · json
Открыть →
● бесплатно
Ccognitivecomputations

dolphin-mistral-24b-venice-edition:free

Venice Uncensored Dolphin Mistral 24B Venice Edition — это тонко настроенный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель разработана как «нецензурированный» LLM, настроенный на…

prompt / 1M
0
completion / 1M
0
контекст 33kjson
Открыть →
Логотип Microsoftmicrosoft

wizardlm-2-8x22b

WizardLM-2 8x22B — это самая передовая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и стабильно превосходит все существующие современные…

prompt / 1M
62,20
completion / 1M
62,20
контекст 66kjson
Открыть →
Wwriter

palmyra-x5

Palmyra X5 — это самая передовая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов в масштабах предприятия. Она обеспечивает лучшую в отрасли скорость и эффективность при работе с контекстными окнами до 1…

prompt / 1M
60,19
completion / 1M
602
контекст 1M
Открыть →
x-ai

grok-4.20

Grok 4.20 is a reasoning model from xAI with industry-leading speed and agentic tool calling capabilities. It combines the lowest hallucination rate on the market with strict prompt adherance, delivering consistently precise and truthful…

prompt / 1M
125
completion / 1M
251
контекст 2Mvision · files · tools · json
Открыть →
x-ai

grok-4.20-multi-agent

Grok 4.20 Multi-Agent — это вариант Grok 4.20 от xAI, разработанный для совместных рабочих процессов на основе агентов. Несколько агентов работают параллельно, чтобы проводить глубокие исследования, координировать использование…

prompt / 1M
201
completion / 1M
602
контекст 2Mvision · files · json
Открыть →
x-ai

grok-4.3

Grok 4.3 — это модель рассуждений от xAI. Она принимает текстовые и графические входные данные с текстовым выводом и подходит для агентских рабочих процессов, задач по следованию инструкциям и приложений, требующих высокой фактической…

prompt / 1M
125
completion / 1M
251
контекст 1Mvision · tools · json
Открыть →
x-ai

grok-build-0.1

Grok Build 0.1 — это быстрая модель кодирования от xAI, разработанная специально для агентских рабочих процессов разработки программного обеспечения. Она поддерживает текстовые и графические входные данные с текстовым выводом и…

prompt / 1M
100
completion / 1M
201
контекст 256kvision · tools · json
Открыть →
x-ai

grok-imagine-image-quality

Grok Imagine Image Quality — это быстрая, высококачественная модель для генерации и редактирования изображений от xAI. Она принимает текстовые запросы и опциональные референсные изображения, создавая фотореалистичные результаты в…

5,02за /image
1,01за /image
контекст 66kvision
Открыть →
xiaomi

mimo-v2-flash

MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a…

prompt / 1M
10,03
completion / 1M
30,10
контекст 262ktools · json
Открыть →
xiaomi

mimo-v2.5

MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность агентского уровня Pro примерно при вдвое меньшей стоимости вывода, превосходя MiMo-V2-Omni в мультимодальном восприятии в задачах понимания…

prompt / 1M
14,04
completion / 1M
28,09
контекст 1Maudio · vision · video · tools
Открыть →
xiaomi

mimo-v2.5-pro

MiMo-V2.5-Pro — это флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентских возможностях, сложном программном инжиниринге и долгосрочных задачах, занимая лидирующие позиции в таких бенчмарках, как ClawEval,…

prompt / 1M
43,64
completion / 1M
87,28
контекст 1Mtools · json
Открыть →
z-ai

glm-4-32b

GLM 4 32B — это экономичная базовая языковая модель.

prompt / 1M
10,03
completion / 1M
10,03
контекст 128ktools
Открыть →
z-ai

glm-4.5

GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications. It leverages a Mixture-of-Experts (MoE) architecture and supports a context length of up to 128k tokens. GLM-4.5 delivers significantly enhanced…

prompt / 1M
60,19
completion / 1M
221
контекст 131ktools · json
Открыть →
z-ai

glm-4.5-air

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter size.…

prompt / 1M
12,54
completion / 1M
85,27
контекст 131ktools · json
Открыть →
● бесплатно
z-ai

glm-4.5-air:free

GLM-4.5-Air — это облегченный вариант нашего новейшего семейства флагманских моделей, также специально разработанный для агент-ориентированных приложений. Как и GLM-4.5, он использует архитектуру Mixture-of-Experts (MoE), но с более…

prompt / 1M
0
completion / 1M
0
контекст 131ktools
Открыть →
z-ai

glm-4.5v

GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video…

prompt / 1M
60,19
completion / 1M
181
контекст 66kvision · tools · json
Открыть →
z-ai

glm-4.6

По сравнению с GLM-4.5, это поколение имеет несколько ключевых улучшений:

prompt / 1M
43,14
completion / 1M
175
контекст 203ktools · json
Открыть →
z-ai

glm-4.6v

GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128K токенов, обрабатывает…

prompt / 1M
30,10
completion / 1M
90,29
контекст 131kvision · video · tools · json
Открыть →
z-ai

glm-4.7

GLM-4.7 — это новейшая флагманская модель Z.ai, отличающаяся усовершенствованиями в двух ключевых областях: расширенные возможности программирования и более стабильное многошаговое рассуждение/выполнение. Она демонстрирует значительные…

prompt / 1M
40,13
completion / 1M
176
контекст 203ktools · json
Открыть →
z-ai

glm-4.7-flash

Будучи современной моделью класса 30B, GLM-4.7-Flash предлагает новую опцию, которая уравновешивает производительность и эффективность. Она дополнительно оптимизирована для использования в агентском кодировании, усиливая возможности…

prompt / 1M
6,02
completion / 1M
40,13
контекст 203ktools · json
Открыть →
z-ai

glm-5

GLM-5 — это флагманская открытая базовая модель Z.ai, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданная для опытных разработчиков, она обеспечивает производительность производственного…

prompt / 1M
60,19
completion / 1M
209
контекст 203ktools · json
Открыть →
z-ai

glm-5-turbo

GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в агент-ориентированных средах, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов,…

prompt / 1M
120
completion / 1M
401
контекст 203ktools · json
Открыть →
z-ai

glm-5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в решении долгосрочных задач. В отличие от предыдущих моделей, построенных на взаимодействиях минутного уровня, GLM-5.1 может работать…

prompt / 1M
98,31
completion / 1M
309
контекст 203ktools · json
Открыть →
z-ai

glm-5v-turbo

GLM-5V-Turbo — это первая нативная мультимодальная базовая модель агента от Z.ai, созданная для визуального кодирования и задач, управляемых агентами. Она нативно обрабатывает изображения, видео и текстовые входные данные, превосходно…

prompt / 1M
120
completion / 1M
401
контекст 203kvision · video · tools · json
Открыть →