Как выбрать нейросеть под задачу: практические критерии
18 июня 2026 г. · Команда Hubris · 7 мин чтения
Универсальной «лучшей» нейросети не существует — модель выбирают под конкретную задачу. Оцените пять параметров: контекстное окно, цену входных и выходных токенов, поддерживаемые модальности, баланс скорости и качества, необходимость режима рассуждений. Отберите по этим критериям двух-трёх кандидатов в каталоге и проверьте каждого в песочнице на собственных примерах — вся процедура занимает меньше часа.
Пять критериев, по которым выбирают модель
Контекстное окно
Контекстное окно — это объём текста, который модель «держит в голове» в рамках одного запроса: ваш вопрос, приложенные документы и её собственный ответ. Измеряется в токенах; один токен — примерно 3–4 символа русского текста. Для коротких диалогов достаточно 32 тысяч токенов, а для анализа договоров или работы с большой кодовой базой смотрите на модели от 200 тысяч. В каталоге есть модели с окном в 1 млн токенов и больше — например, Claude Sonnet 4.6 или Gemini 2.5 Flash.
Важный нюанс: большое окно — не повод заполнять его целиком. Чем больше токенов на входе, тем дороже каждый запрос и тем выше задержка ответа.
Цена входных и выходных токенов
У каждой модели две цены: за входные токены (запрос и контекст) и за выходные (ответ). Выходные обычно в 4–8 раз дороже. Поэтому считайте бюджет под профиль задачи: выжимка из документов — это много входа и мало выхода, генерация текстов — наоборот.
Разброс цен в каталоге — на порядки (цены актуальны на июнь 2026): DeepSeek V3.1 стоит 22,28 ₽ за миллион входных токенов, GPT-5 Mini — 26,53 ₽, а Claude Sonnet 4.6 — 318,32 ₽. Все цены указаны сразу в рублях за миллион токенов: умножьте на ожидаемый месячный объём — получите бюджет.
Модальности
Модальность — это типы данных, которые модель принимает на вход и отдаёт на выходе. Если работаете только с текстом, подойдёт почти любая модель. Нужно распознавать сканы, скриншоты или фотографии — ищите входную модальность «изображения». Gemini 2.5 Flash, например, принимает текст, изображения, аудио и видео. А для генерации картинок нужны модели с выходной модальностью «изображение» — они собраны в отдельной коллекции каталога.
Скорость против качества
Флагманские модели умнее, но медленнее и дороже; младшие версии (Mini, Flash, Haiku) отвечают быстрее и стоят в разы меньше. Практическое правило: там, где ответа ждёт живой человек — в чат-ботах, подсказках, автодополнении, — важна скорость, берите лёгкую модель. Для фоновых задач без человека в ожидании (аналитика, отчёты, обработка очередей) допустима модель потяжелее.
Режим рассуждений
Рассуждающие модели перед ответом «думают»: строят внутреннюю цепочку шагов и только потом отвечают. Это заметно повышает качество на математике, сложном коде и многошаговом планировании, но увеличивает время ответа и расход: размышления тарифицируются как выходные токены. Для классификации, перевода и простых диалогов режим рассуждений не нужен — не платите за то, чем не пользуетесь.
Таблица: задача → что смотреть в каталоге
| Задача | На что смотреть | Раздел каталога |
|---|---|---|
| Чат-бот поддержки | скорость, цена выходных токенов | задача «Чат-боты» |
| Работа с кодом | режим рассуждений, окно от 128 тыс. | задача «Программирование» |
| Перевод и локализация | цена входных токенов, мультиязычность | задача «Перевод» |
| Анализ длинных документов | окно от 200 тыс., цена входных токенов | фильтр по контексту |
| Распознавание изображений | входная модальность «изображения» | коллекция «Изображения» |
| Поиск по базе знаний | модели эмбеддингов | коллекция «Эмбеддинги» |
Этого достаточно, чтобы сузить каталог из более чем 350 моделей до короткого списка из двух-трёх кандидатов.
Как устроен каталог: коллекции, задачи, провайдеры
В каталоге моделей на июнь 2026 года — 361 модель, и навигация построена вокруг трёх осей.
Коллекции группируют модели по типу данных: текст, изображения, аудио, эмбеддинги. Это самый быстрый фильтр, когда задача завязана на модальность.
Задачи — подборки под типовые сценарии: чат-боты, программирование, перевод. Внутри каждой — модели, которые хорошо показывают себя именно в этом сценарии.
Провайдеры — срез по разработчикам: Anthropic, OpenAI, Google, DeepSeek, Meta и другие. Удобно, когда семейство моделей уже выбрано и осталось определиться с версией — например, между быстрой Haiku и более сильной Sonnet.
На странице каждой модели — полная карточка: контекстное окно, цены в рублях, модальности, поддерживаемые параметры и описание на русском языке.
Как протестировать кандидатов
Сравнение по характеристикам сужает выбор, но финальное решение принимают по результатам на собственных данных.
Самый быстрый способ — песочница на странице модели: откройте карточку в каталоге и отправьте свой реальный рабочий запрос прямо из браузера. Модели с пометкой :free можно попробовать даже без регистрации — на июнь 2026 в каталоге 24 бесплатные модели.
Для системного сравнения подключитесь по API. Интерфейс совместим с OpenAI, поэтому смена модели — это одна строка в коде:
from openai import OpenAI
client = OpenAI(
base_url="https://api.hubris.pw/v1",
api_key="sk-gw-...", # ключ из раздела «Ключи»
)
candidates = ["anthropic/claude-haiku-4.5", "deepseek/deepseek-chat-v3.1"]
for model in candidates:
response = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": "Выдели три главных риска из договора: <текст>"}],
)
print(model, response.choices[0].message.content)
Доступ занимает пару минут: зарегистрируйтесь на странице входа по коду из письма, создайте ключ в разделе «Ключи», пополните баланс в разделе «Биллинг» — через СБП, картой или по счёту для юридических лиц.
Прогоните 10–20 реальных примеров через каждую модель-кандидата и сравните не только качество ответов, но и фактический расход — он виден в личном кабинете по каждому запросу.
Частые вопросы
Можно ли выбрать одну модель «на всё»?
Можно, но это почти всегда либо переплата, либо потеря качества. Практичнее держать две: лёгкую — для массовых простых запросов, сильную — для сложных. Поскольку API единый, переключение между ними — это одно поле model в запросе, без новой интеграции.
Сколько стоит протестировать несколько моделей?
Немного. Тест из 20 запросов по 2 тысячи входных и 500 выходных токенов на GPT-5 Mini обойдётся примерно в 3 ₽ по ценам на июнь 2026. Даже на флагманских моделях такой прогон стоит десятки рублей — это несопоставимо дешевле, чем месяц работы на неудачно выбранной модели.
Что делать, если модель устарела или подорожала?
Перевыбрать по тем же пяти критериям и поменять значение model — остальной код не меняется. Каталог обновляется автоматически, поэтому новые версии моделей появляются в нём вскоре после выхода, со свежими ценами и характеристиками.
Нужна ли зарубежная карта для оплаты?
Нет. Оплата в рублях: СБП, банковская карта или счёт для юридических лиц с закрывающими документами. Подробный разбор подключения на примере Claude — в статье о доступе к Claude API из России.
Все модели из статьи доступны в Hubris — единый API, оплата в рублях.