Как выбрать нейросеть под задачу: практические критерии

Как выбрать нейросеть под задачу: практические критерии

18 июня 2026 г. · Команда Hubris · 7 мин чтения

Универсальной «лучшей» нейросети не существует — модель выбирают под конкретную задачу. Оцените пять параметров: контекстное окно, цену входных и выходных токенов, поддерживаемые модальности, баланс скорости и качества, необходимость режима рассуждений. Отберите по этим критериям двух-трёх кандидатов в каталоге и проверьте каждого в песочнице на собственных примерах — вся процедура занимает меньше часа.

Пять критериев, по которым выбирают модель

Световые весы сравнивают модели по цене, скорости и качеству

Контекстное окно

Контекстное окно — это объём текста, который модель «держит в голове» в рамках одного запроса: ваш вопрос, приложенные документы и её собственный ответ. Измеряется в токенах; один токен — примерно 3–4 символа русского текста. Для коротких диалогов достаточно 32 тысяч токенов, а для анализа договоров или работы с большой кодовой базой смотрите на модели от 200 тысяч. В каталоге есть модели с окном в 1 млн токенов и больше — например, Claude Sonnet 4.6 или Gemini 2.5 Flash.

Важный нюанс: большое окно — не повод заполнять его целиком. Чем больше токенов на входе, тем дороже каждый запрос и тем выше задержка ответа.

Цена входных и выходных токенов

У каждой модели две цены: за входные токены (запрос и контекст) и за выходные (ответ). Выходные обычно в 4–8 раз дороже. Поэтому считайте бюджет под профиль задачи: выжимка из документов — это много входа и мало выхода, генерация текстов — наоборот.

Разброс цен в каталоге — на порядки (цены актуальны на июнь 2026): DeepSeek V3.1 стоит 22,28 ₽ за миллион входных токенов, GPT-5 Mini — 26,53 ₽, а Claude Sonnet 4.6 — 318,32 ₽. Все цены указаны сразу в рублях за миллион токенов: умножьте на ожидаемый месячный объём — получите бюджет.

Модальности

Модальность — это типы данных, которые модель принимает на вход и отдаёт на выходе. Если работаете только с текстом, подойдёт почти любая модель. Нужно распознавать сканы, скриншоты или фотографии — ищите входную модальность «изображения». Gemini 2.5 Flash, например, принимает текст, изображения, аудио и видео. А для генерации картинок нужны модели с выходной модальностью «изображение» — они собраны в отдельной коллекции каталога.

Скорость против качества

Флагманские модели умнее, но медленнее и дороже; младшие версии (Mini, Flash, Haiku) отвечают быстрее и стоят в разы меньше. Практическое правило: там, где ответа ждёт живой человек — в чат-ботах, подсказках, автодополнении, — важна скорость, берите лёгкую модель. Для фоновых задач без человека в ожидании (аналитика, отчёты, обработка очередей) допустима модель потяжелее.

Режим рассуждений

Рассуждающие модели перед ответом «думают»: строят внутреннюю цепочку шагов и только потом отвечают. Это заметно повышает качество на математике, сложном коде и многошаговом планировании, но увеличивает время ответа и расход: размышления тарифицируются как выходные токены. Для классификации, перевода и простых диалогов режим рассуждений не нужен — не платите за то, чем не пользуетесь.

Таблица: задача → что смотреть в каталоге

ЗадачаНа что смотретьРаздел каталога
Чат-бот поддержкискорость, цена выходных токеновзадача «Чат-боты»
Работа с кодомрежим рассуждений, окно от 128 тыс.задача «Программирование»
Перевод и локализацияцена входных токенов, мультиязычностьзадача «Перевод»
Анализ длинных документовокно от 200 тыс., цена входных токеновфильтр по контексту
Распознавание изображенийвходная модальность «изображения»коллекция «Изображения»
Поиск по базе знаниймодели эмбеддинговколлекция «Эмбеддинги»

Этого достаточно, чтобы сузить каталог из более чем 350 моделей до короткого списка из двух-трёх кандидатов.

Как устроен каталог: коллекции, задачи, провайдеры

Карта каталога: коллекции, задачи и провайдеры как связанные острова

В каталоге моделей на июнь 2026 года — 361 модель, и навигация построена вокруг трёх осей.

Коллекции группируют модели по типу данных: текст, изображения, аудио, эмбеддинги. Это самый быстрый фильтр, когда задача завязана на модальность.

Задачи — подборки под типовые сценарии: чат-боты, программирование, перевод. Внутри каждой — модели, которые хорошо показывают себя именно в этом сценарии.

Провайдеры — срез по разработчикам: Anthropic, OpenAI, Google, DeepSeek, Meta и другие. Удобно, когда семейство моделей уже выбрано и осталось определиться с версией — например, между быстрой Haiku и более сильной Sonnet.

На странице каждой модели — полная карточка: контекстное окно, цены в рублях, модальности, поддерживаемые параметры и описание на русском языке.

Как протестировать кандидатов

Сравнение по характеристикам сужает выбор, но финальное решение принимают по результатам на собственных данных.

Самый быстрый способ — песочница на странице модели: откройте карточку в каталоге и отправьте свой реальный рабочий запрос прямо из браузера. Модели с пометкой :free можно попробовать даже без регистрации — на июнь 2026 в каталоге 24 бесплатные модели.

Для системного сравнения подключитесь по API. Интерфейс совместим с OpenAI, поэтому смена модели — это одна строка в коде:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",  # ключ из раздела «Ключи»
)

candidates = ["anthropic/claude-haiku-4.5", "deepseek/deepseek-chat-v3.1"]

for model in candidates:
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": "Выдели три главных риска из договора: <текст>"}],
    )
    print(model, response.choices[0].message.content)

Доступ занимает пару минут: зарегистрируйтесь на странице входа по коду из письма, создайте ключ в разделе «Ключи», пополните баланс в разделе «Биллинг» — через СБП, картой или по счёту для юридических лиц.

Прогоните 10–20 реальных примеров через каждую модель-кандидата и сравните не только качество ответов, но и фактический расход — он виден в личном кабинете по каждому запросу.

Частые вопросы

Можно ли выбрать одну модель «на всё»?

Можно, но это почти всегда либо переплата, либо потеря качества. Практичнее держать две: лёгкую — для массовых простых запросов, сильную — для сложных. Поскольку API единый, переключение между ними — это одно поле model в запросе, без новой интеграции.

Сколько стоит протестировать несколько моделей?

Немного. Тест из 20 запросов по 2 тысячи входных и 500 выходных токенов на GPT-5 Mini обойдётся примерно в 3 ₽ по ценам на июнь 2026. Даже на флагманских моделях такой прогон стоит десятки рублей — это несопоставимо дешевле, чем месяц работы на неудачно выбранной модели.

Что делать, если модель устарела или подорожала?

Перевыбрать по тем же пяти критериям и поменять значение model — остальной код не меняется. Каталог обновляется автоматически, поэтому новые версии моделей появляются в нём вскоре после выхода, со свежими ценами и характеристиками.

Нужна ли зарубежная карта для оплаты?

Нет. Оплата в рублях: СБП, банковская карта или счёт для юридических лиц с закрывающими документами. Подробный разбор подключения на примере Claude — в статье о доступе к Claude API из России.

Все модели из статьи доступны в Hubris — единый API, оплата в рублях.