ИИ-адаптер

OpenAI: o4 Mini High

"model":"openai/o4-mini-high"
Контекст
200K токенов
Вход
Изображения, Текст, Файлы
Выход
Текст

OpenAI o4-mini-high — это та же модель, что и o4-mini, с параметром reasoning_effort, установленным в high.

OpenAI o4-mini — это компактная модель с рассуждениями из серии o, оптимизированная для быстрой и экономичной работы при сохранении сильных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует конкурентоспособную производительность в рассуждениях и программировании в таких бенчмарках, как AIME (99,5% с Python) и SWE-bench, превосходя свою предшественницу o3-mini и даже приближаясь к o3 в некоторых областях.

Несмотря на меньший размер, o4-mini показывает высокую точность в задачах STEM, решении визуальных задач (например, MathVista, MMMU) и редактировании кода. Она особенно хорошо подходит для сценариев с высокой пропускной способностью, где критичны задержка или стоимость. Благодаря эффективной архитектуре и усовершенствованному обучению с подкреплением o4-mini может объединять инструменты в цепочки, генерировать структурированные выводы и решать многоэтапные задачи с минимальной задержкой — часто менее чем за минуту.

ЦенаЗа 1M токенов
Вход138,99 ₽
Выход555,94 ₽
Веб-поискЗа 1000 поисков1 263,5 ₽
Кэш34,75 ₽

Поддерживаемые параметры

include_reasoningВозврат рассуждений

Указывает, возвращать ли вместе с ответом цепочку рассуждений модели. При включении в ответе появляется поле с ходом размышлений, что полезно для отладки, аудита и объяснимости. При отключении пользователь видит только финальный результат, а рассуждения остаются скрытыми. Доступно для моделей, поддерживающих режим рассуждений.

max_tokensЛимит ответа

Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.

reasoningРассуждения

Включает режим внутренних пошаговых рассуждений модели перед выдачей финального ответа. Позволяет управлять «обдумыванием»: глубиной размышлений или бюджетом токенов на них. Как правило, повышает качество на сложных задачах — логике, математике, многошаговом планировании — ценой большего времени и стоимости. Сами рассуждения могут не показываться пользователю, если не запрошены отдельно.

response_formatФормат ответа

Задаёт требуемый формат вывода модели. В режиме JSON-объекта модель обязана вернуть синтаксически корректный JSON, что удобно для программной обработки. Можно также потребовать соответствие конкретной JSON-схеме. Использование этого параметра снижает необходимость «вычищать» свободный текст и парсить его эвристиками.

seedЗерно (seed)

Фиксирует источник случайности генерации, чтобы при одинаковых запросе и параметрах получать максимально воспроизводимый результат. Полезно для отладки, тестов и сравнения настроек, когда нужна повторяемость. Полная детерминированность не гарантируется и зависит от инфраструктуры провайдера. Изменение seed при прочих равных даёт другой, но столь же стабильный вариант ответа.

structured_outputsСтруктурированный вывод

Гарантирует, что ответ модели строго соответствует заданной JSON-схеме. В отличие от обычной просьбы «верни JSON», провайдер на уровне декодирования не позволяет нарушить структуру и типы полей. Это критично для надёжных интеграций, где ответ сразу передаётся в код без дополнительной валидации. Поддерживается не всеми моделями и обычно используется вместе с описанием схемы.

tool_choiceВыбор инструмента

Управляет тем, будет ли модель вызывать инструменты и какой именно. Режим auto оставляет решение модели, none запрещает вызовы, required заставляет вызвать хотя бы один инструмент. Можно жёстко указать конкретную функцию, которую нужно вызвать. Полезно, когда логика приложения требует предсказуемого поведения вместо свободного выбора модели.

toolsИнструменты

Описание набора функций (инструментов), которые модель может вызвать в ходе ответа. Для каждого инструмента передаётся имя, назначение и JSON-схема параметров. Модель сама решает, когда уместно вызвать инструмент, и возвращает имя функции с аргументами, а выполнение остаётся на стороне приложения. Это основа агентных сценариев и интеграций с внешними сервисами и данными.

Быстрый старт

curl https://api.aiadapter.ru/api/v1/chat/completions \
  -H "Authorization: Bearer sk-aa-v1-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/o4-mini-high","messages":[{"role":"user","content":"Привет!"}]}'