OpenAI: GPT-5.1 Chat
"model":"openai/gpt-5.1-chat"
GPT-5.1 Chat (также известная как Instant) — быстрый и лёгкий представитель семейства 5.1, оптимизированный для чата с низкой задержкой при сохранении высокого общего интеллекта. Она использует адаптивные рассуждения, чтобы избирательно «думать» над более сложными запросами, повышая точность в математике, программировании и многошаговых задачах, не замедляя при этом обычные диалоги. По умолчанию модель более тёплая и разговорчивая, с улучшенным следованием инструкциям и более стабильными краткими рассуждениями. GPT-5.1 Chat разработана для высоконагруженных интерактивных сценариев, где отзывчивость и стабильность важнее глубокого обдумывания.
Поддерживаемые параметры
Максимальное число токенов в ответе модели — вариант названия, принятый в новых версиях API OpenAI (включая токены рассуждений у reasoning-моделей). Ограничивает только длину генерации, а не весь контекст. Слишком маленькое значение приводит к обрыву ответа, слишком большое — к лишним расходам. Функционально аналогичен max_tokens.
Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.
Задаёт требуемый формат вывода модели. В режиме JSON-объекта модель обязана вернуть синтаксически корректный JSON, что удобно для программной обработки. Можно также потребовать соответствие конкретной JSON-схеме. Использование этого параметра снижает необходимость «вычищать» свободный текст и парсить его эвристиками.
Фиксирует источник случайности генерации, чтобы при одинаковых запросе и параметрах получать максимально воспроизводимый результат. Полезно для отладки, тестов и сравнения настроек, когда нужна повторяемость. Полная детерминированность не гарантируется и зависит от инфраструктуры провайдера. Изменение seed при прочих равных даёт другой, но столь же стабильный вариант ответа.
Гарантирует, что ответ модели строго соответствует заданной JSON-схеме. В отличие от обычной просьбы «верни JSON», провайдер на уровне декодирования не позволяет нарушить структуру и типы полей. Это критично для надёжных интеграций, где ответ сразу передаётся в код без дополнительной валидации. Поддерживается не всеми моделями и обычно используется вместе с описанием схемы.
Управляет тем, будет ли модель вызывать инструменты и какой именно. Режим auto оставляет решение модели, none запрещает вызовы, required заставляет вызвать хотя бы один инструмент. Можно жёстко указать конкретную функцию, которую нужно вызвать. Полезно, когда логика приложения требует предсказуемого поведения вместо свободного выбора модели.
Описание набора функций (инструментов), которые модель может вызвать в ходе ответа. Для каждого инструмента передаётся имя, назначение и JSON-схема параметров. Модель сама решает, когда уместно вызвать инструмент, и возвращает имя функции с аргументами, а выполнение остаётся на стороне приложения. Это основа агентных сценариев и интеграций с внешними сервисами и данными.
Быстрый старт
curl https://api.aiadapter.ru/api/v1/chat/completions \
-H "Authorization: Bearer sk-aa-v1-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-5.1-chat","messages":[{"role":"user","content":"Привет!"}]}'