ИИ-адаптер

Inflection: Inflection 3 Pi

"model":"inflection/inflection-3-pi"
Контекст
8K токенов
Вход
Текст
Выход
Текст

Inflection 3 Pi обеспечивает работу чат-бота Pi от Inflection, включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Модель имеет доступ к свежим новостям и отлично подходит для сценариев вроде поддержки клиентов и ролевых игр.

Pi обучена подстраиваться под ваш тон и стиль: если вы используете больше эмодзи, то же будет делать и Pi! Попробуйте экспериментировать с различными промптами и стилями общения.

ЦенаЗа 1M токенов
Вход315,88 ₽
Выход1 263,5 ₽

Поддерживаемые параметры

max_tokensЛимит ответа

Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.

stopСтоп-последовательности

Список строк, при появлении которых генерация немедленно останавливается. Сами стоп-строки в ответ не включаются, что удобно для обрезания вывода по разделителю или маркеру конца. Часто используется в структурированных промптах и при ролевой разметке диалога. Можно задать несколько последовательностей одновременно.

temperatureТемпература

Управляет случайностью выбора следующего токена. Значение около 0 делает ответы почти детерминированными и предсказуемыми — модель каждый раз выбирает наиболее вероятное продолжение. Более высокие значения (0.7–1.0 и выше) повышают разнообразие и «креативность», но и риск ошибок и бессвязности. Для фактических задач и кода обычно берут низкую температуру, для генерации идей и текстов — выше.

top_pTop-p (выборка ядра)

Ограничивает выбор токенов наименьшим набором, суммарная вероятность которого не превышает значения p (nucleus sampling). Например, при 0.9 модель рассматривает только самые вероятные варианты, на которые приходится 90% вероятностной массы, отсекая «хвост» маловероятных. Это альтернативный температуре способ управлять разнообразием ответа. Обычно меняют либо температуру, либо top-p, а не оба параметра одновременно.

Быстрый старт

curl https://api.aiadapter.ru/api/v1/chat/completions \
  -H "Authorization: Bearer sk-aa-v1-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"inflection/inflection-3-pi","messages":[{"role":"user","content":"Привет!"}]}'