ИИ-адаптер

Perplexity: Sonar Pro

"model":"perplexity/sonar-pro"
Контекст
200K токенов
Вход
Текст, Изображения
Выход
Текст

Примечание: цена Sonar Pro включает стоимость поиска Perplexity. См. подробности здесь

Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать глубокие многоэтапные запросы с дополнительной расширяемостью, например, в среднем вдвое большим числом цитат на поиск, чем Sonar. Кроме того, благодаря большему контекстному окну он может обрабатывать более длинные и нюансированные поиски и последующие вопросы.

ЦенаЗа 1M токенов
Вход379,05 ₽
Выход1 895,25 ₽
Веб-поискЗа 1000 поисков631,75 ₽

Поддерживаемые параметры

frequency_penaltyШтраф за частоту

Снижает вероятность токенов пропорционально тому, как часто они уже встречались в тексте. Чем выше штраф, тем сильнее модель избегает дословных повторов слов и фраз. Положительные значения делают текст разнообразнее по лексике, отрицательные, наоборот, поощряют повторения. Полезен против «зацикливания» на одних и тех же выражениях в длинных ответах.

max_tokensЛимит ответа

Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.

presence_penaltyШтраф за присутствие

Снижает вероятность токенов уже за сам факт того, что они появились в тексте, независимо от числа повторений. Это подталкивает модель вводить новые темы и слова, а не топтаться на уже упомянутом. Положительные значения повышают разнообразие и «широту» ответа, отрицательные удерживают модель в рамках затронутого. В отличие от штрафа за частоту, здесь важно само присутствие токена, а не его счётчик.

temperatureТемпература

Управляет случайностью выбора следующего токена. Значение около 0 делает ответы почти детерминированными и предсказуемыми — модель каждый раз выбирает наиболее вероятное продолжение. Более высокие значения (0.7–1.0 и выше) повышают разнообразие и «креативность», но и риск ошибок и бессвязности. Для фактических задач и кода обычно берут низкую температуру, для генерации идей и текстов — выше.

top_kTop-k

Оставляет на каждом шаге только K наиболее вероятных токенов-кандидатов, а остальные отбрасывает. Малые значения (например, 10–40) делают текст более сфокусированным и предсказуемым, большие — более разнообразным. В отличие от top-p, отбор идёт по фиксированному количеству вариантов, а не по их суммарной вероятности. Значение 0 обычно означает, что ограничение отключено.

top_pTop-p (выборка ядра)

Ограничивает выбор токенов наименьшим набором, суммарная вероятность которого не превышает значения p (nucleus sampling). Например, при 0.9 модель рассматривает только самые вероятные варианты, на которые приходится 90% вероятностной массы, отсекая «хвост» маловероятных. Это альтернативный температуре способ управлять разнообразием ответа. Обычно меняют либо температуру, либо top-p, а не оба параметра одновременно.

web_search_optionsПараметры веб-поиска

Настраивает встроенный веб-поиск для моделей, которые умеют дополнять ответ свежими данными из интернета. Здесь можно задать, например, объём поисковой выдачи или контекст местоположения. Веб-поиск помогает отвечать на вопросы о текущих событиях и фактах вне обучающих данных модели. Использование поиска тарифицируется отдельно от токенов (см. блок цены).

Быстрый старт

curl https://api.aiadapter.ru/api/v1/chat/completions \
  -H "Authorization: Bearer sk-aa-v1-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"perplexity/sonar-pro","messages":[{"role":"user","content":"Привет!"}]}'