Perplexity: Sonar Pro
"model":"perplexity/sonar-pro"
Примечание: цена Sonar Pro включает стоимость поиска Perplexity. См. подробности здесь
Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать глубокие многоэтапные запросы с дополнительной расширяемостью, например, в среднем вдвое большим числом цитат на поиск, чем Sonar. Кроме того, благодаря большему контекстному окну он может обрабатывать более длинные и нюансированные поиски и последующие вопросы.
Поддерживаемые параметры
Снижает вероятность токенов пропорционально тому, как часто они уже встречались в тексте. Чем выше штраф, тем сильнее модель избегает дословных повторов слов и фраз. Положительные значения делают текст разнообразнее по лексике, отрицательные, наоборот, поощряют повторения. Полезен против «зацикливания» на одних и тех же выражениях в длинных ответах.
Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.
Снижает вероятность токенов уже за сам факт того, что они появились в тексте, независимо от числа повторений. Это подталкивает модель вводить новые темы и слова, а не топтаться на уже упомянутом. Положительные значения повышают разнообразие и «широту» ответа, отрицательные удерживают модель в рамках затронутого. В отличие от штрафа за частоту, здесь важно само присутствие токена, а не его счётчик.
Управляет случайностью выбора следующего токена. Значение около 0 делает ответы почти детерминированными и предсказуемыми — модель каждый раз выбирает наиболее вероятное продолжение. Более высокие значения (0.7–1.0 и выше) повышают разнообразие и «креативность», но и риск ошибок и бессвязности. Для фактических задач и кода обычно берут низкую температуру, для генерации идей и текстов — выше.
Оставляет на каждом шаге только K наиболее вероятных токенов-кандидатов, а остальные отбрасывает. Малые значения (например, 10–40) делают текст более сфокусированным и предсказуемым, большие — более разнообразным. В отличие от top-p, отбор идёт по фиксированному количеству вариантов, а не по их суммарной вероятности. Значение 0 обычно означает, что ограничение отключено.
Ограничивает выбор токенов наименьшим набором, суммарная вероятность которого не превышает значения p (nucleus sampling). Например, при 0.9 модель рассматривает только самые вероятные варианты, на которые приходится 90% вероятностной массы, отсекая «хвост» маловероятных. Это альтернативный температуре способ управлять разнообразием ответа. Обычно меняют либо температуру, либо top-p, а не оба параметра одновременно.
Настраивает встроенный веб-поиск для моделей, которые умеют дополнять ответ свежими данными из интернета. Здесь можно задать, например, объём поисковой выдачи или контекст местоположения. Веб-поиск помогает отвечать на вопросы о текущих событиях и фактах вне обучающих данных модели. Использование поиска тарифицируется отдельно от токенов (см. блок цены).
Быстрый старт
curl https://api.aiadapter.ru/api/v1/chat/completions \
-H "Authorization: Bearer sk-aa-v1-..." \
-H "Content-Type: application/json" \
-d '{"model":"perplexity/sonar-pro","messages":[{"role":"user","content":"Привет!"}]}'