ИИ-адаптер

Perplexity: Sonar Pro Search

"model":"perplexity/sonar-pro-search"
Контекст
200K токенов
Вход
Текст, Изображения
Выход
Текст

Доступный исключительно через API OpenRouter, новый режим Pro Search в Sonar Pro — это самая продвинутая агентная поисковая система Perplexity. Он разработан для более глубоких рассуждений и анализа. Цена основана на токенах плюс $18 за тысячу запросов. Эта модель обеспечивает работу режима Pro Search на платформе Perplexity.

Sonar Pro Search добавляет автономные многоэтапные рассуждения к Sonar Pro. Так что вместо просто одного запроса + синтеза он планирует и выполняет целые исследовательские сценарии с использованием инструментов.

ЦенаЗа 1M токенов
Вход379,05 ₽
Выход1 895,25 ₽
Веб-поискЗа 1000 поисков2 274,3 ₽

Поддерживаемые параметры

frequency_penaltyШтраф за частоту

Снижает вероятность токенов пропорционально тому, как часто они уже встречались в тексте. Чем выше штраф, тем сильнее модель избегает дословных повторов слов и фраз. Положительные значения делают текст разнообразнее по лексике, отрицательные, наоборот, поощряют повторения. Полезен против «зацикливания» на одних и тех же выражениях в длинных ответах.

include_reasoningВозврат рассуждений

Указывает, возвращать ли вместе с ответом цепочку рассуждений модели. При включении в ответе появляется поле с ходом размышлений, что полезно для отладки, аудита и объяснимости. При отключении пользователь видит только финальный результат, а рассуждения остаются скрытыми. Доступно для моделей, поддерживающих режим рассуждений.

max_tokensЛимит ответа

Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.

presence_penaltyШтраф за присутствие

Снижает вероятность токенов уже за сам факт того, что они появились в тексте, независимо от числа повторений. Это подталкивает модель вводить новые темы и слова, а не топтаться на уже упомянутом. Положительные значения повышают разнообразие и «широту» ответа, отрицательные удерживают модель в рамках затронутого. В отличие от штрафа за частоту, здесь важно само присутствие токена, а не его счётчик.

reasoningРассуждения

Включает режим внутренних пошаговых рассуждений модели перед выдачей финального ответа. Позволяет управлять «обдумыванием»: глубиной размышлений или бюджетом токенов на них. Как правило, повышает качество на сложных задачах — логике, математике, многошаговом планировании — ценой большего времени и стоимости. Сами рассуждения могут не показываться пользователю, если не запрошены отдельно.

structured_outputsСтруктурированный вывод

Гарантирует, что ответ модели строго соответствует заданной JSON-схеме. В отличие от обычной просьбы «верни JSON», провайдер на уровне декодирования не позволяет нарушить структуру и типы полей. Это критично для надёжных интеграций, где ответ сразу передаётся в код без дополнительной валидации. Поддерживается не всеми моделями и обычно используется вместе с описанием схемы.

temperatureТемпература

Управляет случайностью выбора следующего токена. Значение около 0 делает ответы почти детерминированными и предсказуемыми — модель каждый раз выбирает наиболее вероятное продолжение. Более высокие значения (0.7–1.0 и выше) повышают разнообразие и «креативность», но и риск ошибок и бессвязности. Для фактических задач и кода обычно берут низкую температуру, для генерации идей и текстов — выше.

top_kTop-k

Оставляет на каждом шаге только K наиболее вероятных токенов-кандидатов, а остальные отбрасывает. Малые значения (например, 10–40) делают текст более сфокусированным и предсказуемым, большие — более разнообразным. В отличие от top-p, отбор идёт по фиксированному количеству вариантов, а не по их суммарной вероятности. Значение 0 обычно означает, что ограничение отключено.

top_pTop-p (выборка ядра)

Ограничивает выбор токенов наименьшим набором, суммарная вероятность которого не превышает значения p (nucleus sampling). Например, при 0.9 модель рассматривает только самые вероятные варианты, на которые приходится 90% вероятностной массы, отсекая «хвост» маловероятных. Это альтернативный температуре способ управлять разнообразием ответа. Обычно меняют либо температуру, либо top-p, а не оба параметра одновременно.

web_search_optionsПараметры веб-поиска

Настраивает встроенный веб-поиск для моделей, которые умеют дополнять ответ свежими данными из интернета. Здесь можно задать, например, объём поисковой выдачи или контекст местоположения. Веб-поиск помогает отвечать на вопросы о текущих событиях и фактах вне обучающих данных модели. Использование поиска тарифицируется отдельно от токенов (см. блок цены).

Быстрый старт

curl https://api.aiadapter.ru/api/v1/chat/completions \
  -H "Authorization: Bearer sk-aa-v1-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"perplexity/sonar-pro-search","messages":[{"role":"user","content":"Привет!"}]}'