ИИ-адаптер
P

Perceptron: Perceptron Mk1

"model":"perceptron/perceptron-mk1"
Контекст
33K токенов
Вход
Текст, Изображения, Видео
Выход
Текст

Perceptron Mk1 (Mark One) — это самая качественная визуально-языковая модель Perceptron для видео и воплощённых рассуждений. Она принимает изображения и видео в сочетании с запросами на естественном языке и формирует детальные ответы на основе визуального понимания, либо структурированные, либо на естественном языке. Она превосходно справляется с задачами понимания видео, такими как ответы на вопросы по видео, суммирование и обнаружение событий. На изображениях она продвигает привязку по примеру точек из мультимодальных промптов, OCR и разбор документов на сложных реальных входных данных, обнаружение и подсчёт объектов с открытым словарём, а также оценку позы рук.

Рассуждения можно включить для отдельного запроса, чтобы обменять задержку на более глубокий анализ сложных задач. Структурированные аннотации выдаются встроенно в текст только при явном запросе через параметр annotation_format (передайте "point", "box" или "polygon" для пространственной локализации на изображениях или "clip" (временные метки начала/конца) для временных сегментов в видео). Без annotation_format модель возвращает только текст на естественном языке.

ЦенаЗа 1M токенов
Вход18,95 ₽
Выход189,53 ₽

Поддерживаемые параметры

frequency_penaltyШтраф за частоту

Снижает вероятность токенов пропорционально тому, как часто они уже встречались в тексте. Чем выше штраф, тем сильнее модель избегает дословных повторов слов и фраз. Положительные значения делают текст разнообразнее по лексике, отрицательные, наоборот, поощряют повторения. Полезен против «зацикливания» на одних и тех же выражениях в длинных ответах.

include_reasoningВозврат рассуждений

Указывает, возвращать ли вместе с ответом цепочку рассуждений модели. При включении в ответе появляется поле с ходом размышлений, что полезно для отладки, аудита и объяснимости. При отключении пользователь видит только финальный результат, а рассуждения остаются скрытыми. Доступно для моделей, поддерживающих режим рассуждений.

max_tokensЛимит ответа

Ограничивает максимальное число токенов, которое модель сгенерирует в ответе. Это потолок длины именно ответа, не считая токенов запроса; сумма запроса и ответа не может превышать размер контекстного окна. Если лимит мал, ответ может оборваться на середине. Параметр также влияет на стоимость, так как выходные токены тарифицируются отдельно.

presence_penaltyШтраф за присутствие

Снижает вероятность токенов уже за сам факт того, что они появились в тексте, независимо от числа повторений. Это подталкивает модель вводить новые темы и слова, а не топтаться на уже упомянутом. Положительные значения повышают разнообразие и «широту» ответа, отрицательные удерживают модель в рамках затронутого. В отличие от штрафа за частоту, здесь важно само присутствие токена, а не его счётчик.

reasoningРассуждения

Включает режим внутренних пошаговых рассуждений модели перед выдачей финального ответа. Позволяет управлять «обдумыванием»: глубиной размышлений или бюджетом токенов на них. Как правило, повышает качество на сложных задачах — логике, математике, многошаговом планировании — ценой большего времени и стоимости. Сами рассуждения могут не показываться пользователю, если не запрошены отдельно.

structured_outputsСтруктурированный вывод

Гарантирует, что ответ модели строго соответствует заданной JSON-схеме. В отличие от обычной просьбы «верни JSON», провайдер на уровне декодирования не позволяет нарушить структуру и типы полей. Это критично для надёжных интеграций, где ответ сразу передаётся в код без дополнительной валидации. Поддерживается не всеми моделями и обычно используется вместе с описанием схемы.

temperatureТемпература

Управляет случайностью выбора следующего токена. Значение около 0 делает ответы почти детерминированными и предсказуемыми — модель каждый раз выбирает наиболее вероятное продолжение. Более высокие значения (0.7–1.0 и выше) повышают разнообразие и «креативность», но и риск ошибок и бессвязности. Для фактических задач и кода обычно берут низкую температуру, для генерации идей и текстов — выше.

top_kTop-k

Оставляет на каждом шаге только K наиболее вероятных токенов-кандидатов, а остальные отбрасывает. Малые значения (например, 10–40) делают текст более сфокусированным и предсказуемым, большие — более разнообразным. В отличие от top-p, отбор идёт по фиксированному количеству вариантов, а не по их суммарной вероятности. Значение 0 обычно означает, что ограничение отключено.

top_pTop-p (выборка ядра)

Ограничивает выбор токенов наименьшим набором, суммарная вероятность которого не превышает значения p (nucleus sampling). Например, при 0.9 модель рассматривает только самые вероятные варианты, на которые приходится 90% вероятностной массы, отсекая «хвост» маловероятных. Это альтернативный температуре способ управлять разнообразием ответа. Обычно меняют либо температуру, либо top-p, а не оба параметра одновременно.

Быстрый старт

curl https://api.aiadapter.ru/api/v1/chat/completions \
  -H "Authorization: Bearer sk-aa-v1-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"perceptron/perceptron-mk1","messages":[{"role":"user","content":"Привет!"}]}'