Когда открывать эту страницу
Когда вы хотите выполнить одну понятную задачу в теме «Понимание изображений» и сразу проверить результат.
Используйте Понимание изображений, когда пользователи присылают скриншоты, фото или другие картинки, и агент должен смотреть на реальное содержимое, а не угадывать только по тексту.
Когда вы хотите выполнить одну понятную задачу в теме «Понимание изображений» и сразу проверить результат.
Владелец, Редактор
Завершенное действие и понятная проверка, что оно действительно сработало.
Именно вы задаете, когда агент должен анализировать изображение, а когда нет.
Самый надежный сценарий — изображение приходит вложением в том же пользовательском сообщении, где его просят проверить или ожидают получить.
Запросы с изображениями тоже расходуют токены, поэтому rollout стоит сопровождать быстрой проверкой стоимости.
Полезно, когда пользователь показывает сломанную страницу, состояние приложения, экран оплаты или видимую ошибку вместо точного текстового описания.
Полезно, когда support-flow зависит от того, что реально видно на картинке: упаковка, маркировка или сфотографированный документ.
Особенно полезно, когда бот сначала просит скриншот или фото, а следующее сообщение пользователя может содержать только изображение без текста.
| Policy | Когда использовать | Что происходит |
|---|---|---|
| off | Содержимое изображения не должно влиять на ответ. | Агент не анализирует картинку и отвечает только по тексту, KB и другим включенным инструментам. |
| prompt_rules | Изображение важно только в отдельных случаях. | Решение принимает промпт, поэтому стоимость и случайные визуальные чтения проще держать под контролем. |
| always | Каждое прикрепленное изображение в этом сценарии нужно анализировать. | Агент по умолчанию считает картинки из текущего сообщения частью запроса. Это имеет смысл только в сценариях, где изображения нужны почти всегда. |
Самый надежный input — это само прикрепленное изображение и короткий текстовый вопрос вроде «какая ошибка на этом экране?» или «правильная ли это этикетка?».
Просто вставленная ссылка или имя файла в тексте — не то же самое, что реальное вложение. Перед rollout проверяйте именно тот канал, которым будут пользоваться ваши клиенты, а не полагайтесь на общие предположения.
Замечание по стоимости
Понимание изображений добавляет стоимость поверх обычной текстовой генерации. Перед масштабированием на большой поток поддержки проверьте Стоимость токенов и живой usage.