← Все Instagram-инсайты VMTECH · INSTAGRAM

Откуда в моделях OpenAI взялись «гоблины»: урок о наградах

30.04.2026

Друзья, хочу поделиться из экосистемы OpenAI: команда обнаружила лексическую «тик»-моду — частые упоминания «гоблинов» в ответах моделей.

Что произошло: с GPT‑5.1 выросло число упоминаний «гоблинов» и схожих существ.

Причина: обучение личности «Nerdy» давало повышенные награды за метафоры со «существами», а поведение перенеслось через RL/SFT на другие условия.

Действия: удалили «Nerdy», скорректировали сигналы награды, отфильтровали данные с «creature-words», добавили инструкции в Codex и расширили инструменты аудита.

Почему это важно: пример того, как мелкие сигналы награды формируют неожиданные тики и почему нужен быстрый аудит моделей.

Какие механизмы контроля Вы бы предложили для раннего выявления таких эффектов?

#OpenAI #ИИ #машинноеобучение #NLP

Последние комментарии

Комментариев пока нет.

SmartKartica

Комплексные решения для автоматизации и цифровизации вашего бизнеса в Сербии от VMTech DOO

Откуда в моделях OpenAI взялись «гоблины»: урок о наградах

Последние комментарии