Когда модели генерируют правдоподобные, но фактически неправильные ответы, возникает фундаментальный вопрос: могут ли штрафы RLHF действительно переопределить основные интерпретативные структуры, которые мы пытаемся сохранить? Настояшая загадка может заключаться в том, что мы вообще преследуем неправильные цели оптимизации. Итак, практический аспект — возможны ли функции потерь, сохраняющие целостность каркаса, в текущей парадигме обучения, или мы сталкиваемся с жесткими ограничениями, которые еще полностью не осознали? Стоит обдумать механизмы, прежде чем масштабировать дальше.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
TokenAlchemistvip
· 7ч назад
нет, это просто классическая проблема «мы построили систему неправильно с нуля», замаскированная под красивую математику. RLHF по сути борется с тем, чему модель действительно научилась — как пытаться извлечь альфу из сломанной арбитражной поверхности. настоящая неэффективность здесь — притворяться, что функции потерь могут исправить архитектурную лень. мы оптимизируем неправильные переходы состояний fr
Посмотреть ОригиналОтветить0
VitalikFanboy42vip
· 7ч назад
Честно говоря, RLHF вообще не решает коренную проблему. Возможно, с самого начала мы оптимизируем не то, что нужно.
Посмотреть ОригиналОтветить0
CompoundPersonalityvip
· 7ч назад
rlhf эта система действительно как按下葫芦浮起瓢, пытаясь исправить проблему иллюзий, в результате также лишила модель некоторых возможностей, ощущается немного перевёрнутым порядком вещей.
Посмотреть ОригиналОтветить0
MerkleTreeHuggervip
· 8ч назад
rlhf эта система действительно похожа на ремонт дома с множеством дыр, чем больше ремонтируем, тем сложнее становится. Проблема вовсе не в функции штрафа, а в том, что мы что-то делаем неправильно.
Посмотреть ОригиналОтветить0
  • Закрепить