14289
Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404
У меня чатгпт лютый пидорас, который на любое мое слово говорит: нет, ты не прав, твоя формулировка на 0.1% отличается от истины
Читать полностью…
а зарабатывать потом то как если всё сразу будет работать?)))
Читать полностью…
"Почему технологиянейм не работает как я представлял себе? Топ ножкой"
Читать полностью…
раньше я вводил запрос в гугл, сейчас я могу ввести его в бредогенератор
Читать полностью…
нормально же обсуждали оптимизацию кода, опять вы к своим текстогенераторам
Читать полностью…
Нет, он учил её нравиться людям. Всё. Всё что дальше - это вытекающие
Читать полностью…
Хотя формально там решается next token prediction, но фактически для этого пришлось стать семантическим процессором. Не текстовым, уже именно семантическим
Читать полностью…
tl;dr нейросеть может быть если повезет последует вашей инструкции
Читать полностью…
Ты так ничего и не объяснил
А что правда? Чему RLHF учит по-твоему?
Какой промпт всё-таки заставит чагпт не поддакивать, мля?
Упд: не чагпт, пусть будет клод
Ну блин, мало ли что ты ждёшь. Люди тоже твою инструкцию не всегда будут исполнять. Делает ли это инструмент бесполезным?
Читать полностью…
смысл в том, что когда ты даешь такую инструкцию, ты ждешь ее выполнения всегда
Читать полностью…
Тот же RLHF учил её следовать системному промпту. Они конфликтуют в этом плане.
Читать полностью…
RLHF сильнее, чем промпт, да, но это не значит, что промпт вообще не работает
Читать полностью…
Мне нужно чтобы она не поддакивала. Но к неё в обучении был блок RLHF, и он неизбежно научил её поддакивать. Ты думаешь, она от моей просьбы передумает это делать? Как нужно просить для этого?
Я был бы рад увидеть конкретный кусок промпта, указывающий на это
Ну да, тут уходим в определение того, где граница между "следует" и "не следует"
Читать полностью…
Особенно на собеседование все пытаются показаться лучшей версии себе
Читать полностью…