353145
Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml
StackLLaMA: A hands-on guide to train LLaMA with RLHF
In this post, we went through the entire training cycle for RLHF, starting with preparing a dataset with human annotations.
В этой статье блога мы покажем все этапы обучения модели LlaMa для ответов на вопросы на Stack Exchange с RLHF.
🤗 Hugging face: https://huggingface.co/blog/stackllama
⏩ Demo: https://huggingface.co/spaces/philschmid/igel-playground
💨 Dataset: https://huggingface.co/datasets/HuggingFaceH4/stack-exchange-preferences
📌 Paper: https://arxiv.org/abs/2302.13971
ai_machinelearning_big_data