Проклятые нейронные сети Для связи: @krasniy_doshik
Если вам нечем заняться этим вечером, то можно чуть себя развлечь рисуя айсберги и наблюдая как они себя будут вести в воде.
Ссылка: https://joshdata.me/iceberger.html
Яндекс запустил Lite-версию генеративной текстовой модели YandexGPT 3
YandexGPT 3 Lite — это облегчённая версия генеративной модели Яндекса нового поколения. Особенность таких Lite-моделей заключается в более высокой скорости ответов, что позволяет решать простые задачи бизнеса буквально в режиме реального времени. Поэтому нейросеть хорошо показывает себя в сценариях, где важны время реакции и оптимизация затрат: например, бот-консультант на сайте, система подсказок для операторов колл-центров или суммаризатор результатов деловых встреч.
✈️ По данным замеров, YandexGPT 3 Lite стала ещё быстрее и точнее — и она уже доступна в режиме release candidate на облачной платформе Yandex Cloud. То есть клиенты могут протестировать её и плавно внедрить в свои продукты через API уже в ближайшее время.
Одним из ключевых этапов обучения модели стало выравнивание (Alignment), включающее в том числе стадию обучения с подкреплением (RL). В статье на Хабре - детали реализации Alignment и RL.
Чтобы оставаться востребованным в сфере DL, нужно не только обучать модели, но и перенимать лучшие практики у разработчиков. Это действительно важно, т.к. инженеры по глубокому обучению тоже пишут код, правят бизнес-логику, снижают bus factor и стараются избегать багов.
На помощь приходят инструменты, которые облегчают жизнь. И есть пять инструментов, которые просто необходимы каждому DS-инженеру.
В этот четверг, 20 июня, будет проходить годная лекция «5 инструментов эффективного DS-инженера», на которую я рекомендую зарегистрироваться.
На лекции будут обсуждать:
1️⃣ как сделать эксперименты воспроизводимыми
- версионирование данных, кода и моделей
- управление зависимостями
2️⃣ инструменты, которые повысят качество кода
- линтеры и тесты
- Continuous Integration
3️⃣ как упростить свою работу
- lightning
- трекинг и визуализация в CML
А также организаторы представят программу курса “Computer Vision Rocket” и подарят скидки на обучение!🔥
🙋♂️Спикеры лекции:
- Егор Осинкин — Lead CV Engineer в EPAM, спикер курса CV Rocket
- Тимур, Фатыхов — ex Lead CV Engineer в Koronapay, основатель DeepSchool
Регистрируйтесь по ссылке!
После регистрации вы получите список полезных библиотек и сервисов для CV-инженеров!🎁
Также в телеграм-боте будет краткий анализ CV-вакансий, показывающий, как менялись зарплаты и как они зависят от требований и от грейдов.
Полез сегодня на сервер внести небольшие правки боту нейромедузы. Заодно решил глянуть статистику (пишется в файл на сервере), которую не смотрел около двух лет и охуел. Думал, ботом почти никто не пользуется, а там ~ 5-7к запросов в сутки, а за все время существования проекта — 8.2 миллиона запросов. Приятно удивлен, лол.
Ну и интересный факт: сколько бы я ни пробовал прикрутить современные языковые модельки типа ChatGPT или Gemini к этому боту, ничего нормального из этого не выходит — заголовки получаются либо слишком унылыми, либо слишком правдоподобными. Именно в этом проекте альтернативы файтюну ruGPT-3 нет и не предвидится.
Кроссовер, который мы заслужили.
Как выглядел бы фильм "Властелин колец" во вселенной Cyberpunk 2077.
Это – база с вакансиями и стажировками в ML и Data Science, которая заменит вам сотни тг-каналов и сайтов. Фишка в том, что здесь напрямую от работодаталей появляются вакансии, которых нет на обычных работных порталах.
Теперь можно легко найти ML-работу в России и за рубежом с высокой зарплатой и интересными задачами: Карьера
#реклама
Смотрите какая интересная штука:
1)Генерируем коробку в Dalle3 с надписью "Клубника"
2)Подаём эту картинку на вход LUMA и просим открыть эту коробку.
3)Наблюдаем в коробке клубнику!!!!
С котами тоже работает!
SD3
Когда сделали свою модель для генерации изображений настолько "безопасной", что полностью проебали физиологию.
Очень печально смотреть, как AI компании прогибаются под вопли ебучих соевых alignment-дегенератов.
Если интересуетесь этими нашими искусственными интеллектами, обязательно загляните в авторский канал моего знакомого.
Много тематической годноты от мемасов до интересных репозиториев. Думаю, вам вкатит.
Это слишком хорошо, чтобы не поделиться! Подавал в Luma всякие картинки, и набаловался до такого.
Конечно, во многих случаях персонаж с каждым следующим кадром все сильнее и сильнее отходит от оригинала. Внешность не сохраняется 😢. Короче до AGI и до СОРЫ еще далеко.
Какой видос вам больше всего приглянулся?
@ai_newz
Оказалось, что Stable Diffusion 3 не умеет генерировать людей, лежащих на траве.
Ну или умеет, просто это мы не знаем нужных людей
А вот это реально крутое применение ИИ. Надеюсь, в скором времени поможет изжить магазинных воришек.
Только мне кажется, что первое время будет очень много ложных сработок. Но нейронки на то и нейронки, чтобы быстро дообучаться и становиться совершеннее.
Подобные видосы уже не редкость на просторах интернетов, но каждый раз когда вижу такое, очень радуюсь. Ты просто нарисовал, а после написал железяке что хочешь от нее получить, а на выходе почти мгновенно получаешь исходники (и они даже работают). ПРЯМ МАГИЯ КАКАЯ-ТО!!!!
В удивительное время живём.
Наткнулся на пример нейродубляжа фильма Операция "Ы".
Просто послушайте, как оно годно сохраняет оригинальные голоса.
Кажется, мясные актеры дубляжа тоже скоро отправятся на рынок торговать луком.
Антропик показал свою новую модель Claude 3.5 Sonnet которая бьет даже GPT4o —можете бесплатно поиграться с ней тут claude.ai
А я сразу полез в API со своим промптом разработчика и попросил ее воспроизвести сцену из фильма Хакеры – помните, когда данные там летали сквозь 3D-башни данных? И это первая модель, что справилась с этой задачей - код.
Ну что, OpenAI больше не лидер получается – Anthropic made 3.5 great again
Если вы любите пытаться сломать защиту в разных LLM с помощью промпт инъекций – то у меня вам полезная ссылка, датасет из почти ~1500 промпт инъекций собранных с Reddit, Discord, Twitter и тп.
https://github.com/verazuo/jailbreak_llms
Внутри промпты и для старых инъекций, вроде DAN, до более новых с base64, leet code и тп.
Следующий шаг, это натренировать на этом модель, которая будет ломать другие модели автоматом ☕️
Найден самый подходящий логотип для Stable Diffusion 3
Читать полностью…🔥 ЭТО ПРОСТО НЕВЕРОЯТНО!
Посмотрите, что творят нейросети!
Подборка 10 лучших нейрогенераций на все случаи жизни!
Невероятное качество, каждый опрошенный художник уверен, что потеряет работу после такого!
Про обучение LLMок и яндексовый опенсорс
Недавно постил вот такую картинку. Если поразмышлять, то вообще-то говоря, стоимость сильно зависит от географии. Железки и электричество стоят везде по-разному. А экономить можно ещё и на софте и оптимизациях.
То, что сегодня яндекс опенсорснул свою библиотеку YaFSDP, интересное событие с точки зрения новой эры в обучении моделей.
Основное из их новости:
– яндекс пишет, что решение позволяет ускорить до 25% обучение LLM с открытым исходным кодом
– обещают, что с YaFSDP экономия памяти GPU может достигать 20%
– ну и показывают результаты теста библиотеки на сторонних нейросетях (на примере модели LLaMA 2 этап предварительного обучения на 1024 графических процессорах сократился бы с 66 до 53 дней)
– исходный код уже есть на GitHub, посмотреть подробности замеров можно в репозитории GitHub, а почитать про разработку библиотеки — на Хабре.
Коллеги посчитали, реально ли с помощью решения можно сэкономить от $0.5M за месяц обучения модели, и соорудили формулу.
Стоимость аренды GPU в час * количество часов * количество дней * количество GPU * (коэффициент на сколько оптимизируем ресурсы) = экономия
Ну и проверили экономию на примере Google Cloud и Fluidstack:
Считаем у Гугла, параметры выходят такие:
1) 1312 H100
2) Месяц обучения
3) Цена за GPU: $3.98/h
4) Экономия 20% ресурсов
Общая экономия в месяц: 3.92*30*1312*(0.2/1.2)*24 = $601 тыс
Теперь у FluidStack:
1) 1312 H100
2) Месяц обучения
3) Цена за GPU: $3.75/h
4) Экономия 20% ресурсов
Общая экономия в месяц: 3.75*30*1312*(0.2/1.2)*24 = $566 тыс
Это я к чему: YaFSDP надо детальнее изучать, но возможно она будет полезна тем, кто не может позволить себе ацкого железа и для тех, кто использует ГПУ в облаке. А оптимизация идёт за счёт софта.
Наконец-то нейронные видеомемы!
UPD: там в комменты еще накидали, посмотрите!
Заметил, что стал часто использовать ChatGPT вместо привычного гугла. И дело не в том, что чатжпт сильно круче и технологичнее, а только в том, что блядские поисковики даже на самые простые запросы показывают на первых страницах какие-то мегаогромные статьи написанные SEO-дегенератами (лом им в сраку).
Пытаешься быстро посмотреть как на самсунге включить автозапуск приложения — вся первая страница гугла выдает ссылки на статьи из 39442632494876 слов с историей фирмы самсунг, ее плюсами и минусами, среди которых буквально пара строк имеют отношение к делу.
Алло, блядь, мне нужно быстро решить проблему, если бы я хотел читать десятки страниц нудной хуйни, я бы что-то из тензорной алгебры почитал.
Это — база по Machine Learning и Data Science, которая заменит вам сотни тг-каналов и сайтов. Фишка в том, что здесь ежедневно выходят:
➖ разборы свежих статей;
➖ полезные материалы, упрощающие обучение и работу;
➖ моментальные новости, позволяющие следить за индустрией;
➖ и конечно же авторские мемы.
Теперь вся жизнь ML-специалиста собрана в одном месте: Data Secrets
#реклама
Сравнение генераций sora от OpenAI и китайского kling. Местами kling вообще не уступает sora, как по мне.
1)Видео от первого лица, на котором муравей перемещается по муравейнику.
2)Исторические кадры Калифорнии во время золотой лихорадки.
3)Молодой человек сидит на облаке в небе и читает книгу
4)В анимационной сцене крупным планом показан невысокий пушистый монстр, стоящий на коленях рядом с тающей красной свечой.
5)Фотореалистичное видео крупным планом, на котором два пиратских корабля сражаются друг с другом, плавая в чашке кофе
6)Бело-оранжевый полосатый бродячий кот мечется по переулку под проливным дождем в поисках убежища.
7)Гамбургер