Искусственный интеллект, нейросети, машинное обучение Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels Сайт: https://tprg.ru/site Другие наши проекты: https://tprg.ru/media
Microsoft не мелочится и создал any-to-any генератор
Ну такой вот примерно рецепт усредненный, потому что вариаций масса. Берётся ИИ, который умеет смотреть видео, слушать аудио, понимать тексты, но датасет не готовится, потому что уже есть где его найти. Microsoft берёт этот ИИ и сажает его смотреть YouTube. Добавляют в него всяких видео на разных языках, шумы природы, пейзажи всякие, пока ИИ 100 миллионов не отсмотрит. Потом достают обученную модель и втыкают в инференс. При этом GPU вентиляторами по радиаторам шкрябают. А сисадмины всё это чинят и приговаривают, «oh shit». Надо ли говорить, какие статьи выходят потом? Модель такая, что все бросаются свои версии обучать.
А на самом деле, Composable Diffusion или CoDi, действительно позволяет из любой комбинации инпутов (текст, фото, аудио и видео) получить любую комбинацию аутпутов (тоже текст, фото, аудио и видео), причём будут сохраняться временные соответствия, там где это надо. Нюансы того, как именно достигается возможность делать генерацию any-to-any в любых комбинациях, смотрите в статье.
Посмотреть:
https://www.youtube.com/watch?v=y1sxsye11xk
Почитать:
https://codi-gen.github.io/
#статья
Практика, практика и ничего кроме практики
Это кредо можно применять во многих умениях, но в данном случае применим его к использованию библиотеки pandas. Тепличных условий примеров из документации недостаточно для осознания всей глубины наших глубин, поэтому лучше смотреть те обучалки, где есть примеры использования из реальной жизни.
Посмотреть:
https://www.youtube.com/watch?v=gtjxAH8uaP0
#программирование #это_база
The toxicity in the city, in the ciiiiiityyy
Не то чтобы русского человека может сильно смутить чья-то токсичность или плохое поведение в интернете, но в случае если вас это задевает, то вот способ. Утилита для анализа токсичности комментариев, правда сделать её вам надо самим (инструкцию я дам), но обучать надо на некотором датасете (датасет я не дам). Заодно прокачаете свои навыки TensorFlow.
P.S. Шутка, датасет тоже есть. С двача и пикабу.
Посмотреть:
https://www.youtube.com/watch?v=ZUqB-luawZg
Датасет на русском:
https://www.kaggle.com/blackmoon/russian-language-toxic-comments
#программирование
Пора узнать о тех, кто стоит за ChatGPT
Встречайте Сэма Олтмена, CEO OpenAI (и Лекса Фридмана, который берёт у него интервью). Всего понемногу, но конечно же главная тема интервью это ИИ. Политическая ангажированность нейросетей, настолько ли важен размер, безопасность и ещё другие темы по мелочи (например Илон Маск, прессинг компании со стороны государства и смысл жизни).
Посмотреть:
https://www.youtube.com/watch?v=L_Guz73e6fw
#позалипать
Больше новостей богу новостей
СEO Google возвращается обратно к работе, языковые модели FreeWilly 1 и 2, text-to-image open-source модель SDXL от Stability AI, которая по качеству соревнуется с Midjourney, кастомный характер/старт диалога для ChatGPT и даже новая крипта Worldcoin от основателя ChatGPT, использующая вашу биометрию (последний факт уже приковал к себе взгляды нескольких государственных регуляторов).
Посмотреть:
https://www.youtube.com/watch?v=ATZiz3oW660
#новости
Битва лучших программистов от Tproger, нейронный раунд
Уже прошло 3 раунда битвы лучших программистов мира, однако сегодня особый случай. На ринге четвёртого раунда сошлись Линус Торвальдс и ChatGPT. Голосование идёт до 29 июля, 11 часов утра по Москве. Можете ради смеха попробовать навалиться и вывести ChatGPT на первое место. Выясним, как хорошо работает демократия.
Проголосовать:
https://tproger.ru/articles/rejting-luchwih-programmistov-v-mire-2023-raund-4/
#баттлпрограммистов
С этой ламы шерсти не получишь, но она не менее полезная
Релиз open-source языковой модели LLaMA2 прошел, был нами замечен, но полного тестирования и разбора мы не показывали. Срочно исправляемся.
Были выпущены 3 варианта, на 7, 13 и 70 миллиардов параметров в двух вариантах, LLaMA2 и LLaMA2-Chat, оптимизированная для ведения диалгов с помощью RLHF — обучение с подкреплением от человека. Контекст раздули до 4000 токенов. Утверждается, что по метрикам LLaMA2-Chat 70B сравнима с GPT-3.5
P.S. Создатели относятся к рептилоидной организации, запрещённой на территории РФ
Посмотреть (тестирование):
https://www.youtube.com/watch?v=Xjy-CDRJa54
Посмотреть (как установить локально):
https://www.youtube.com/watch?v=k2FHUP0krqg
Попробовать:
https://www.llama2.ai/
Репозиторий:
https://github.com/facebookresearch/llama
Статья (необходим VPN):
https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
#программирование #нейронные_сети #статья
Насколько тупеет ChatGPT?
Так как цензура и озабоченные граждане не дремлют, из ChatGPT начинают вырезать некоторые области знаний, дабы ничего плохого не случилось. Однако иногда это приводит к тому, что страдают и смежные области, что приводит к общей просадке качества ответов чатботов. Предлагаем вам почитать исследование про поведение GPT-4 и GPT-3.5 и как оно менялось со временем и некоторыми патчам от создателей.
Посмотреть (сравнение GPT и Llama):
https://www.youtube.com/watch?v=DXWwCggFROk
Почитать (исследование про перфоманс GPT):
https://arxiv.org/abs/2307.09009
#статья
Давно у нас интервью не было
Интервью с известным нам специалистом по ИИ Янником Килчером. Мотивация идти в DS, разговоры о технических деталях, о рисках ИИ, как понять GPT-4, чем отличается искусственный интеллект от нашего и много ещё чего интересного.
Посмотреть:
https://www.youtube.com/watch?v=vDaNfQeh0jc
#позалипать
Онлайн-курс по основам программирования дронов
Вы научитесь:
— разбираться в устройстве дронов;
— создавать программы для управления беспилотниками и анализа данных;
— составлять карту пространства;
— обрабатывать изображения, полученные с бортовых систем БПЛА;
— разрабатывать свою систему управления.
В качестве итогового проекта вы создадите систему полёта беспилотника в лесу и примените один из алгоритмов облёта препятствий.
Жаркие скидки до 50% по ссылке: https://epic.st/toPU-
Реклама ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)» ИНН: 9704088880
Знания без понятия, где их применять, ничего не стоят
Поэтому давайте сначала определимся, кто есть в области Data Science, с чем их едят и над чем они работают, чтобы понять, кем вам лучше стать. А на закуску посмотрите mock-собеседование на позицию junior DS, которое даст вам представление о примерном наборе знаний, что могут проверить (но не даст 100% гарантий поступления на работу, всё-таки спрашивать везде могут разное).
Посмотреть (кем стать в DS):
https://www.youtube.com/watch?v=hv6jonYDwzI
Посмотреть (mock-собеседование на junior DS):
https://www.youtube.com/watch?v=Us_TKT8ZL2E
#это_база
Модели порождают модели (объясняет тот, кто это придумал)
HyperTransformer — модель, чьим выходом являются предсказанные веса свёрточной нейронной сети (при этом для тренировки используется лишь небольшое количество данных). Авторы модели заявляют, что для небольших CNN, заточенных под определённые задачи, всё работает прекрасно, а для больших можно предсказать веса первых слоёв, что потом даёт лучший результат при доделывании CNN. А ещё Янник Килчер тут берёт интервью у одного из авторов статьи.
Посмотреть:
https://www.youtube.com/watch?v=D6osiiEoV0w
Почитать:
https://arxiv.org/abs/2201.04182
#статья
Пять признаков, что вам пора погрузиться в Data Science
На ваш суд предоставляем пять признаков того, что из вас может получиться хороший дата-специалист. Часть из этого, конечно, может относиться к любой технической профессии, но если вы получаете кайф от разбора мелочей и научной деятельности, стоит задуматься. А за более точным описанием просим пройти в статью.
P.S. Data Science может быть опасен для организма. Не занимайтесь самодиагностикой и проконсультируйтесь у специалиста.
Почитать:
https://tprg.ru/dI3X
#статья
Осилите ли вы тест для Data-инженеров?
Ответьте на 24 вопросов за 30 минут и проверьте, готовы ли вы к обучению на онлайн-курсе «Spark Developer» от OTUS.
Spark — важнейший фреймворк в Big Data c открытым исходным кодом. На курсе вы научитесь работать с большими данными и закрепите знания с помощью сложных домашних заданий и выпускного проекта.
Пройти тест: https://otus.pw/b5zS/
Реклама ООО «Отус Онлайн-Образование» LjN8JyRAx
Ещё немного ИИ симуляций
На этот раз выясняем, могут ли ИИ агенты придумать какую-то тактику и придерживаться её, будучи помещёнными в батальные условия. Дилемму о крестьянине с копьём и рыцаре мы тут не решим, но посмотреть на то, как сражаются куча человечков с мечами или мушкетами (при этом сначала вообще не понимая, что им делать) может быть залипательно.
Посмотреть (мечи):
https://www.youtube.com/watch?v=YUm2X5Rdw3w
Посмотреть (мушкетеры):
https://www.youtube.com/watch?v=i1BqrKASeAc
#позалипать
Кажется мы давно не трогали данные в аудиоформате
Исправляемся. Поэтому держите туториал, как сделать свой собственный, практически из натуральных продуктов, классификатор аудио. И опять же, прокачиваем свои навыки работы с TensorFlow.
Посмотреть:
https://www.youtube.com/watch?v=ZLIPkmmDJAc
#программирование
Ребят, ищем пишущего IT-редактора блогов в Tproger
Условия: удалёнка, фултайм
Что делать:
— искать темы, которые понравятся клиентам и заинтересуют читателей;
— вникать в эти темы настолько, чтобы говорить с экспертами примерно на одном языке;
— проводить интервью и собирать фактуру;
— превращать фактуру в статью, которую захочется читать и репостить;
— дорабатывать статью вместе с экспертами и менеджерами клиента.
Требования:
— пишете логично и ёмко, видите стилистические и речевые ошибки в тексте;
— быстро находите и проверяете информацию (в том числе в англоязычных источниках);
— любите общаться с экспертами и умеете их разговорить;
— спокойно реагируете на комментарии, но можете отстоять свою позицию, если правка неуместна;
— тактично вносите правки, чтобы автор не расстраивался, а был благодарен за помощь;
— знаете, что такое ключевое слово, мета-описание и зачем нужен Wordstat.
Чтобы откликнуться, заполняйте анкету.
#вакансии #работа
Data Science без Data не получится
А как бы мы не старались, в большинстве случаев данные будут храниться в базах данных на одной или другой версии SQL, поэтому знать SQL обязательно. Поэтому вот вам полный курс для новичков, дополненный решениями задач и вопросов с технических интервью.
Посмотреть:
https://www.youtube.com/watch?v=-fW2X7fh7Yg
#это_база
ChatGPT породил Orca AI, а LLaMA породила FreeWilly
Таким же образом, как вот в этой новости, ребята из Stability AI создали свои языковые модели FreeWilly и FreeWilly 2, использовав в качестве наставника модели LLaMA и LLaMA 2 соответственно. Результаты тестирования можете посмотреть в видео или скачать с HuggingFace сами (только теперь все модели FreeWilly называются StableBeluga, вероятно до названия докопались копирайтеры).
Посмотреть:
https://www.youtube.com/watch?v=gYuLlV1rfhQ
HuggingFace:
https://huggingface.co/stabilityai/StableBeluga2
#нейронные_сети
Мы движемся к созданию идеальных игр для социопатов
Плагин для Unreal Engine 5.2 под названием Replica позволяет вводить в игру NPC, способных на диалог а-ля ChatGPT. Так вот полюбуйтесь, как на протяжении 25 минут игрок просто ходит и доводит до истерики и кибербуллит (буквально) совершенно ни в чём неповинных NPC.
Посмотреть:
https://www.youtube.com/watch?v=ImaTImQi5ts
#позалипать
Доказательство того, что косатки — очень умные животные
Правда это не совсем косатка, а Orca AI — новая языковая модель от Microsoft на 13 миллиардов параметров, обученная ChatGPT 3.5 и 4. Да-да, одни модели уже вовсю припахали учить другие.
При этом, хоть Orca и не такая большая, как GPT, результаты вполне неплохие получились. Смысл в том, что она не имитирует результаты работы, учась подражать GPT, а использует step-by-step объяснения от старших братьев и их ход мыслей. Ну а зачем нужна модель поменьше, всем понятно — не у всех есть куча денег и мощные кластера, чтобы крутить свой собственный GPT.
Посмотреть (один разбор):
https://www.youtube.com/watch?v=KoI6G7oWYvM
Посмотреть (второй разбор):
https://www.youtube.com/watch?v=gyeiL1JZnXc
Почитать (статья):
https://arxiv.org/pdf/2306.02707.pdf
#статья #нейронные_сети
Партия новостей в жаждущий информации мозг
Серия Южного парка нарисованная, озвученная и наделённая сценарием с помощью ИИ, релиз LLaMA2, проблемы с ChatGPT, Apple создаёт свой ChatGPT и большая куча денег для HuggingFace. Все делают свой ChatGPT, но инновации никого не интересуют.
Посмотреть:
https://www.youtube.com/watch?v=lWKsGfSf1U0
#новости
Откуда появилось столько приложений с ChatGPT?
Наверное их все написали те, кто посмотрел этот туториал. С помощью силы аниме, Django и OpenAI API вы можете написать своё приложение, а так же немного развить свои скиллы во фронтэнде (никогда не знаешь, что придётся делать специалисту по DS, особенно если начинаешь работать в небольшом стартапе, когда все должны уметь всё).
Посмотреть:
https://www.youtube.com/watch?v=qrZGfBBlXpk
#программирование
Какую опасность таят языковые модели?
Статья «Об опасности стохастических попугаев» рассказывает нам о том, что за большими языковыми моделями нужно очень хорошо следить. Так как ответы на запросы генерируются не исходя из контекста слов запроса, а основываясь на связи запроса и базы данных, используемой для обучения. Поэтому надо внимательно смотреть в данные, чтобы на запрос рецепта сырников не появилось инструкций о создании взрывчатки.
Почитать:
https://tproger.ru/articles/pochemu-chatgpt-opasna-i-chto-takoe-stohasticheskie-popugai/
Почитать (оригинальная статья):
https://dl.acm.org/doi/10.1145/3442188.3445922
#статья
Дизайн — это важно и дорого
Поэтому конечно же, как только появились генеративные модели с возможностью стилизации, появились ИИ-приложения, которые за подписку могут вам выдавать различные варианты дизайна ваших комнат. Правда там изначально должна стоять какая-то мебель. Так что можете посмотреть, как эти приложения работают, но если планируете ремонт или перестановку в комнате, планируйте сами или платите спецу (из приложения можно максимум почерпнуть стиль оформления).
Посмотреть (Midjourney):
https://www.youtube.com/watch?v=51cS6ofdg1A
Посмотреть (Interior AI):
https://www.youtube.com/watch?v=rX_jW5VAkww
#позалипать
Midjourney развивается дальше
Но не то чтобы сильно. Лучшее качество изображений, меньше повторяющихся (а-ля копипаста) элементов, возможность зума и дополнения изображений, а так же система весов промпта, когда определённым словам можно придать большее значение, что сильно повлияет на конечный результат. Смотрим, думаем.
Посмотреть:
https://www.youtube.com/watch?v=jbe6t4GiljU
#позалипать
В жизни DS, к сожалению или счастью есть не только DS
Вам всё ещё надо знать базу, какое-то понятие о языках, алгоритмах, SQL и всём таком прочем. И что для этого есть лучше, чем очередной снайдеркат-туториал на 24 часа. Правда для этого вам нужно понимание английского языка, но если вы сможете всё это просмотреть, то и язык вы выучите.
Посмотреть:
https://www.youtube.com/watch?v=8mAITcNt710
#лекция #это_база
А давайте посидим и поразмышляем
Для тех, кто думает, что технология и инструменты могут представлять опасность в отрыве от людей. Размышления над этикой и опасностью ИИ от экспертов в области. И согласно опросу, приведённому в начале первого выступления, половина из вас верит, что есть ненулевой шанс истребления человечества из-за мятежного ИИ.
Посмотреть:
https://www.youtube.com/watch?v=xoVJKj8lcNQ
Посмотреть:
https://www.youtube.com/watch?v=aGwYtUzMQUk
#позалипать #лекция
Где не стоит использовать ChatGPT
ChatGPT не попробовал и не обсудил только ленивый. С ее помощью пишут код, статьи, дипломы. Но так ли хороша эта нейросеть и можно ли полноценно использовать ее в работе? Обсудили в статье: https://tprg.ru/uaUm
Больше никакого мыла
И это мы не про то, что мыться не надо, а про новый ИИ от Google, который позволяет в какой-то степени избавиться от размытого движения или плохого фокуса на фотографии при использовании смартфона. Почти на всех современных смартфонах есть несколько камер, чьи результаты съемки ИИ и использует для создания конечного, незамыленного кадра. Техника не идеальна, но результаты уже лучше, чем предыдущие техники.
Посмотреть:
https://www.youtube.com/watch?v=3Hs-tyr4FFA
Почитать:
https://defocus-control.github.io/
#статья