Всё, что может быть интересно медиа про Яндекс: новости, анонсы, заявления, комментарии, инсайды и другие горячие и не очень события ⚡️ PR-команда: pr@yandex-team.ru
👩💻 Технодайджест недели
Главной техноновостью этой недели стал выход семейства языковых моделей Claude 3 от компании Anthropic. Они различаются между собой качеством ответов, скоростью работы и стоимостью.
В отличие от Claude 2.1, третья версия способна работать не только с текстом, но и с изображениями. Главным отличием от GPT-4 стало большое окно контекста, позволяющее работать с книгами, научными статьями и другими объёмными документами. Все версии Claude 3 могут принимать текст длиной 200 тысяч токенов, а Claude 3 Opus — самая «умная» из трёх — до миллиона токенов (правда, опция доступна только по запросу). Для сравнения: у GPT-4 Turbo размер контекста составляет 128 тысяч токенов.
Anthropic утверждает, что Claude 3 Opus превзошла GPT-4 при сравнении на ключевых бенчмарках. Вскоре после релиза модель добавили на LMSYS Chatbot Arena — сервис, в котором люди получают ответы на свои запросы от двух нейросетей и выбирают из них лучший. На основе этих данных и рейтинга Эло строится список лучших моделей. На текущий момент Claude 3 Opus немного отстаёт в рейтинге от актуальных версий GPT-4.
Другие новости недели, которые показались нам интересными:
CloudFlare разработала файрвол для языковых моделей. Он включает в себя как защиту от DDoS, так и анализ текста в запросах пользователей и ответах нейросети. Это должно защитить сервис от методов, позволяющих обходить стандартные ограничения нейросетей с помощью специальных промптов.
Wix выпустила нейросетевой генератор веб-страниц. Чат-бот задаёт несколько вопросов о сайте и создаёт первую версию страницы, которую можно редактировать — тоже через разговор с чат-ботом. Кроме того, страницу можно наполнить контентом с помощью нейросетей для генерации текста и изображений.
Американские инженеры научились управлять человекоподобными роботами без датчиков захвата движения. Алгоритм распознаёт движения человека на кадрах с камеры и в реальном времени превращает их в команды для робота.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
🔍🗺 Сколько ехать на машине из Чатово в Ботово? А можно ли добраться от деревни Запросы до реки Поисковик? Обо всём этом мы узнали благодаря вам.
На прошлой неделе мы предложили вам отгадать 9 техно-топонимов, но вы показали на карте России такие техно-места, которые вообще не приходили нам в голову. Мы составили из них несколько подходящих друг другу пар, не переставая удивляться, что всё это реально есть на карте.
Кстати, между некоторыми локациями даже можно проложить автомобильные маршруты: например, из Чатово в Ботово на машине ехать 14 часов, а вот от Запросов до Поисковика придется добираться неделю.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
📁 Начинаем короткий сериал про самые первые файлы
Дикий опоссум, семейный портрет и аббревиатура Всемирной паутины — это три самых первых PNG в истории, опубликованные 13 марта 1995 года. Но предпосылки для создания формата появились за несколько лет до этого.
В конце 1980-х разработчик Стив Уилхайт из CompuServe, одного из первых в мире онлайн-провайдеров, придумал, как сжимать выводимые на экран изображения, экономя память. Так появился формат GIF, известный сегодня по зацикленным анимациям, хотя изначально его разрабатывали для статичных изображений. GIF стал по-настоящему революционным форматом, но к середине 1990-х компания Unisys, которой принадлежал патент на сам алгоритм сжатия в GIF, решила, что больше не будет предоставлять права на него бесплатно. Это было критично для разработчиков: теперь для использования GIF-алгоритма для программного обеспечения нужно было покупать лицензию.
Решить проблему мог бы новый — бесплатный и более продвинутый — формат. Эту задачу в январе 1995 года взяла на себя группа разработчиков во главе с Томасом Боутеллом. Всего через 3 месяца, в марте того же года, в интернете появился PNG-опоссум и PNG-портрет семьи Гленна Рендерса-Персона — программиста из группы Боутелла.
Главным преимуществом PNG стали новые алгоритмы сжатия (GIF сжимал лишь горизонтальные одноцветные области изображения). Благодаря различным стратегиям и способам фильтрации разработчикам удалось сохранить качество изображения при минимальном размере файла. Кроме того, уже самые первые PNG могли быть прозрачными. Эта уникальная для того момента особенность формата до сих пор помогает при создании сайтов.
История противостояния GIF и PNG на этом не закончилась. 5 ноября 1999 года состоялась массовая акция Burn All Gifs Day, во время которой разработчики в знак протеста удаляли все свои GIF-файлы. Судя по количеству гифок в интернете, протест ни к чему не привёл.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
🧠🤖 Собрали в карточках пять интересных имплантатов — устройств, которые способны дать человеку новые возможности или вернуть утраченные.
Подписывайтесь 👉 @techno_yandex
🤖📝 Robots.txt — это файл, который есть в корневом каталоге почти каждого сайта. Он определяет правила, по которым роботы поисковых систем могут сканировать этот сайт. Владелец сайта может настроить правила по своему усмотрению. Например, указать, какие страницы нельзя индексировать, или совсем запретить ботам доступ.
Зачем это нужно?
Боты, индексирующие сайты, появились в 1990-х. Их использовали для каталогизации интернета, чтобы облегчить поиск нужных данных. Такое сканирование нравилось не всем, так как замедляло работу сайта.
Тогда программист Мартин Костер придумал протокол исключения роботов. Он представлял собой обычный текстовый файл, описывающий правила работы поисковых алгоритмов для конкретного сайта. Протокол не накладывал никаких юридических обязательств, но стал неким подобием общественного договора между владельцами сайтов и поисковиков.
Как это работает?
Сканирование роботами позволяет добавлять сайты в поисковую выдачу, поэтому большинство владельцев разрешает индексацию, чтобы привлечь трафик. Это выгодно всем: поисковики получают информацию, а сайты — новых посетителей. При этом у владельцев остаётся возможность спрятать от поисковых систем любую информацию на сайте.
Что изменилось сейчас?
С появлением нейросетей роботы стали собирать в интернете информацию для обучения алгоритмов. В конце 2023 года New York Times подала в суд на OpenAI, заявив, что для обучения языковых моделей были использованы миллионы защищённых авторским правом материалов. OpenAI в ответ заявила, что New York Times «взломала» ChatGPT и потратила десятки тысяч попыток, чтобы получить нужные результаты.
С этим можно что-то сделать?
В файле robots.txt можно прописать запрет на сбор информации роботами нейросетевых компаний, но их с каждым днём становится всё больше, и запретить всё очень сложно. Кроме того, правила индексации — это неформальная договорённость, а значит, их можно игнорировать, если компания не дорожит своей репутацией.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
🔒❤️ Хорошие пароли сложно запомнить и легко потерять. А ещё пароль могут подобрать или украсть злоумышленники, поэтому крупные сервисы давно предлагают использовать двухфакторную аутентификацию с помощью одноразовых кодов. Но наметился тренд по отказу от паролей и появилась удобная альтернатива — открытый стандарт беспарольной аутентификации WebAuthn.
WebAuthn позволяет использовать в качестве подтверждения, что в аккаунт пытается войти именно пользователь, привычные методы защиты смартфонов и ноутбуков: отпечаток пальца или скан лица (кроме того, поддерживаются умные часы, USB-токены, а также пин-коды и графические ключи). Когда пользователь хочет подключить вход по WebAuthn к своему аккаунту, сервис просит его приложить палец к сканеру или отсканировать лицо, в зависимости от устройства. В этот момент устройство генерирует пару ключей: открытый ключ отправляется на сервис, а приватный остаётся на устройстве в защищённом хранилище.
С этого момента устройство становится своего рода удостоверением личности и его можно «предъявлять», чтобы легко входить в свой аккаунт на других компьютерах или смартфонах. WebAuthn — это открытый стандарт, который подразумевает, что отпечаток пальца и модель лица всегда остаётся на устройстве и никуда не передаётся. Во время входа сервис получает от гаджета лишь простой ответ: пользователь прошёл или не прошёл проверку.
Как настроить вход по лицу в Яндекс ID:
— Перейти на страницу настройки в ID
— Нажать на кнопку «Настроить на устройстве»
— Выбрать нужный тип аутентификации из списка. Дальнейшие шаги зависят от типа устройства, но всегда ограничиваются всего несколькими действиями.
Как войти в Яндекс ID по лицу или отпечатку:
— Перейти на страницу входа в ID
— Нажать на кнопку «По лицу или отпечатку»
— Следовать инструкциям браузера, в зависимости от вашего устройства.
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.
👩💻 Технодайджест недели
Одной из самых обсуждаемых техноисторий недели стало поведение чат-бота Google Gemini при генерации изображений людей. Пользователи заметили, что Gemini генерирует картинки с людьми разного пола и расы при практически любых запросах, даже если результаты получаются исторически недостоверными.
Так, пользователи публиковали скриншоты, на которых чат-бот создавал картинки темнокожих викингов, римских императоров и американских сенаторов XIX века в ответ на запросы, в которых не было уточнений про расу и цвет кожи. Кроме того, Gemini часто отказывался генерировать изображения по промптам, в которых пользователи просили нарисовать людей со светлой кожей.
Вскоре Google признала проблему и отключила возможность генерировать изображения людей. Компания пообещала доработать эту функцию и вернуть её, когда убедится, что она работает существенно лучше.
Другие новости недели, которые показались нам интересными:
Робопса ANYmal научили скакать на трёх ногах и открывать двери четвёртой. Швейцарские инженеры создали нейросетевой алгоритм управления роботом, позволяющий ему использовать одну из ног для взаимодействия с предметами. В одном из экспериментов он поднял свободной ногой рюкзак и положил его в корзину.
Apple внедрила в iMessage квантово-устойчивый алгоритм шифрования. Такие алгоритмы, предположительно, устойчивы к атакам с помощью мощных квантовых компьютеров будущего, которые будут способны быстро расшифровать данные, защищённые классическими криптографическими алгоритмами. Ранее аналогичный алгоритм внедрил мессенджер Signal.
Google выложила в открытый доступ две большие языковые модели Gemma. Их архитектура и параметры обучения аналогичны таковым у Gemini, но размер существенно меньше. Это позволяет запускать их локально на многих компьютерах, а версию 2B — даже на смартфоне. По качеству работы Gemini 7B сопоставима с Mistral 7B (правда, имеет больший размер).
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.
🗯 Моя волна — это система персональных рекомендаций в Яндекс Музыке, подбирающая в режиме реального времени треки, которые могут понравиться пользователю. Она ориентируется на вкусы человека (например, любимых исполнителей или жанры) и его действия — лайки, дизлайки, переключения треков, сохранения и другое.
Кстати, когда Моя волна подбирает новый трек, она учитывает не только то, как пользователи взаимодействуют с музыкой, но и «заглядывает» внутрь аудио. Специальные алгоритмы раскладывают трек на частоты, а потом превращают эти данные в вектор. У песен с похожим звучанием получаются близкие вектора, поэтому этот метод удобно использовать для рекомендаций.
Основной алгоритм Моей волны настроен на баланс между новыми для пользователя треками и треками, которые он уже слышал раньше. С помощью настройки Незнакомое можно сместить поток рекомендаций в сторону неизвестных треков и исполнителей.
Настройка Незнакомое была в Моей волне с самого начала, но теперь она обновилась. Разработчики Яндекс Музыки добавили в неё отдельный ранжирующий алгоритм. Его обучали именно для подбора новой музыки, которая с большой вероятностью понравится человеку. Алгоритм ищет подходящие треки только среди новых и чаще «рискует», добавляя непривычную для пользователя музыку.
Цель изменения была в том, чтобы сделать настройку более смелой и увеличить количество треков, которые будут нравиться пользователям. Тесты показали, что с новым алгоритмом пользователи на 20% чаще сохраняют себе в Коллекцию предложенные Моей волной треки.
Расскажите в комментариях, каких новых любимых исполнителей помогла вам найти настройка Незнакомое в Моей волне👇
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.
🔴 В ноябре прошлого года на Камчатке закончилось извержение вулкана Ключевской, которое длилось 4,5 месяца. Такие в регионе происходят регулярно.
Метеорологи из Яндекс Погоды, студенты Школы анализа данных и специалисты из Yandex Cloud разработали систему, чтобы предсказывать, в какую сторону направится облако пепла, и предупреждать о нём жителей ближайших городов.
🔴 Камчаткой система не ограничивается, использовать её можно в любом регионе. Подробнее о вулканическом огненном кольце и нашей технологии читайте на Хабре.
Подписывайтесь 🔴 @yandex
Если бы история пошла по альтернативному пути, вы бы могли видеть такие символы каждый день. Как думаете, что это? Пишите свои догадки в комментариях.
Подписывайтесь 👉 @techno_yandex
🔎🌐 Всего 30 лет назад поиск в сети выглядел совсем иначе. Рассказываем, как люди справлялись без поисковиков.
Люди вручную искали и отправляли друг другу информацию
До появления Всемирной паутины (WWW) сетями-предшественниками в основном пользовались научные и государственные учреждения — они обменивались сообщениями и передавали файлы. В 1980-х ответ на интересующий вопрос можно было получить от других пользователей сети Юзнет, а скачать интересующий файл — на FTP-сервере (но нужно было знать его адрес).
Все ссылки хранились на одном сайте
В начале 1990-х поиск в интернете ограничивался info.cern.ch — первым сайтом в истории. Владелец нового сайта отправлял ссылку создателю Всемирной паутины Тимоти Бернерсу-Ли, а тот определял её в одну из категорий каталога, где ссылку могли найти другие пользователи. Этот каталог превратился в WWW Virtual Library, первую виртуальную библиотеку ссылок.
Люди изучали каталоги сайтов, боты их наполняли
К середине 1993 года в мире существовало несколько сотен сайтов, и вместе с этим появился спрос на библиотеки страниц. В июне 1993-го такой список под названием What’s New выпустили создатели браузера Mosaic, а в августе появился гид по интернету — Global Network Navigator. В том же 1993 году Мэтью Грэй из MIT придумал бота World Wide Web Wanderer, который сканировал все сайты в интернете, наполняя базу данных Wandex.
Люди начали пользоваться поисковиками
В 1994 году студент Вашингтонского университета Брайан Пинкертон запустил WebCrawler — первую в мире поисковую систему, которая искала заданное слово по веб-страницам. Это понравилось людям, и в 1995 году появился поисковик AltaVista — он искал запросы, сформулированные на естественном языке. А в 1997-м появилась поисковая машина Яndex-Web. Она индексировала рунет, который на тот момент состоял из пяти тысяч сайтов.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
😊 Показываем пасхалки в Яндекс Станциях
В наших устройствах есть не только технологии, но и скрытые послания от разработчиков. Показываем, какие пасхалки команда умных устройств оставляет в Станциях, а главное — зачем они это делают и какой смысл заложен в каждой из них.
Подписывайтесь 🔴 @yandex
А вы знали, что в Яндекс Станциях есть пасхалки?
Недавно мы рассказывали, что скрытые послания на платах устройств — давняя традиция среди инженеров. Пришло время признаться, что пасхалки есть и в наших устройствах.
Показываем некоторые из них, чтобы вам не пришлось разбирать свою Станцию (так лучше не делать, чтобы не лишаться гарантии). Пишите в комментариях свои предположения о том, какой смысл заложен в каждой пасхалке!
Подписывайтесь 👉 @techno_yandex
Марк Цукерберг попробовал Apple Vision Pro и поделился своими мыслями об устройстве. Вот лишь одна цитата:
Я не просто думаю, что Quest лучше по соотношению цены и качества, я думаю, что Quest — лучший продукт и точка.
🍏🥽 Мы протестировали Apple Vision Pro — рассказываем о наших впечатлениях. А ещё спросили у главы отдела умных устройств Яндекса Андрея Холодного, как устройство может повлиять на гаджеты будущего. Ответ — в видео.
🧑💻 Шлем стоит воспринимать не как массовый продукт, а как девкит. Тогда и цена перестаёт вызывать вопросы. Это устройство для разработчиков, которые могут тестировать свои идеи и приложения на visionOS.
🫠 Пока всё сыровато. За 4 часа мы перезапускали шлем несколько раз — порой он отказывался делать запись видео из-за бага. Долго пользоваться им не очень приятно: маска греется, батарея в кармане — тоже. Сняв шлем, вздыхаешь с облегчением.
🤯 Качество трекинга и дисплея действительно супер. Интерфейс не дрожит и не смещается и отдельных пикселей не видно. Камеры откалиброваны так, что картинка из внешнего мира не кажется геометрически искажённой. Но ты всё равно видишь цвета и свет, как будто через камеру бюджетного смартфона.
📺 Это классный домашний кинотеатр. Фильмы воспроизводятся на гигантском виртуальном экране одновременно в 3D и HDR — так не умеет даже IMAX, а звук привязан к расположению «зала».
📐 Без примерки брать не стоит. Без калибровки линз или подбора формы подкладки, которая обычно производится в Apple Store, использование шлема может превратиться в страдание. Либо шлем будет впускать в себя немного света, либо его придётся сильно прикрутить к лицу.
🍎 Это компьютер Apple. На нём «из коробки» все ваши фото, музыка, фильмы и заметки, которые можно открыть одновременно, раскидав виртуальные окна по всей квартире. Привычные функции вроде AirDrop или подключения наушников работают ровно так, как и ожидаешь.
Спасибо @biggeek за предоставленное устройство
Подписывайтесь 👉 @techno_yandex
Конкурс робомемов закончен! Редакция ТЕХНО поздравляет победителей:
🥇место — @H3ll0_W0rId
🥈место — @JustYarik
Напомним, что победителей выбирали по числу реакций от подписчиков канала. Скоро мы свяжемся с вами и договоримся об отправке приза. Остерегайтесь мошенников, мы не запрашиваем платежные данные. Доставка призов для победителей бесплатная.
В будущем подписчиков ждут новые конкурсы и розыгрыши! А пока мы продолжим рассказывать о самом интересном и важном в мире технологий.
Подписывайтесь 👉 @techno_yandex
☺️ Конкурс робомемов!
Это фотография с производства роботов-доставщиков Яндекса. Но что на ней происходит? Сохраняйте картинку, пишите в баблах реплики роботов и выкладывайте в комментариях к этому посту (а ещё обязательно лайкните понравившиеся мемы других участников).
Два робота — два приза. Автору мема с самым большим количеством лайков мы подарим вот такие роботапочки, а второму по количеству лайков — плюшевого робота. Ждем ваши работы до 15:00 завтрашнего дня (7 марта).
Подписывайтесь 👉 @techno_yandex
🎞🏠 Как представляли умный дом 100 лет назад?
Посмотрите отрывок комедии «Электрический дом», которую снял знаменитый американский комик Бастер Китон в 1922 году. В фильме Китон играет студента-ботаника, который, случайно взяв диплом друга-инженера, устраивается к миллионеру, желающему автоматизировать свой дом. Посмотреть 23-минутный фильм целиком можно тут (нам кажется, оно того стоит).
Подписывайтесь 👉 @techno_yandex
👨💻 Технодайджест недели
На этой неделе прошла MWC — одна из главных ежегодных выставок мобильных технологий. Рассказываем о самых интересных гаджетах с неё.
Прозрачный ноутбук от Lenovo. На месте привычного экрана в нём установлен прозрачный MicroLED-дисплей с диагональю 17,3 дюйма. А вместо обычной клавиатуры в ноутбуке плоская сенсорная панель: на неё можно вывести виртуальные клавиши, также её можно использовать вместе со стилусом как графический планшет.
«Смартфоночасы» от Motorola и Samsung. Компании показали похожие прототипы, которые сложно отнести к одному классу устройств. В обычном положении они оба выглядят как привычные смартфоны, разве что более вытянутые. Но дисплей в них гнётся сразу в нескольких местах, поэтому их можно обернуть вокруг руки и носить вместо умных часов: в прототипе от Samsung даже встроен датчик пульса на задней стороне.
Нейротелефон от Deutsche Telekom и Brain.ai. Компании привезли на MWC концепт смартфона, в котором нет приложений — все действия можно выполнить через нейросетевого помощника. Он сам выполняет в фоне промежуточные шаги, собирает информацию с разных сервисов и генерирует оптимальный интерфейс. По сути, это аналог Rabbit R1, показанного на CES 2024, но в привычном форм-факторе смартфона.
Прототип минималистичных AR-очков Oppo Air Glass 3. Они выглядят практически как обычные очки, но оснащены проекторами, которые выводят перед глазами информацию, например, уведомления или список дел. А ещё в них есть камера и доступ к мультимодальной нейросети, которую можно спрашивать об объектах перед собой.
Умные часы OnePlus Watch 2. Они стали первыми, использующими новую гибридную платформу Wear OS. В них есть два процессора и две ОС: каждая оптимизирована для фоновой или активной работы. В новой версии Wear OS разработчикам из Google и OnePlus удалось перенести многие задачи, в том числе уведомления, на энергоэффективную часть гаджета. Это позволяет ему работать до 100 часов.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
🗺🤖🏆 Сделали для вас игру с призами — про технологии и географию!
На днях мы случайно обнаружили в Подмосковье садовое товарищество «Техно», а потом, поизучав карту России, нашли ещё несколько топонимов, в которых скрываются слова из мира технологий.
За карточками мы спрятали 9 таких топонимов. Ваша задача — угадать их. Присылайте ссылки на российские технологические топонимы из Яндекс Карт. Кто первым называет любой из скрытых топонимов, получает один из девяти призов — промокод на Плюс с Амедиатекой на 90 дней. После этого мы открываем карточку для всех, и она выбывает из игры.
Ограничения! Комментарии нельзя редактировать, но можно оставлять новые. Один человек может забрать только один приз, независимо от того, сколько правильных ответов он назовет. Приз присуждается только за первый правильный ответ участника. В игре участвуют только те, кто присылает ссылки на место на Яндекс Картах, а не просто названия.
Подсказка 1: помимо СНТ, здесь есть деревни, реки, сёла, станицы и даже один город.
Подсказка 2: увы, деревни Айтишкино на карте России нет.
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.
🌨☀️❄️ Яндекс опубликовал большое исследование о том, как менялась погода в России с 1950 года. Такие исследования помогают бизнесу в долгосрочном планировании деятельности. Собрали в карточках пять впечатливших нас фактов. Увидеть больше данных и посмотреть на интерактивную инфографику можно на странице исследования.
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.
👹💻🌐 Около полувека назад в мире технологий возникла одна из самых живучих городских легенд. Почитайте её историю.
Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.
⭐️ Больше интересного контента про технологии
Хотим делиться с вами не только постами, но и публиковать истории. А ещё предложить уникальные реакции на посты. Чтобы открыть их, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.
🔎 Смотрите, что случайно нашли, когда делали новый материал для ТЕХНО. В 1973 году прошёл международный конкурс на разработку графического воплощения сканируемого товарного кода. 7 апреля 1973 года американский деловой журнал Business Week опубликовал эскизы семи финалистов конкурса и назвал победителя — проект компании IBM, который начали применять с середины 1974-го и используют до сегодняшнего дня.
Подписывайтесь 👉 @techno_yandex
📚🤖 Датасеты состоят из информации, на основе которой алгоритмы учатся распознавать объекты, находить закономерности, прогнозировать результаты и делать множество других вещей. В массив могут входить фотографии, тексты, аудио и вообще любые данные, которые можно показать машине.
Чтобы превратить данные в датасет, нужно провести их разметку, то есть присвоить каждой единице информации определённую характеристику. При разметке учитывается какой-то признак — местоположение, связь с другими объектами, принадлежность к определённой категории и так далее. Например, чтобы нейросеть научилась распознавать животных, её необходимо обучить на датасете, в котором у фотографий кошек будет подпись «кошка», у фотографий собак — подпись «собака» и так далее (вот тут можно понять, как это работает).
Датасеты создавали и до появления нейросетей: ирисы Фишера — это знаменитый набор данных, позволяющий классифицировать виды ирисов в зависимости от их размеров. Другой известный пример, уже из компьютерной эры, — база данных ImageNet. Она состоит из миллионов изображений с описаниями. Её используют для отработки технологий машинного зрения.
Чем больше датасет и чем качественнее разметка — тем более эффективным будет обучение нейросети. Сбор и разметка крупных массивов данных — это длительный и сложный процесс, поэтому разработчики часто используют готовые датасеты, имеющиеся в открытом доступе.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
👨💻Технодайджест недели
Главной техноновостью недели стал анонс нейросети Sora, генерирующей видео по текстовому описанию. Разработчикам из OpenAI удалось совершить прорыв в качестве генерации: многие из роликов, которые показала компания, настолько реалистичны, что отличить их от настоящих можно, только если вглядываться в детали.
Sora основана на архитектуре трансформер, но токены в ней кодируют не слова, а фрагменты кадров видео. При генерации она использует метод диффузии, создающий картинки из визуального шума. Примечательно, что OpenAI рассматривает Sora не только как инструмент для генерации видео, но и как важный шаг на пути к созданию качественной симуляции физического мира.
Пока OpenAI предоставила доступ к Sora только профессионалам в области создания визуального контента, а также специалистам по выявлению рисков и нежелательного поведения нейросетей. Анонс нейросети породил много опасений насчёт развития дипфейков, поэтому вполне вероятно, что выход Sora в общий доступ состоится нескоро.
Другие новости недели, которые показались нам интересными:
Google представила языковую модель Gemini 1.5 Pro. По качеству работы она находится на уровне Gemini 1.0 Ultra и GPT-4, но работает быстрее и расходует меньше ресурсов благодаря архитектуре MoE. А ещё модель получила контекстное окно размером в миллион токенов (у GPT-4 Turbo оно составляет 128 тысяч токенов). Это позволяет нейросети проанализировать в одном запросе всю трилогию «Властелин колец».
Nvidia выпустила приложение для локального запуска языковых моделей. В него встроены две открытые модели: Mistral и Llama 2 13B. Приложение поддерживает работу с локальными файлами и веб-страницами, например, чат-боту можно задать вопрос про содержимое документа.
OpenAI начала тестировать долгосрочную память в ChatGPT. Чат-бот будет запоминать важные факты о пользователе, чтобы учитывать их при генерации ответов. При этом данные можно удалить в настройках.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
Вот как сгенерируют две похожие картинки, тогда и поговорим
Вот как научатся генерировать анимацию, тогда и поговорим
Вот как научатся реалистично, тогда и поговорим
Вот как будут генерировать ролики, тогда и поговорим
––––––––––––––––––––––––––
Вы находитесь здесь
––––––––––––––––––––––––––
Вот как сгенерируют фильм, тогда и поговорим
Вот как получит «Оскар», тогда и поговорим
Все видео в этом посте сгенерированы по текстовым запросам с помощью новой нейросети SORA от OpenAI.
Подписывайтесь 👉 @techno_yandex
🤖🤝🧑 LLM-агенты, работающие на базе больших языковых моделей (LLM), могут стать следующим большим прорывом в области нейросетей, поскольку станут своего рода личными помощниками, которых можно адаптировать под разные потребности.
Подобно человеку в мастерской, LLM-агенты берут те инструменты, которые им нужны для выполнения задачи, предварительно разработав план её решения. Этим они отличаются от простых нейросетевых чат-ботов, которые могут лишь генерировать текст в ответ на текстовый запрос пользователя.
Сценариев использования LLM-агентов множество. Один из самых ярких недавних примеров — Rabbit R1. Это небольшой гаджет с микрофоном, камерой и экраном. У него есть доступ к системе, которая может автономно взаимодействовать с сайтами напрямую, распознавая элементы интерфейса подобно людям, а не используя API. Например, его можно попросить заказать билеты, и он сам найдёт нужный сайт, введёт данные и дойдёт до экрана оплаты.
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex
🙂🤖 Сегодня Яндекс представил новый нейробраузер: он помогает с текстами, рисует картинки, переводит и суммаризирует видео. Подробнее о функциях нового Яндекс Браузера можно почитать тут, а мы решили наглядно разобрать главные функции на примере мема.
Подписывайтесь 👉 @techno_yandex
🤖🤥 Ложная корреляция (англ. Spurious Correlation) — это термин из математической статистики, описывающий случайную зависимость между не связанными между собой событиями.
А ещё так называется интернет-проект, который ищет и публикует примеры таких пар. Spurious Correlations существует уже несколько лет, но недавно создатель проекта попросил нейросеть объяснить самые абсурдные из случайных совпадений — и она справилась!
Подписывайтесь 👉 @techno_yandex
Не пропускайте новости Яндекса тут @yandex