techno_yandex | Unsorted

Telegram-канал techno_yandex - ТЕХНО: Яндекс про технологии

123464

Всё, что может быть интересно медиа про Яндекс: новости, анонсы, заявления, комментарии, инсайды и другие горячие и не очень события ⚡️ PR-команда: pr@yandex-team.ru

Subscribe to a channel

ТЕХНО: Яндекс про технологии

👩‍💻Технодайджест недели

OpenAI представила SearchGPT — прототип своего поискового движка. Сервис, основанный на семействе моделей ChatGPT-4, откроют в тестовом режиме на 10 тысяч пользователей. Он по-разному компонует информацию в зависимости от заданного вопроса — может составить подборку ближайших концертов с короткими описаниями или по пунктам разобрать сложное явление на основе данных из Сети. Кроме того, пользователь может задавать наводящие вопросы. Движок разрабатывался при поддержке The Wall Street Journal, The Associated Press и Vox Media. В планах компании интегрировать его в ChatGPT, а не запускать в качестве отдельного продукта.

Meta* выпустила в опенсорс Llama 3.1 — флагманскую языковую модель на 405 миллиардов параметров с контекстным окном в 128 тысяч токенов, которая превосходит в части тестов лучшие модели от OpenAI и Anthropic. Марк Цукерберг надеется, что к концу года Llama станет самым популярным в мире чат-ботом на базе ИИ, а заодно окажется поворотной точкой для превращения опенсорса в ключевую модель распространения софта в индустрии. Больше подробностей — в нашем посте.

Reddit начал блокировать самые популярные поисковые движки и чат-боты — кроме Google. Сайт, аккумулирующий пользовательский контент и ответы на многие популярные в Сети вопросы, модифицировал файл robots.txt, запретив доступ к своим новым постам популярным поисковикам вроде Bing. Это произошло после заключения контентной сделки с Google на 60 миллионов долларов. Представители Reddit заявили, что вели аналогичные переговоры и с другими компаниями, но не со всеми удалось достигнуть соглашения.

NASA провела успешное тестирование лазерной передачи данных на МКС. Инженеры отправили 4K-видео с находящегося в воздухе самолёта на МКС и обратно. Раньше для этих целей преимущественно использовали радиоволны, но технология на основе инфракрасных лазеров в 10–100 раз быстрее. Благодаря ей с Земли можно будет теоретически наблюдать посадку на Луну в прямом эфире или связываться с удалёнными космическими колониями.

* Объявлена в РФ экстремистской организацией.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🎵🤖🖼 Угадайте песни, которые мы зашифровали с помощью Шедеврума, и выиграйте* бокс с нейросетевым мерчем и умную ленту Яндекса.

Мы взяли строки из 9 популярных треков и попросили Шедеврум сгенерировать по ним картинки. Чтобы выиграть приз, надо назвать все зашифрованные треки и их исполнителей. Комментарии нельзя редактировать, но можно оставлять новые, а также использовать для расшифровки любые технологии и сервисы.

Подсказка: среди треков есть как современные, так и ретро, а записаны они на русском и английском языках.

Кстати, в Шедевруме появилась возможность добавлять музыку к своим генерациям — можно попробовать визуализировать любимые треки, как это сделали мы, и заодно озвучить их.

* отправка приза осуществляется внутри РФ, победитель один — первый, кто даст корректный ответ

Подписывайтесь 👉@techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨🏻‍💻🤖 Учёные из Yandex Research создают новые технологии, помогают внедрять их в сервисы Яндекса и двигают вперёд мировую компьютерную науку.

Недавно они разработали и опубликовали в свободном доступе новый метод сжатия больших языковых моделей, который может уменьшить модель до 8 раз почти без потери качества ответов. Это позволяет запускать их на личных устройствах вроде домашнего компьютера или смартфона.

Статья Yandex Research про этот метод сжатия была включена в программу одной из самых престижных в мире конференций по машинному обучению — ICML 2024. Её подготовили вместе с исследователями из Института науки и технологий Австрии (ISTA) и экспертами ИИ-стартапа Neural Magic.

Денис Кузнеделев — один из исследователей Yandex Research, который участвовал в этом проекте. Поговорили с ним и узнали, как он пришёл в науку и чем увлекается.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Super Retina HD — это OLED? А Apple Intelligence — это ИИ? Узнайте из этого ролика.

Больше таких видео — на наших страницах в techno_yandex">YouTube Shorts и VK Клипах.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👩‍💻Технодайджест недели

В сети появилось видео с рабочим прототипом так и не вышедшего узкого смартфона Essential. Устройство, похожее на шоколадный батончик, было впервые представлено в 2019 году, но так и не поступило в продажу из-за закрытия производителя в 2020-м. Смартфон под названием PH-2 купил на eBay разработчик Роб Уэйнрайт. В коротком ролике он показал, как на устройстве выглядят популярные приложения вроде Uber и Spotify.

Open AI представила GPT-4o Mini. Облегчённая версия GPT-4o полностью заменит GPT 3.5 Turbo для рядовых пользователей, но бизнесу версия 3.5 ещё какое-то время будет доступна через API. GPT-4o Mini уже поддерживает мультимодальность с ответами на основе текста и видео, а позже в неё добавят поддержку аудио и видео. Новая модель набрала 82% в бенчмарке MMLU. Для сравнения: у GPT 3.5 — 70%, а у GPT-4o — 88,7%.

Google досрочно показал Pixel 9 Pro и Pixel 9 Pro Fold. Таким образом компания приостановила уже традиционный парад утечек перед презентацией, запланированной на 13 августа. Тизеры двух смартфонов появились на официальном YouTube-канале компании, где был представлен их внешний вид и названия, но пока без подробностей.

NVIDIA раскрыла технические подробности гигантского экрана-сферы в Лас-Вегасе. Его работа обеспечивается 150 графическими адаптерами Nvidia RTX A6000 с 48 Гб видеопамяти GDDR6 у каждого, а также сложной сетевой инфраструктурой, создающей иллюзию того, что 1,2 миллиона LED-панелей работают как один экран. Контент для сферы производит и тестирует специально созданная Sphere Studios, которая научилась адаптировать для гигантского экрана видео в разрешении 18К — без необходимости склеивать их из нескольких потоков.

В компьютерах на базе Windows произошёл глобальный сбой. Причиной стало неудачное обновление корпоративного антивируса CrowdStrikе: он остановил работу магазинов, аэропортов, телестудий и целых компаний, а очевидцы по всему миру увидели знаменитые «синие экраны смерти» в самых неожиданных местах. Подробнее читайте в нашем разборе.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🟦💀 Прямо сейчас во всём мире происходит сбой Windows. Он затронул работу банков, аэропортов, супермаркетов, больниц, СМИ и компаний.

Что случилось

Сегодня утром компьютерные системы на базе Windows перестали работать во всём мире. Многие авиакомпании были вынуждены отменить рейсы, а аэропорты в США, Европе и Австралии приостановили работу. Британский телеканал Sky News прервал прямой эфир, на Аляске нельзя дозвониться в службу спасения, в МИД ОАЭ вышли из строя компьютерные системы, в Австралии не работают банки, а в Японии люди не могут сделать заказы в McDonald's. На Reddit сбой обсуждают тысячи людей (и расстраиваются, что он произошёл перед выходными).

В чём причина

Проблема — в неудачном обновлении корпоративного антивируса CrowdStrike, который используют компании по всему миру для компьютеров и серверов на базе Windows. Антивирус имеет доступ к ядру системы, поэтому устройства отключаются от сети, не могут загрузиться и переходят в режим аварийного восстановления.

Когда всё починят

Компания CrowdStrike заявила, что остановит обновление, а корпорация Microsoft — что предпринимает «действия по устранению неполадок». Единого мнения о сроках возобновления полноценной работы пока нет. В разговоре с РБК эксперт в области информационной безопасности Алексей Лукацкий сказал, что решить глобальную проблему можно лишь в ручном режиме — перевести устройства в безопасный режим и удалить часть компонентов ПО. Глава компании CrowdStrike Джордж Куртц позднее сообщил, что проблема уже выявлена и найден способ исправления. Он исключил, что инцидент связан с кибератакой.

А что в России

По данным ТАСС, сбой практически не затронул Россию и страны СНГ, так как в них почти не используют облачные сервисы Windows и программы CrowdStrike. Задержки направлявшихся в Европу авиарейсов зафиксировали только в Молдове и Армении. Московские аэропорты работают в штатном режиме.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🟪 Какие самые необычные картинки вы генерировали с помощью генеративных нейросетей? Мы провели исследование и выяснили, что люди часто создают, например, мемы, эскизы татуировок и даже иллюстрации для карт таро.

↗️ Всего нейросетями для создания текстов пользуются 33% россиян, а для генерации картинок — 28%. Исследование о том, кто и как пользуется генеративными нейросетями, читайте на сайте Нейростата.

Подписывайтесь @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

💪🏻🏆🦾 Спидкубингом — сборкой кубика Рубика на скорость — занимаются миллионы людей и десятки роботов. Вспоминаем, как устанавливали рекорды и в какой момент роботы обогнали людей.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👩‍💻 Технодайджест недели

Samsung представил новые складные смартфоны и умное кольцо. Компания обновила процессоры и дизайн «раскладушек» Galaxy Z Fold и Z Flip, а также встроила в них новые нейросетевые функции, например, возможность дорисовать объект на фотографии с помощью диффузионной нейросети. Кроме смартфонов, Samsung представила умное кольцо, отслеживающее активность, и обновила линейки часов и наушников.

Учёные изучили влияние генеративных нейросетей на креативность. В исследовании приняли участие почти 300 человек, которых просили писать текстовые истории. Часть придумывала идеи самостоятельно, а часть — с помощью GPT-4. Исследователи пришли к выводу, что доступ к генеративной нейросети усиливает индивидуальную креативность, позволяя писать более качественные и интересные тексты, но снижает разнообразие контента: истории, написанные с помощью нейросети, были более похожими друг на друга, чем те, которые люди писали полностью самостоятельно.

Nothing выпустила «модульный» смартфон CMF Phone 1. На его задней крышке есть винтовые крепления для аксессуаров: сама компания выпустила картхолдер, ремешок и подставку для горизонтального положения, но пользователи уже начали печатать на 3D-принтерах и другие «модули». Кроме того, у смартфона легко заменяется задняя крышка.

Google оснастила робота мультимодальной нейросетью. Инженеры компании подключили исследовательского робота к нейросети Gemini 1.5 Pro, которая умеет анализировать видео. Они сняли ролик с обзором помещений, а затем давали роботу задания. Например, спрашивали, где можно зарядить гаджет, а робот «вспоминал» с помощью нейросети расположение розетки и показывал человеку путь к ней.

Logitech выпустила беспроводную мышь с беспроводным питанием. Она работает либо от одной батарейки типа AA, либо без неё, питаясь от специального коврика, передающего энергию на мышь.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔮📺 Наш сериал о технологиях фантастических вселенных продолжается. Мы рассказывали про «Дюну», Fallout, «Звёздный путь» и «Кин-Дза-Дза». Сегодня — хоть это, скорее, космическое фэнтези, а не научная фантастика — «Звёздные войны».

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

⚡📱 Если вы разряжаете гаджет до нуля, чтобы зарядить, этот пост для вас. Развеиваем популярные заблуждения о зарядке смартфона.

Заряжать смартфон нужно после полной разрядки

Этот принцип работал раньше, когда в устройствах использовались никелевые батареи с эффектом памяти — для них был важен полный цикл зарядки и разрядки. Сейчас в смартфоны чаще ставят литий-ионные аккумуляторы (Li-ion), их лучше не разряжать ниже 20%. При частой зарядке от предельно низких отметок до максимальных устройство может греться и быстрее выходить из строя.

❌ Не стоит оставлять заряжаться телефон на ночь

Ещё один миф, связанный со старыми аккумуляторами. Те действительно могли взять слишком много заряда и выйти из строя. В Li-ion батареях есть чип, который перестаёт подавать напряжение, когда достигнут нужный уровень.

В современных смартфонах есть функция оптимизированной ночной зарядки. Телефон будет заряжаться примерно до 80% в течение ночи и достигнет 100% перед тем, как вы отключите провод утром. Это помогает уменьшить время на полной зарядке, что может увеличить срок службы батареи.

Зарядник должен быть только оригинальным

Производители перестраховываются и рекомендуют заряжать устройство проводом и блоком из комплекта. Но современные гаджеты контролируют силу тока, и заряжать можно кабелем и блоком любого производителя с подходящим устройству напряжением (для большинства смартфонов это 5 B). Также многие смартфоны поддерживают стандарт Power Delivery. В нём блок питания адаптирует свои напряжение и ток в соответствии с требованиями подключённого устройства.

Нельзя пользоваться смартфоном во время зарядки

Это необязательно, но лучше снизить энергопотребление на это время. Если запустить тяжёлую игру во время зарядки, смартфон может сильно греться, а это плохо скажется на здоровье аккумулятора.

Быстрая зарядка вредит батарее

Быстрая зарядка не испортит смартфон — датчики и чипы следят за силой тока и нагревом. Действительно могут навредить батарее экстремальные температуры, поэтому под подушкой заряжать устройство не стоит.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍💻 Технодайджест недели

Acemagic представила ноутбук с двумя экранами. В отличие от других двухэкранных устройств, в нём используется привычный форм-фактор, а дополнительный дисплей расположен слева, а не сверху.

В Японии установили рекорд по скорости интернета — 402 терабита в секунду. Команда инженеров провела эксперимент, использовав коммерчески доступный оптоволоконный кабель, и смогла превысить предыдущий рекорд на 25 процентов — ранее он составлял 301 терабит в секунду.

В Яндекс Клавиатуре появились генеративные нейросети. YandexGPT помогает с текстами: может проверить на ошибки, улучшить стиль или расставить подходящие эмодзи. А YandexART позволяет сгенерировать фон для клавиатуры, описав желаемую картинку в несколько слов.

Нейросеть Gen-3 Alpha стала общедоступной. Она умеет генерировать видео и изображения по текстовому описанию. Модель доступна только по подписке: со стандартным тарифом за 15 долларов в месяц можно сгенерировать ролики суммарной длительностью около минуты.

Домашние роутеры Wi-Fi превратили в систему сигнализации. Компания Gamgee разработала систему из роутеров, которая создаёт mesh-сеть для устойчивой работы беспроводного интернета, а также работает как система сигнализации, анализируя искажения сигналов Wi-Fi. В первые две недели она запоминает паттерны движений хозяев дома и питомцев, а затем может сообщать владельцам, если обнаруживает посторонних людей.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🙂 Популярные сериалы — вроде «Рика и Морти» или «Теории Большого взрыва» — могут идти годами или даже десятилетиями. За это время над эпизодами успевают поработать десятки сценаристов, и чтобы характеры героев оставались цельными, шоураннеры обычно создают «библии персонажей». Это внутренний документ, в котором чётко прописано, как устроен внутренний мир героя: что он или она любит, чего боится, чего ни при каких обстоятельствах никогда не сделает.

У Алисы тоже есть своя «библия персонажа». Мы изучили её и выбрали несколько интересных характеристик виртуального ассистента.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Спросили у 🔘🔘, что такое Li-Fi ⬆️

В качестве передатчика в Li-Fi-системах выступает светодиод, который мерцает с высокой частотой, превращая таким образом любые данные (видео, аудио, изображения, текст) в двоичный код. Это мерцание незаметно и безвредно для человеческого глаза, но воспринимается Li-Fi устройствами, которые оснащены фотодетекторами.

У такого способа передачи данных есть несколько преимуществ:
🟡 Скорость теоретически может быть в 100 раз выше, чем скорость сетей Wi-Fi.
🟡 Точку доступа можно встроить в любой источник света, что упрощает развёртывание сетей Li-Fi.
🟡 Свет не создаёт помех для устройств, использующих радиоволны, в том числе Wi-Fi.
🟡 Свет не проникает сквозь стены, что даёт сетям Li-Fi в закрытых помещениях дополнительную защиту от взлома.

Недостатки у технологии Li-Fi тоже есть. Например, ограниченный радиус действия, связанный с тем, что передатчик и приёмник должны находиться в зоне прямой видимости. Кроме того, использование Li-Fi требует постоянно включённого света (хотя его яркость можно уменьшить до минимума), а другие источники освещения могут мешать работе сети.

Технология Li-Fi — относительно новая. Впервые её представил профессор Университета Стратклайда Харальд Хаас на конференции TED Global Talk в 2011 году, а в 2023-м она была официально стандартизирована.

Такие сети пока ещё не распространены, но Li-Fi устройства уже доступны. Например, компания BMW проводила на своём производстве эксперимент по внедрению Li-Fi с использованием инфракрасного света. Это значит, что сети Li-Fi могут применяться, в числе прочего, и на тёмных фабриках, о которых мы недавно рассказывали.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🔍 Держите подборку самых интересных материалов, которые мы выпустили в прошлом месяце:

🟡 Какие числа больше всего любят нейросети

🟡 Когда (с точностью до минуты) впервые использовали штрихкод

🟡 Как устроены фабрики, которые работают без света

🟡 Почему исчезли flash-игры

🟡 Как устроена вселенная «Звёздного пути» с точки зрения технологий

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🌐👾 Наш сериал о технологиях фантастических вселенных продолжает Cyberpunk 2077.

А если пропустили предыдущие серии, вот они: «Дюна», Fallout, «Звёздный путь», «Кин-Дза-Дза» и «Звёздные войны».

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉@techno_yandex и @igrapoisk

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🔍 Рассказываем, как и какими инструментами можно отличить сгенерированный контент от созданного человеком.

📝 Текст

Помогут сервисы Copyleaks, AI Content Detector, Gptzero, Writer, Contentatscale и Originality. Часть из них — платные и лучше работают с английским. Сгенерированные тексты не содержат грамматических ошибок, в них нет резких эмоциональных высказываний, но могут быть противоречия, так как нейросеть забывает, о чём писала раньше.

🖼 Изображения

Тут помогут сервисы AI or Not, Illuminarty.ai или Maybe's AI Art Detector.

Также обращайте внимание на такие параметры, как:

Искажения и артефакты в деталях и текстурах. Неестественные элементы можно увидеть в областях рук, глаз, на фоне.
Недостаток деталей указывает на сгенерированное изображение.
Лица на сгенерированных изображениях слишком симметричны либо неестественно асимметричны.
— Нейросети рисуют несуществующие модели смартфонов и другой техники.
— В метаданных файла иногда можно найти информацию о создавшем картинку сервисе. Шедеврум, например, ставит в приложениях визуальные метки на всех сгенерированных картинках.

📹 Видео

Чтобы распознать дипфейки с использованием реального материала, присмотритесь к лицу. Его движения могут не совпадать с движениями тела, и лицо может иметь неестественные тени.

В целиком сгенерированном ролике обратите внимание на следующее:

Объекты-призраки, способные появляться в кадре и исчезать.
Детали-оборотни, которые могут меняться по ходу ролика.
Объекты на заднем плане могут двигаться неестественно, сливаться или дублировать друг друга.

🔊 Музыка

Здесь специальных инструментов или рекомендаций совсем немного. В целом сгенерированная музыка звучит менее органично из-за ограничений в обработке звука и выборе инструментов. Однако обмануть человека с музыкой проще всего. Используйте интуицию — часто только она и может помочь.

👌 И если вы пришли из наших сторис: настоящее фото снизу.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉@techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🤖 Meta* выложила в опенсорс Llama 3.1 — флагманскую языковую модель на 405 миллиардов параметров (для сравнения у GPT-4o — 175 миллиардов) с контекстным окном в 128 тысяч токенов и улучшенной поддержкой 8 языков.

Модель в течение нескольких месяцев обучали на 15 триллионах токенов и более 16 тысяч видеокарт NVIDIA H100.

По оценке самой компании, LLama 3.1 сопоставима по качеству ответов с флагманскими закрытыми моделями конкурентов. Например, в человеческой оценке она проигрывает GPT-4o в 29,2% случаев, в 51,7% достигает паритета, а в 19,1% даёт лучший ответ.

Компания также обновила свои модели на 8 и 70 миллиардов параметров — также с размером контекста 128K, заметно повысив качество их работы, и впервые открыла возможность для стороних компаний тренировать свои языковые модели на базе ответов LLama.

*признана в России экстремистской организацией

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🤝🔍 В конце 2022 года, когда вышел ChatGPT, многим казалось, что он сможет заменить привычный поиск. Полтора года спустя стало ясно, что всё не так просто.

Нейросети vs поиск

В отличие от классической поисковой выдачи, состоящей из ссылок и быстрых ответов, чат-бот в ответ на запрос генерирует подробный и структурированный текстовый ответ. Многим такой сценарий использования понравился, и компания Google почти сразу начала рассматривать ChatGPT как угрозу для своей бизнес-модели. Но вскоре стало ясно, что у языковых моделей есть недостатки: их знания о мире ограничены датой обучения, а ещё они склонны к галлюцинациям — правдоподобной имитации фактов, которую не всегда можно заметить.

Нейросети + поиск

После этого компании начали интегрировать большие языковые модели в классический поиск, чтобы пользователи могли получать готовые ответы, основанные на актуальной информации. Первым стал Bing от компании Microsoft, у которой был эксклюзивный доступ к GPT-4. Яндекс запустил тестирование быстрых ответов на базе модели YandexGPT в сентябре прошлого года, а весной 2024-го представил Нейро — сервис, объединивший в себе поисковый движок и нейросети. Он анализирует запрос, изучает поисковую выдачу, выбирает несколько подходящих источников и с помощью YandexGPT 3 объединяет информацию в один связный ответ. Такой подход позволил взять лучшее от обеих технологий: Нейро отвечает на сложные вопросы и позволяет уточнять детали в диалоге (как чат-бот), но не придумывает факты, а ищет информацию в интернете и всегда ссылается на источники.

Что будет дальше?

Поисковики объединяют не только с языковыми моделями, но и с мультимодальными нейросетями, которые, помимо текста, умеют обрабатывать изображения, видео, аудио и другие форматы. Например, Нейро может ответить по картинке на вопрос «Кто и в каком году построил это здание». А прототипы мультимодальных ассистентов от Google и OpenAI умеют анализировать видео с камеры в реальном времени, правда, пока недоступны для пользователей.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👮‍♂️🤖 Новые технологии способны облегчить труд человека практически во всех отраслях. Одно из немногих исключений — архив Штази, одной из самых репрессивных спецслужб в истории. Рассказываем историю 55 миллионов порванных в клочки документов, восстановить которые машинам оказалось пока не под силу.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤟🏻👩‍🎤🎸 Система персональных рекомендаций Моя волна в Яндекс Музыке научилась различать сотни нишевых музыкальных жанров — от буги-вуги до краст-панка. Рассказываем, как это сделали и зачем это нужно.

Как обучали волны по жанрам

Обучать алгоритм помогали приглашённые эксперты в области музыки. Среди них музыкальные журналисты Ляля Кандаурова и Антон Вагин, пианист и композитор Николай Мищенко и многие другие. Они выбрали из каталога Яндекс Музыки примеры треков, соответствующих 400+ музыкальным жанрам, которые заранее выделила редакция сервиса.

На основе этой выборки разработчики создали ML-разметку и обучили нейросеть. Она пытается следовать логике экспертов и определяет принадлежность трека к конкретному музыкальному направлению.

Какие факторы учитываются в первую очередь

👯‍♀️ Коллаборативность. Модель учитывает, какие треки слушают пользователи, предпочитающие музыку конкретного жанра.

🎛️ Аудиовекторы. Это описание звучания трека в виде небольшого набора чисел. Чем больше треки совпадают по тембру голоса вокалиста, набору инструментов, манере исполнения, музыкальному размеру, тем более похожими будут их аудиовекторы.

При этом в жанровых волнах также работает персонализация. Музыка будет подбираться с учётом вкуса конкретного пользователя.

Зачем всё это нужно

Это ещё один сценарий поиска новой музыки. У жанров в Яндекс Музыке есть список похожих направлений и знаковых альбомов, и на них можно переключиться. Многие пользователи впервые узнают, как называются даже те жанры, которые они слушают уже давно.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🧠 Кажется, что искусственный интеллект, нейросеть и модель машинного обучения — синонимы, но это не совсем так. Объясняем, в чём отличие.

Больше таких роликов — на наших страницах в techno_yandex?erid=3apb1Qrwwr2uBg1SxqhhemuswyyWcebtLPKdBBZznviXp">YouTube Shorts и VK Клипах.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🪦🧟 Время кладбищенских историй! Рассказываем о первом крахе игровой индустрии, в центре которого внезапно оказался «Инопланетянин» Стивена Спилберга.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🚕 Каждую минуту в службу поддержки Яндекс Такси приходят сотни обращений от пользователей и водителей. С таким объемом не справиться без технологий — ML-сортировки, роботов-автоответчиков и предсказательных моделей.

В новой серии «Антологии технологий» рассказываем про службу поддержки, искусственный интеллект, человеческую эмпатию и технологии, которые скрыты по ту сторону чата с оператором. Смотрите на YouTube и Кинопоиске.

Подписывайтесь @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖📖 Нейросети обучают на датасетах, состоящих из гигантских объёмов текстов — новостях, архивах изданий, открытых обсуждениях в соцсетях. Объём этих данных огромен, но конечен. Чем будут «питаться» нейросети, когда данные закончатся?

Сколько данных нужно для обучения?
Лидирующие большие языковые модели используют наборы данных с десятками триллионов слов, и с каждым новым релизом их нужно больше. По подсчётам Epoch AI, в интернете содержится около 500 триллионов токенов (частей слов или целых слов в понятном для машин виде). Но если отфильтровать некачественный контент, останется 100 триллионов.

Когда данные закончатся?
Epoch AI считают, что технологические компании исчерпают запас общедоступных текстовых данных с 2026 по 2032 год, если сохранятся текущие темпы развития и тренд на «избыточное обучение» (использование большего количества данных, чем требуется).

Если данные закончатся, языковые модели перестанут учиться?
Нет, но обучение моделей станет более медленным и будет зависеть от скорости появления новых данных. Правда, объёмные публичные данные важны только на этапе предобучения. На этапе дообучения, на котором нейросети учатся следовать инструкциям на примерах от AI-тренеров, они не играют такой роли.

Модели можно обучать на чём-то ещё?
🟡 На нетекстовых данных, например видео и подкастах. Обучая GPT-4, OpenAI расшифровала более миллиона часов видео с YouTube. Правовые ограничения, охраняющие такие данные, — предмет обсуждения в настоящем и будущем.

🟡 На данных «глубокого» интернета — неиндексированных страницах и постах в социальных сетях. Контента из соцсетей примерно в 10 раз больше, чем открытых данных. Но использовать такие данные сложно из-за их конфиденциальности и ограничений платформ.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📱🛠 Бренд Nothing, выпускающий необычные смартфоны, представил новую модель CMF Phone 1. Её особенность в том, что пользователь может самостоятельно снабдить смартфон дополнительными модулями, которые прикручиваются прямо к корпусу. Например, подставкой или кардхолдером.

Это не первая попытка сделать смартфоны модульными и дать пользователям возможность комплектовать их дополнительным оборудованием на выбор. Собрали в карточках пять самых интересных проектов.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍🦰💻 Решили посмотреть, какие самые старые гаджеты есть дома у редакции ТЕХНО. Наши находки — в карточках, а вы покажите в комментариях свои ретроустройства.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🙂 Вы наверняка часто общаетесь с Алисой, и у вас есть своё представление о её характере и личности. Расскажите в комментариях, какая она.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔤🤖 Яндекс запускает большой проект — в течение трёх лет в Яндекс Переводчике появятся более 20 новых языков народов России. Первый из них — осетинский — уже доступен пользователям. Также в сервисе появилась поддержка распознавания и синтеза речи для татарского языка, а позже она распространится на другие языки народов России. Рассказываем, почему создание перевода для языков с небольшим количеством носителей — такая сложная задача.

Как работает машинный перевод
В первую очередь — с помощью нейросетей, и Яндекс Переводчик не исключение. Чтобы научить нейросеть переводить, ей показывают параллельные тексты — фрагменты одинакового текста на двух языках. Во время перевода одна нейросеть (энкодер) конвертирует исходный текст в абстрактное представление в виде чисел, а другая (декодер) использует это представление для генерации перевода.

Почему малые языки сложнее
Нейросети не хватает данных — чем больше информации, тем она быстрее учится и реже ошибается. Для этого требуются миллионы пар оригинал/перевод, и для больших языков такие примеры легко найти — на них переведены тысячи известных книг, и нейросеть учится, сравнивая текст с оригиналом. Но для малых языков такого количества текстов не существует — поэтому их называют малоресурсными.

Как решают эту проблему
На помощь приходит лингвистическое сообщество: энтузиасты помогают собирать тексты для обучения. Также улучшать перевод помогают знания о схожих языках. Так, в Яндекс Переводчике одна модель переводит с татарского, якутского и чувашского на русский. Дело в том, что всё это — тюркские языки. Создание единой модели для родственных языков позволяет собирать большой набор параллельных текстов и в итоге добиваться более высокого качества, чем при обучении отдельных моделей для каждого языка.

Подробнее о том, как нейросети учатся переводить на малые языки, мы рассказывали в журнале ТЕХНО.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👩‍💻 Технодайджест недели

Закрылся мессенджер ICQ. Он запустился в 1996 году, а в 2000-е годы стал одним из самых популярных способов общения в рунете. О том, что ICQ закроется, стало известно ещё в мае, а 26 июня сервис завершил работу.

Вышла первая реклама, созданная с помощью Sora. Сеть магазинов игрушек Toys "R" Us опубликовала ролик, в котором показывается, как юный основатель бренда вдохновился на его создание. Основа для ролика была сгенерирована нейросетью, а всего в создании ролика приняли участие около десяти человек.

В сервисе генерации видео Luma Dream Machine появилась интерполяция между кадрами. Это позволяет задать первый и последний кадр ролика, после чего нейросеть генерирует кадры между ними так, чтобы получался плавный переход. Сразу после запуска многие пользователи проверили работу сервиса, объединив два или множество мемов в один сюжет.

Языковую модель встроили в шрифт. В файле формата TTF содержится сама модель размером 15 миллионов параметров и библиотека для её запуска. Это позволяет использовать её прямо в приложениях, где есть возможность выбора шрифта, например, Adobe Photoshop или Firefox. Для этого необходимо выбрать в настройках шрифт, набрать промпт и добавить множество восклицательных знаков, которые являются командой для начала генерации текста.

В Google Translate добавили 110 языков. Среди них есть более 10 языков, распространённых в России. Google отмечает, что для этого использовалась большая языковая модель PaLM 2.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…
Subscribe to a channel