techno_yandex | Unsorted

Telegram-канал techno_yandex - ТЕХНО: Яндекс про технологии

123464

Всё, что может быть интересно медиа про Яндекс: новости, анонсы, заявления, комментарии, инсайды и другие горячие и не очень события ⚡️ PR-команда: pr@yandex-team.ru

Subscribe to a channel

ТЕХНО: Яндекс про технологии

🤖 Технодайджест недели

Яндекс представил большое обновление Алисы и новые устройства. Алиса научилась рассуждать перед ответом, работать с файлами, распознавать увиденное через камеру смартфона и свободно говорить по-английски. Также на презентации показали новые устройства: портативную Станцию Стрит, Станцию Мини 3 Про со съёмными модулями, версию Станции Лайт без часов и умную IP-камеру для дома.

OpenAI выпустила пять больших языковых моделей. У компании было два релиза на неделе. Первый — семейство из трёх моделей GPT-4.1 разного размера. Они прокачались в программировании, поддерживают контекст до миллиона токенов и лучше следуют указаниям пользователя. Модели предназначены для разработчиков, использующих инструменты вроде Cursor, поэтому они не появятся в ChatGPT и доступны только по API.

Второй и самый большой анонс — рассуждающие модели o3 и o4-mini. o3 заняла первое место на большинстве бенчмарков. o4-mini показывает результаты чуть похуже, но и стоит она намного меньше и работает быстрее. Одна из особенностей новых моделей заключается в том, что они могут использовать все инструменты ChatGPT прямо во время рассуждений — искать в интернете, писать и исполнять код и даже кадрировать или поворачивать картинки, чтобы разглядеть на них важные детали. o4-mini уже доступна даже в бесплатной версии ChatGPT, а o3 — только для платных подписчиков.

Китайская компания Readmoo разработала первую читалку на электронных чернилах с гибким экраном. Экран не только гибкий, но и цветной, отображающий более 50 тысяч оттенков. Разработчики обещают, что книжка выдержит 200 тысяч сгибаний. Цена и дата выхода пока не объявлены.

Xiaomi выпустила умный кондиционер с двумя радарами. Они нужны, чтобы кондиционер мог обнаруживать людей в комнате и направлять потоки воздуха на них, а если людей вообще нет — переходить в экономный режим, чтобы не тратить энергию впустую. Устройство пока выпущено только в Китае по цене около 45 000 рублей.

eufyMake выпустила принтер для печати объёмных рисунков на чём угодно. Он может наносить изображения почти на любые поверхности — дерево, металл, стекло, пластик, кожу. Главная фишка — он умеет делать изображение текстурным, с рельефом высотой до 5 мм. Например, можно имитировать поверхность масляной картины или напечатать рельефный рисунок на чехле для смартфона.

В Пекине прошёл первый полумарафон с участием человекоподобных роботов. Победителем стал Tiangong Ultra, пробежавший 21 километр за 2 часа 40 минут. Во время забега ему потребовалось три замены аккумуляторов. Всего в забеге участвовал 21 робот, но финишировать смогли только четверо.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

💾 Технологии устаревают слишком быстро!

Напишите технофразу, которую точно не поймут 20-летние. Мы начнём: положи трубку — мне в интернет надо, скинул по ИК-порту, скачал рингтон по WAP.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍💻 Заменят ли нейросети разработчиков?

В новом выпуске «Технорепорта» обсуждаем, что такое вайб-кодинг, как он меняет программирование и есть ли опасность растерять навыки из-за нейросетей.

Смотрите здесь, на YouTube или в VK Видео.

00:00 — Вступление
00:36 — Что такое «вайб-кодинг»?
01:40 — Автодополнение кода vs. вайб-кодинг
03:25 — Вызывает ли ИИ зависимость?
05:16 — «Ты с ней тупеешь»
06:56 — «Заменить инженера не выйдет!»
09:04 — Что теперь будет с кодингом
09:53 — «Контекст не может быть погружен в языковую модель»
11:10 — Каким будет новый программист?

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🙂 Главные анонсы с большой конференции Алисы и умных устройств: новые умения AI-ассистента, колонки, сценарии умного дома и фишки ТВ Станций, а также новости про Яндекс Авто.

Подписывайтесь 〰️ @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔮👀 На Марсе появятся колонии, а ИИ обретёт чувства

Наш мини-сериал про прогнозы фантастов продолжает Артур Кларк, в творчестве которого много футуристических прогнозов. Смотрим на них из настоящего и сравниваем с реальностью.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔴 Наш метод сжатия больших языковых моделей приняли на NAACL, одну из крупнейших конференций по ИИ. Метод HIGGS сжимает LLM на телефонах и ноутбуках и при этом сохраняет качество моделей. Эксперименты показали, что HIGGS сжимает языковые модели лучше аналогов.

↗️ Метод разработали учёные из лаборатории Yandex Research совместно с НИУ ВШЭ, MIT, KAUST и ISTA. Он выложен в открытый доступ на Hugging Face. Подробнее о HIGGS можно прочитать в научной статье на arXiv.

Подписывайтесь 〰️ @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🗺 В Яндекс Картах появилось новое поколение персональных рекомендаций — они находятся прямо на главном экране приложения в виде ленты и фотометок. Новая система рекомендаций работает на базе нейросети, помогающей лучше узнать предпочтения пользователей. Вот как это работает.

Как устроены новые рекомендации в Картах?

В Яндекс Картах есть тысячи разных локаций, например рестораны и кофейни, парки и музеи. Алгоритмы Карт изучают их и предлагают пользователю те, которые ему подойдут с большей вероятностью. Теперь с этим помогают нейросети.

Что изменилось?

Раньше алгоритмы анализировали поведение пользователя по набору фиксированных признаков. На основании построенных маршрутов, просмотров карточек организаций, отзывов Карты давали пользователю рекомендации. Теперь анализировать интересы пользователя помогает нейросеть-трансформер.

Она учитывает не только сами события, но и их последовательность, за счёт чего может находить связи между ними. Для этого действия пользователя представляют в виде эмбедингов — числовых векторов — и анализируют нейросетью. Это помогает выявлять неочевидные закономерности и учитывать их в рекомендациях.

Можно пример?

Представим, что в один из дней пользователь занимается английским, после чего идёт в бар с одногруппниками, а в другой — гуляет с ребёнком в парке, а потом ведёт его в кино. Старая модель будет случайным образом рекомендовать этому пользователю аналогичные локации. Трансформер же учтёт контекст и поймёт, что бары стоит рекомендовать после языковой школы, а кинотеатры — после парка.

Что в итоге?

Теперь, благодаря нейросетям, Карты лучше адаптируются к изменению интересов пользователей, анализируют их действия и точнее подбирают локации.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🧠 Когда появится AGI?

В конце прошлой недели группа исследователей опубликовала подробный прогноз о развитии искусственного интеллекта. Согласно ему, самовоспроизводящийся ИИ-агенты, способные принимать решения, фактически возьмут под контроль большинство технологических и экономических отраслей уже к 2030 году.

Собрали прогнозы лидеров отрасли о том, когда ждать полноценного AGI.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🗜🗂🦾 Сценаристы придумали технологию специально для сериала, а разработчики стали использовать её в реальной жизни. Вот эта история.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖 Технодайджест недели

↗️ OpenAI добавила в ChatGPT новый режим генерации картинок

↗️ Ideogram и Reve представили новые нейросети для создания изображений

↗️ Google выпустила нейросеть Gemini 2.5 Pro

↗️ Вышел минималистичный смартфон Light Phone III

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Мы часто обсуждаем необычные гаджеты между собой в редакции, а сегодня хотим поделиться с вами. Вот шесть не самых очевидных гаджетов, которые произвели на нас впечатление за последнее время.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📺 Искусственный интеллект уже заявил о себе на премии «Оскар» и постепенно меняет киноиндустрию. Как это происходит и что об этом думают сами представители индустрии — разбираемся в первом выпуске «Технорепорта». Смотрите его в Telegram, YouTube и VK Видео.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🥹 Ищем владельца для кастомной Станции Миди в дизайне ТЕХНО. Подробности — в карточках.

А 25 и 26 апреля Яндекс приглашаем всех желающих в Repair Cafe — собираем тех, кто обладает инженерным складом ума, любит технологии и работу с отверткой и паяльником.

В мастерской можно будет разбирать и чинить гаджеты, в том числе ПК «Ленинград», под руководством опытных наставников. А ещё в Repair Cafe будут рассказы инженеров, например, о том, как сделать устройство для чтения ДНК напильником. Мероприятие бесплатное, но нужно зарегистрироваться здесь.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Знак ⌘ многие знают как кнопку Command на ноутбуках Apple, но его история начинается гораздо раньше. Около 2 500 лет назад на территории Скандинавии его использовали как защитную руну. В 20 веке ⌘ начали использовать для обозначения достопримечательностей на картах (он напоминал вид замка сверху), а позже его выбрали для главной клавиши MacBook, потому что Стив Джобс не хотел использовать логотип Apple по аналогии с кнопкой Windows.

Код ⌘: U+2318

На этом заканчивается первый сезон сериала про уникальные символы из международного стандарта Unicode. Если вам понравилось, там ещё много интересных глифов, о которых мы расскажем в следующем сезоне.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📞 Пёс Батон интересуется: а у вас установлен определитель номера от Яндекса?

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Продолжаем вместе с ТЕХНО рассказывать о самых интересных технологиях и концептах, которые перевернули мировой автопром.

В этот раз поговорим о Plymouth XP-VIP. У него было всё, без чего трудно представить современный автомобиль... Вот только показали его в 1965 году. Выкручиваем ретрофутуризм на максимум!

Достоин аппарат роли в фильме про будущее?

👍 — да, для своего времени это была пушка
🤔 — идеи смелые, но реализация...

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍✈️ Вместе с Авто.ру продолжаем сериал о технологиях в автомобилях, опередивших время. Мы уже рассказывали про первый навигатор, а сегодня — Cadillac Seville 1978 года с компьютером на борту.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex × @carsnosleep

Читать полностью…

ТЕХНО: Яндекс про технологии

🤥🤖 Языковые модели могут придумывать факты — они лишь подбирают наиболее подходящие слова для ответов, а оценка адекватности этих ответов всегда на стороне пользователя. Так можно ли доверять нейросетям?

🔹 Обычные языковые модели

Степень доверия: ★★☆☆☆


Чат-боты довольно часто галлюцинируют из-за недостатка данных, неумения учитывать контекст или нечёткого запроса. Поэтому их ответы стоит перепроверять — кроме случаев, когда достоверность неважна (например, если нейросеть пишет сценарий праздника).

🔹 Рассуждающие языковые модели

Степень доверия: ★★★☆☆


Такие модели разбивают запрос на серию мелких задач и решают их по порядку, проверяя себя на каждом этапе. Это уменьшает количество логических ошибок и делает ответ точнее, но не избавляет от галлюцинаций полностью.

🔹 Языковые модели с доступом к интернету

Степень доверия: ★★★☆☆


В режиме поиска, который есть у многих чат-ботов, модель собирает ответ на основе данных из интернета. В этом случае именно галлюцинаций становится гораздо меньше, но стоит проверять надёжность источников, которые использовала модель.

🔹 Чат-боты с функцией Deep Research

Степень доверия: ★★★★☆


Нейросети с функцией расширенного исследования (Deep Research) проводят глубокий поиск в сотнях источников, анализируют данные, рассуждают, делают выводы и возвращаются к поиску, если информации оказывается недостаточно. Функция относительно новая и поэтому не всегда работает хорошо, но доверие к таким нейросетям выше.

🔹 Нейросети с RAG по данным пользователя

Степень доверия: ★★★★★


Они генерируют ответы, используя данные, добавленные пользователем, например документы, видео, базы данных. В таких сервисах обычно есть дополнительные механизмы самопроверки, а модели учат как можно точнее передавать информацию из источников. Они галлюцинируют реже всего, и если пользовательские данные точны, то и генеративным ответам можно доверять.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤔💬 Алиса научилась рассуждать. Теперь она может решать задачи поэтапно, превращая их в последовательность связанных между собой шагов. Разбираемся, для чего это нужно и когда режим рассуждений работает лучше всего.

Что это за режим?

В режиме рассуждений языковая модель не просто пишет ответ, а разбивает пользовательский запрос на несколько простых задач и решает их последовательно, проверяя себя на каждом этапе. Это сокращает количество ошибок и делает ответы точнее.

Как это устроено?

Запрос пользователя обрабатывают с помощью технологий Алисы
Затем запрос оптимизируют с помощью рефразера и превращают в промт для рассуждающей модели
Промт отправляют в рассуждающую модель
Модель строит цепочку рассуждений и выдает ответ, при этом ход ее мысли виден пользователю

Рассуждения надо читать?

Необязательно — можно просто дождаться финального ответа. Но это хороший способ понять, как рассуждает нейросеть. А если вы заметите ошибку, в следующем промте можно попросить скорректировать ее.

Когда надо включать режим рассуждений?

Этот режим подходит для:
сложных вопросов без очевидного решения
задач, требующих логических рассуждений (например, математических)
создания стратегий и планов
анализа противоречивых данных
обработки больших объемов разрозненной информации.

Если нужен простой ответ, художественный текст, пересказ, обобщение материала или диалог с чат-ботом, режим рассуждений лучше отключить.

Где это попробовать?

В рассуждающей функции чата с Алисой пользователь может протестировать бета-версию новой YandexGPT 5 с режимом рассуждений. Также для теста доступна опенсорсная модель, интегрированная вместе с архитектурой и технологиями Алисы.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖 Технодайджест недели

Microsoft научила Copilot в Windows видеть экран. Обновление появилось в тестовых версиях Windows. Ассистент в них теперь может анализировать информацию и помогать осваивать программы — он умеет выделять детали интерфейса на экране и давать комментарии голосом.

Похожую функцию на этой неделе Google выпустил на Android, добавив зрение в Gemini. У компании, кстати, выдалась большая неделя с несколькими анонсами. Самый громкий из них — чип Ironwood, предназначенный для работы нейросетей. Инженеры серьёзно поработали над производительностью и пропускной способностью, добавили памяти и в итоге получили конкурента передовым ускорителям Nvidia B200.

Ещё один релиз Google — открытый протокол A2A. По сути, это универсальный язык общения для ИИ-агентов от разных разработчиков. С его помощью агенты могут обмениваться информацией и координировать свои действия. Протокол открытый, и Google заявляет, что его поддержали уже более 50 компаний, включая, например, Salesforce и SAP.

Vivo показала фотоаксессуары для нового флагмана X200 Ultra. Это чехол с удобным хватом, кнопками для съёмки и дополнительным аккумулятором. На чехле есть крепление для огромного объектива длиной примерно с сам смартфон. Он даёт дополнительный оптический зум 8,7x и гибридный до 70x.

Последняя новость тоже из Китая — производитель роботов Unitree показал, как его роботы боксируют с людьми и друг с другом. Но неизвестно, делают ли они это автономно или под управлением человека. Через месяц компания обещает провести стрим с полноценным боем роботов.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🥹 Мы в восторге от устройств, которые вы прислали на конкурс кастомных гаджетов! Поэтому решили наградить не одного, а трёх победителей. Станции Миди в дизайне ТЕХНО получают:

🏆
@kintolayli — за электроскейт

🏆
@DesperateMaker — за Буханку на ножках

🏆
@lunt1k_2 — за Яндекс Станцию в корпусе от винтажного радиоприёмника

Но это не все проекты, которые мы хотим отметить (и вручить создателям призы):

➡️ @Nagovitsyn177 и его макет Солнечной системы

➡️ @konstela и его кастомный виниловый проигрыватель

➡️ @lgor23 и его умная колонка с компьютерным зрением

➡️ @Linnnbh, который превратил разбитую ТВ Станцию в просто Станцию

Этим участникам мы подарим Станцию Лайт 2 и аккумулятор для неё.

Кстати, каждый, кто любит работать паяльником и отвёрткой, может прийти 25 и 26 апреля в Repair Cafe — мастерскую Яндекса, в которой можно разбирать и чинить гаджеты вместе с опытными наставниками. Участие бесплатное, регистрация — по ссылке.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🍔🤝🤖 Как связаны технологии и бургеры?

Посмотрите фильм «Путь еды», посвященный сервису Яндекс Еда, технологиям, на которых он построен и людям, которые их развивают.

Как работают рекомендации в приложении? Как устроено ценообразование? Как курьер узнает, что пора забрать заказ из ресторана? Ответы на эти и многие другие вопросы есть в фильме.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖 Сегодня Тобиас Литке — глава платформы электронной коммерции Shopify — запостил в X своё письмо сотрудникам, в котором рассказал, что использование ИИ стало базовым навыком, который ожидается от каждого. А вы согласны с этим утверждением? Напишите в комментариях 🔽

Вот полный текст основной части письма Литке:

1. Эффективное использование ИИ теперь является базовым ожиданием от каждого сотрудника Shopify. Сегодня это универсальный инструмент, важность которого будет только расти. Откровенно говоря, я не считаю возможным отказаться от изучения навыка применения ИИ в своей работе; вы можете попробовать, но я хочу честно сказать, что не вижу, как это может сработать сегодня, а тем более завтра. Стагнация практически неизбежна, а стагнация — это провал в замедленном режиме. Если вы не карабкаетесь вверх, вы скатываетесь вниз.

2. ИИ должен быть частью фазы прототипирования в любом GSD-проекте*. Фаза прототипирования любого GSD-проекта* должна включать активное исследование возможностей ИИ. Прототипы предназначены для обучения и создания информации. ИИ радикально ускоряет этот процесс. Вы можете научиться создавать то, что другие члены команды смогут посмотреть, использовать и оценить за долю времени, которое это занимало раньше.

3. Мы добавим вопросы об использовании ИИ в наши опросники по оценке производительности и взаимной оценке коллег. Научиться хорошо использовать ИИ — неочевидный навык. Мне кажется, что многие сдаются после того, как написали запрос и не получили сразу идеальный результат. Важно научиться формулировать запросы и загружать контекст, и получение обратной связи от коллег о том, как это происходит, будет ценным.

4. Обучение — это самостоятельный процесс, но делитесь тем, что вы узнали. У вас есть доступ к максимальному количеству передовых инструментов ИИ. У нас есть chat.shopify.io, который существует уже несколько лет. Разработчики имеют доступ к proxy, Copilot, Cursor, Claude code — всё настроено и готово к использованию. Мы будем учиться и адаптироваться вместе как команда. Мы будем делиться победами (и поражениями!) друг с другом, экспериментируя с новыми возможностями ИИ, и будем уделять время интеграции ИИ в наших ежемесячных бизнес-обзорах и циклах разработки продуктов. В Slack и Vault есть много мест, где люди делятся разработанными запросами, например #revenue-ai-use-cases и #ai-centaurs.

5. Прежде чем запрашивать увеличение штата и ресурсов, команды должны продемонстрировать, почему они не могут выполнить желаемое с помощью ИИ. Как бы выглядела эта область, если бы автономные ИИ-агенты уже были частью команды? Этот вопрос может привести к действительно интересным обсуждениям и проектам.

6. Все значит все. Это относится ко всем нам — включая меня и руководящую команду.

* Аббревиатура GSD в данном контексте означает Get Stuff Done — философия фокуса на результат и эффективное выполнение задач.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Мы продлеваем конкурс!

Любите модифицировать гаджеты своими руками? Починили 40-летний компьютер? Поместили Алису в корпус от старого радио? Покажите ваши реализованные кастомные проекты и расскажите про них. Мы выберем лучший, расскажем о нём в канале и подарим победителю свой кастомный гаджет — Станцию Миди в дизайне ТЕХНО.

Присылайте в комментарии описания и фото/видео проекта. Итоги конкурса подведём 9 апреля и отправим победителю приз по России.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔮 Роботы заставят людей скучать, а психиатрия станет основой медицины.
Какие предсказания из фантастики стали реальностью? Мы решили вчитаться в книги самых известных фантастов, чтобы посмотреть, сбылись ли их обещания. Разбираем, каким видел будущее Айзек Азимов.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🖼 Вчера OpenAI добавила в нейросеть GPT-4o возможность нативной генерации изображений, а пару недель назад аналогичную нейросеть выпустил Google. Рассказываем, чем они отличаются от обычных генераторов изображений.

Как работают обычные генераторы изображений

Для примера можно взять DALL-E в ChatGPT и Imagen в Gemini, которые умеют создавать картинки прямо в чате. Вот как происходит генерация:

🔸 Вы переписываетесь с языковой моделью

🔸 Когда вы просите создать изображение, она вызывает отдельную диффузионную модель (например, DALL-E или Imagen)

🔸 Диффузионная модель генерирует изображение и возвращает его в чат

🔸 Если хотите внести изменения, необходимо сформулировать новый запрос, а новая генерация будет сделана с нуля

Это как позвонить другу-писателю, который по вашей просьбе перенаправит ваш запрос другу-художнику, а затем вернёт результат.

Как работают омнимодальные нейросети

Gemini 2.0 Flash и новая версия GPT-4o — омнимодальные нейросети. Это значит, что одна и та же модель умеет понимать и создавать информацию в разных форматах — текстовом и визуальном. GPT-4o также умеет генерировать аудио — на этой возможности основан голосовой режим ChatGPT.

Изображения в омнимодальных нейросетях представляются в виде специальных токенов — так же, как модель работает с текстовыми токенами. Генерируются изображения также в виде токенов, которые затем один за другим переводятся в пиксели. Точно неизвестно, как работает генерация в Gemini 2.0 Flash, но можно заметить, что GPT-4o во время генерации создаёт изображение построчно — примерно так, как грузились картинки в интернете во времена интернета по Dial-up.

В чём преимущество?

Глубокое понимание. Поскольку это одна модель, она гораздо лучше понимает весь контекст диалога, включая предыдущие сообщения и загруженные изображения. А ещё использует свои знания о мире и способности к рассуждению при создании картинок. Например, GPT-4o умеет генерировать комиксы из нескольких кадров или инфографику даже по промту из нескольких слов — модель сама придумывает, что должно быть изображено, включая текст.

Редактирование и трансформация. Например, можно попросить модель поменять ночь на день, и она сделает это, сохраняя общую композицию и детали. За счёт того, что в основе таких моделей лежат более «умные и разносторонние» нейросети, их можно просить делать и более сложные манипуляции. К примеру, показать фото автомобиля с обведённой ручкой и попросить открыть её — модель поймёт запрос и вернёт фотографию той же машины с открытой дверью.

Итеративность. Картинку можно дорабатывать в диалоге, меняя конкретные детали и свойства, но сохраняя, например, внешний вид персонажа.

Это лучшие генераторы изображений?

Если сравнивать с ведущими генераторами изображений, такими как Reve и Recraft, GPT-4o и особенно Gemini 2.0 Flash отстают по качеству генерации, следованию деталям из промта и другим важным параметрам.

А при редактировании обе нейросети не идеально сохраняют исходные детали на всей картинке. Gemini 2.0 Flash справляется с этим лучше GPT-4o, особенно в лицах, но всё же слегка меняет даже те фрагменты, которые пользователь не просил редактировать. Это происходит потому, что во время преобразования из картинки в токены и обратно часть информации теряется.

Где попробовать эти нейросети?

Доступ к GPT-4o с нативной генерацией картинок открывается постепенно. В первую очередь его получили платные подписчики ChatGPT, но OpenAI обещает открыть доступ всем.

Gemini 2.0 Flash с возможностью генерации изображений доступна в Google AI Studio и по API.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

💻 Опенсорс жизненно важен для мировой экономики: исследователи из Гарварда подсчитали, что потребительская ценность ПО с открытым кодом значительно превышает стоимость разработки.

🔸 В 2020 году, например, в программы с открытым кодом было вложено $4,15 миллиарда, а их потребительская ценность оценивается в $8,8 триллиона

🔸 Если бы опенсорса не существовало, компаниям пришлось бы тратить на программное обеспечение в 3,5 раза больше.

Яндекс активно участвует в развитии опенсорса, и за последний год выложил в опенсорс языковую модель YandexGPT 5 Lite, систему отслеживания производительности сервисов Perforator и библиотеку YaFSDP, ускоряющую обучение нейросетей на 20%. Подробнее об этих и других опенсорс-проектах Яндекса можно узнать на opensource.yandex.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖 Суперзарядка для электромобилей и акробатика от роботов

Рассказываем об этих и других главных новостях недели в технодайджесте.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Помните свой самый первый запрос к нейросети? Напишите в комментариях, о чём вы попросили её, — это почти всегда можно посмотреть в истории общения.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

😻 Как бы выглядели современные технологии 50 лет назад? Спросили у модели YandexART 2.5 Pro, которая сегодня появилась в Шедевруме.

Подписывайтесь 👉 @techno_yandex

Читать полностью…
Subscribe to a channel