Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
⚡️ Ideogram 3.0 — это последняя версия генеративной модели от компании Ideogram AI.
Генератор обеспечивает высокий реализм изображений, креативность и поддерживает качество рендеринга текста.
Согласно внутренним оценкам, Ideogram 3.0 превосходит другие текст-изображение модели по широкому спектру задач.
Одной из ключевых фишек Ideogram 3.0 является "Style References", позволяющая пользователям загружать до трех референсных изображений для генерации контента в заданном стиле.
ЭТО упрощает создание изображений с трудноописуемой текстом эстетикой, ускоряя и делая более выразительным творческий процесс.
Для вдохновения доступна функция случайного выбора стиля из библиотеки из 4,3 миллиарда пресетов, а понравившиеся стили можно сохранить и повторно использовать с помощью их уникальных кодов.
Кроме того, Ideogram 3.0 предлагает расширенные возможности генерации текста и макетов для графического дизайна, рекламы и маркетинга. Модель способна создавать стилизованный и точный текст с высокой точностью, включая сложные и длинные композиции, с которыми другие модели испытывают трудности. Созданный текст отличается красотой и художественностью, превосходя возможности традиционных дизайнерских платформ.
Ideogram 3.0 доступна для всех пользователей на платформе ideogram.ai и в приложении для iOS. Доступно 2 генерации на бесплатном тарифе, $20/мес.
🎯 Блог
⚡️ Google представил свою самую мощную нейросеть — новая «думающая» Gemini 2.5 Pro опережает всех конкурентов.
🚀 Пишет код на уровне сеньора с 10-летним опытом, решает любые математические задачи и, что самое главное, бесплатна.
Пробуем можно в AI Studio.
«Ошибка на миллиард» в ИИ
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мега-лампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом — знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и вайб команды ещё до трудоустройства.
🔥 Однозначно подписка — @avito_life
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
🌅 HunyuanVideo-I2V
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno
Трамп очень высоко оценил IT-навыки своего сына Бэррона
«Я выключаю его компьютер, а через 5 минут он снова работает! Как он это делает? У него потрясающие отношения с технологиями!» - заявил Трамп.
Мальчику всего 19 годиков.
@vistehno
💬 OPEN AI добавили API 3 новых SOTA аудио-модели.
🗣️ Две модели преобразования речи в текст, которые, как заявляют разработчики, превосходят Whisper.
💬 1 Новая модель TTS - которой можно указать *как* ей говорить.
Поддерживает функцию задания интонации, тона, тембра голоса и еще множества других параметров с помощью промпта.
🤖 Еще OpenAi выпустили Agents SDK, который для создания голосовых агентов.
Через час состоится стрим, где покажут примера создания голосовых агентов с новыми аудиомоделями.
📌 Потестить можно здесь: https://www.openai.fm/
🔥 Стрим Open AI - Создание голосовых агентов с новыми аудиомоделями
https://openai.com/live/
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?
CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе
На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)
Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива
❗️Знать Python и SQL не обязательно — все будем разбирать с нуля
🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск
😶Участвовать в бесплатном интенсиве
🔥 Claude теперь интегрирован в Unity, Blender и Unreal Engine — MCP-плагины остаются в центре внимания! Теперь для создания игры достаточно лишь клавиатуры.
• Claude в Unity— генерирует геймплейные механики (физику, цели, таймеры), окружение, эффекты, интерфейсы, миникарты и многое другое.
• Claude в Blender — мгновенно создаёт 3D-модели и сцены, превращает фотографии в игровые локации и редактирует их по вашим командам.
• Claude в Unreal Engine — создаёт объекты, задаёт им форму и разрабатывает их логику всего за несколько минут.
Сохраняйте и пробуйте в деле! 🚀
🔥 Сравнение 4 генераторов изображений на основе ИИ 🎨
Было протестировано 4 модели ИИ с 5 различными промптами, по 4 попытки на каждую модель.
🔹 Google Imagen 3
🔹 Mystic 2.5
🔹 Photon
🔹Frames
Каждая модель интерпретировала промпты по-своему, выдавая уникальные результаты. Как вы думаете, какая из них сделала это лучше всего? Промпты ниже:
Cinematic shot, a futuristic astronaut gazing at an alien planet's horizon, wide shot, reflective visor catching a distant sun, detailed rocky alien landscape, soft glowing atmospheric haze, breathtaking and otherworldy, photorrealistic, sci-fi, highly-detailed
2. Macro shot of a honeybee collecting pollen from a sunflower, delicate pollen grains visible on its fuzzy body, golden sunlight enhancing the textures, 90mm macro lens, vibrant warm tones
3. A vintage 1970s car driving along a winding road surrounded by a dense autumn forest, golden and crimson leaves covering the ground, soft sunlight filtering through the trees, motion blur on the background, nostalgic and cinematic atmosphere, warm and earthy tones
4. Full body portrait, a striking woman with high cheekbones and deep brown eyes, dressed in a bold, She stands against a dramatic desert backdrop, the warm earth tones contrasting with her vibrant outfit, Shot with a Leica, editorial composition
✔️ Factorio стала новым бенчмарком для ИИ.
Factorio привлекла внимание ресерчеров в качестве инструмента для оценки возможностей ИИ. Игра измеряет способность языковых моделей планировать и создавать сложные системы, одновременно управляя ресурсами и производственных цепочек.
Для этих целей была разработана среда Factorio Learning Environment (FLE) c двумя режимами: "Lab-Play" (24 структурированные задачи) и "Open Play", где агенты исследуют процедурно сгенерированные карты с целью построить максимально большую фабрику. В процессе тестирования модели взаимодействуют с Factorio через Python API и получают обратную связь через игровой сервер. Оцениваются параметры "Производственный показатель" и достижение ключевых "Вех".
Создатели протестировали 6 LLM, включая Claude 3.5 Sonnet и GPT-4o. Результаты показали, что модели испытывают серьезные трудности с пространственным мышлением, долгосрочным планированием и исправлением ошибок. Лучшие результаты у Claude 3.5 Sonnet, которая успешно справилась с 15 из 24 задач в режиме "Lab Play".
jackhopkins.github.io
✔️ Американцы все чаще считают, что искусственный разум превосходит их интеллект.
Исследование, проведенное Университетом Элона, выявило, что почти половина пользователей (49%) полагает, что LLM превосходят их собственный интеллект. Из отчета следует, что женщины чаще мужчин считают LLM "значительно умнее" (30% против 20%), а половина взрослого населения США уже использует языковые модели, лидирует ChatGPT с долей в 72%. Также выяснилось, что большинство пользователей (51%) применяют LLM в личных целях для обучения и планирования, в то время как для работы их используют лишь 24%. 65% пользователей взаимодействуют с ИИ-системами посредством голосовых команд.
Несмотря на высокий показатель общей удовлетворенности (76%), значительная часть пользователей сталкивается с проблемами: 23% совершали серьезные ошибки из-за галлюцинаций моделей в ответах, а 21% чувствовали себя манипулируемыми.
imaginingthedigitalfuture.org
✔️ ReasonGraph: инструмент для анализа ризонинга LLM.
ReasonGraph - опенсорсная веб-платформа, разработанная Кембриджским университетом, для визуализации и анализа процессов рассуждений LLM. Она поддерживает как последовательные, так и древовидные методы рассуждений, легко интегрируясь с основными провайдерами LLM и более чем 50 языковыми моделями.
Платформа построена на модульном каркасе и имеет выбор метода мета-рассуждения и настраиваемые параметры визуализации.
ReasonGraph улучшает обнаружение ошибок в логических процессах и способствует более эффективной разработке приложений на основе LLM. Оценка платформы показала практически 100% точность rule-based XML-парсинга при извлечении и визуализации путей рассуждений.
Репозиторий проекта на Github. Демо на HuggingFace.
arxiv.org
✔️ MEGA mini: концепт архитектуры для универсальных NPU.
На конференции по твердотельным схемам (ISSCC) была представлена архитектура MEGA.mini, позиционируемая как универсальный процессор для генеративного ИИ.
MEGA.mini использует парадигму Arm big.LITTLE и предлагает использование двухъядерной концепции в NPU. Предполагается, что высокомощные ядра "Mega" будут задействоваться для выполнения ресурсоемких задач, а облегченные ядра "Mini" будут использоваться для рутинных операций. Архитектура разрабатывается как универсальный процессор, в отличие от CPU, чтобы разработчики могли применять его в разных сценариях - от NLP-задач до мультимодальных ИИ-систем.
techradar.com
✔️ Deepseek R1 671B запустили локально на новом Mac Ultra M3.
YouTube-блогер Дейв Ли провел эксперимент по локальному запуску 4-bit версии Deepseek R1 с 671B параметров. Она может работать локально, но требует 512 ГБ RAM, 404 ГБ хранилища и принудительного выделения 448 ГБ видеопамяти через терминал.
Несмотря на незначительное снижение точности, скорость инференса составила 17-18 токенов в секунду, при этом энергопотребление находилось в пределах 200 Вт. Для сравнения: ПК с аналогичной производительностью потребовал бы в 10 раз больше электричества.
macrumors.com
@ai_machinelearning_big_data
#news #ai #ml
🚀 Стартер-пак для разработчика LLM — собрали 120 бесплатных библиотек для обучения, файн-тюнинга, оценки и создания ваших ИИ-агентов в одной базе.
▪ Удобная классификация: все инструменты аккуратно распределены по категориям, каждая снабжена подробным описанием и ссылкой на GitHub с исчерпывающими гайдами.
▪ Легкость освоения: благодаря детальным инструкциям внутри ссылок разобраться в материалах будет проще простого.
📌 Сохраняйте эту подборку — настоящий клад для каждого разработчика: https://github.com/KalyanKS-NLP/llm-engineer-toolkit
@vistehno
⚡️ Осваиваем английский с нуля за три месяца — найден метод, позволяющий выучить любой язык, тратя всего 20 минут в день.
Что особенного:
— Вместо скучной зубрёжки слова запоминаются через ассоциации.
— Перевод автоматически закрепляется в подсознании.
— Уже через неделю можно включать видео фоном — мозг сам начнёт понимать суть.
— В каждом ролике — 900 ключевых слов.
— Достаточно всего 20 минут в день.
Готовые видео для английского, немецкого и испанского языков — учимся с легкостью!
@vistehno
ML-комьюнити о крупнейших запусках LLM начала 2025 года:
✔️ DeepSeek — революция или переоцененный запуск?
Запуск китайской модели всколыхнул всю индустрию, вызвав неоднозначную реакцию экспертов. CEO Anthropic Дарио Амодей отмечает, что Claude 3.5 Sonnet, обученный за несколько десятков миллионов долларов, значительно опережает DeepSeek по многим показателям, плюс у модели нет никаких барьеров против генерации чувствительной информации. Демис Хассабис, генеральный директор Google DeepMind, считает DeepSeek лучшей работой китайских исследователей, но не видит в ней новых научных достижений.
✔️ Grok 3 — Маск не дотянул
ИИ-исследователь и профессор Пенсильванского университета Итан Моллик признал, что xAI очень быстро растёт, но Grok 3 пока точно не является лучшей моделью на рынке. Она превосходит некоторые модели OpenAI, но не o3. CTO Caylent Рэнделл Хант обнаружил ряд проблем с Grok 3: уязвимость к джейлбрейкам, неуместную саркастичность, медлительность и частые ошибки в ответах. По его словам, даже простые логические тесты оказались ей не под силу, что делает модель практически бесполезной для бизнес-задач. При этом CEO Replit Амджад Масад назвал Grok 3 передовой моделью и огромным достижением.
✔️ GPT-4.5 — не оправдал ожиданий экспертов
Релиз GPT-4.5 от OpenAI получил смешанные отзывы в профессиональном сообществе. Соучредитель OpenAI и бывший глава Tesla AI Андрей Карпатый отметил, что GPT-4.5 напомнил ему GPT-4 на момент релиза — он увидел потенциал этой модели. В посте на X он сказал, что при использовании GPT-4.5 «всё стало немного лучше, и это здорово, но не совсем так, как можно было бы ожидать». В более резких выражениях высказался известный критик Гэри Маркус, назвавший модель «пустышкой». Генеральный директор Hugging Face Клемент Деланж также остался недоволен, охарактеризовав GPT-4.5 как «так себе» и раскритиковав закрытость исходного кода.
✔️ YandexGPT 5 — что в России?
Виктор Тарнавский, директор по ИИ Т-Банка, отметил, что в Яндексе выложили Lite-версию модели в опенсорс, а пайплайн Pro-версии инициализировали весами от Qwen 2.5. По его мнению, это правильное решение, позволяющее избежать бессмысленной траты ресурсов. При этом, пишет Тарнавский, разработчики делают не файнтюн, а полный цикл обучения модели — просто стартуют претрейн не с нулевых весов. По опубликованным бенчмаркам, модели показывают хорошие результаты. В СМИ также писали, что Яндекс работает над ризонингом. Максим Болотских, директор ИИ в Яков и Партнёры (ex-McKinsey), прокомментировал, что ежегодные совокупные затраты на разработку подобного функционала могут составлять 10 млрд рублей и более, и такого рода модели могут монетизироваться не только классическими подписками B2C пользователей, но и значимо лучше решать задачи В2В-сегмента.
✔️ Gemini 2.0 Flash — лучшее соотношение цена/качество
Релиз Gemini 2.0 Flash от Google получил восторженные отклики экспертов. Тим Брукс, ИИ-исследователь в Google DeepMind, высоко оценил встроенную функцию генерации изображений с возможностью визуальной цепочки рассуждений. Соучредитель и бывший глава Intel AI Райан Карсон назвал модель "умной, быстрой и дешёвой", отметив отличную производительность при тестировании через API. Мэтт Шумер, соучредитель и генеральный директор компании OthersideAI, подчеркнул, что по большинству бенчмарков Gemini 2.0 Flash приближается к Claude 3.5 Sonnet и даже превосходит его в бенчмарке MATH, сохраняя при этом значительное ценовое преимущество.
✔️ Claude 3.7 — достойный шаг вперёд при умеренных затратах
Релиз Claude 3.7 от Anthropic получил преимущественно положительные отзывы экспертов. Сэм Альтман и Дарио Амодей подчеркнули экономическую эффективность разработки — обучение Claude 3.7 Sonnet обошлось лишь в несколько десятков миллионов долларов, что значительно меньше затрат на GPT-4. Артём Санакоев, ИИ-исследователь в Meta Generative AI и автор канала "эйай ньюз", выделил инновационный подход Anthropic к рассуждениям модели — в отличие от конкурентов, Claude использует единую модель без отдельного reasoning тюна.
@ai_machinelearning_big_data
#AI #ML #LLM
Зачем и как маркетологу изучать искусственный интеллект? Что написать в мотивационном письме? Из чего состоит портфолио?
В Высшей школе экономики появилась еще одна возможность для поступления в онлайн-магистратуру: «Искусственный интеллект в маркетинге и управлении продуктом». Уже сейчас в рамках конкурса «Раннее приглашение к поступлению» вы можете попробовать свои силы до старта основной приемной кампании.
Эксперты факультета компьютерных наук Вышки и Яндекса создали программу на стыке технологий и трендов в IT и маркетинге. В магистратуре преподают практики индустрии:
— ML-инженеры
— Маркетологи
— Продакты
Уже на ближайшем вебинаре вы сможете узнать, как забронировать своё место в онлайн-магистратуре «Искусственный интеллект в маркетинге и управлении продуктом» и получить диплом Высшей школы экономики.
Когда: 18 марта, 18:00 (МСК)
Где: онлайн
💻 Для участия необходимо зарегистрироваться по ссылке.
Реклама: НИУ ВШЭ
ИНН: 7714030726
Erid: 2SDnjeVYViL
🎮 DOOM запустили на советском трамвае — настоящий гений оживил классику на модели ЛМ-68М2 «Ретро»: теперь демоны из ада атакуют прямо в кабине водителя.
USB, конечно, не завезли, так что клавиатуру пришлось подключать через старый PS/2.
Дед точно оценит!
@vistehno
✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20%
Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства.
Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов.
bloomberg.com
✔️ В Италии запущена первая в мире газета, созданная ChatGPT.
Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента.
Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов.
asianfin.com
✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов.
Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка.
Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики.
arcprize.org
✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей.
Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей.
Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении.
theatlantic.com
✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM.
Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана.
По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли.
news.cgtn.com
@ai_machinelearning_big_data
#AI #ML #Research #NLP
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!
@vistehno
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
😞 А ведь он просто хотел завести новых друзей...
@vistehno
📡 Запущен первый спутник FireSat, который поможет раньше обнаруживать небольшие лесные пожары.
FireSat, новый прототип спутника обнаружения лесных пожаров, запущен на Falcon 9 компании SpaceX! Высококачественные изображения, обновляемые каждые 20 минут, скоро помогут обнаруживать лесные пожары размером 5x5 м по всему миру.
📌 Читать
#news #ai #ml
🌟 KBLaM: новая архитектура интеграции знаний для языковых моделей от Microsoft Research.
Microsoft Research представила KBLaM - архитектуру, которая решает ключевую проблему LLM — добавление новых внешних знаний. В отличие от традиционных методов файнтюна и RAG, KBLaM кодирует новые для LLM структурированные данные в виде векторных пар «ключ-значение», встраивая их напрямую в слои внимания модели. Это позволяет избежать дорогостоящего дообучения и построение дополнительных модулей, сохраняя линейную масштабируемость даже для баз знаний в 10 000 триплетов.
В KBLaM триплет — это структурированный элемент знания, состоящий из трех компонентов: сущности, свойства и значения. Например, в утверждении «Москва — столица России» сущностью выступает «Москва», свойством — «столица», а значением — «Россия».
llama_model.py
в src/kblam/models
.🤖 Новые тренды среди последних LLM
🗓 24 марта в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».
LLM и трансформерные модели такие как ChatGPT, GPT4, GigaChat стали не только стандартом в области языкового моделирования, но и незаменимыми помощниками для решения огромного числа задач: от написания кода, до генерации сказок.
На вебинаре мы расскажем про последние тренды в этой области: чего уже достигли современные LLM сегодня и что нас ждет в ближайшем будущем.
Данный открытый урок будет особенно интересен:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science
В результате вебинара вы:
- поймете основные технологии за современными LLM сегодня
- узнаете про основные тренды в области больших языковых моделей
- узнаете, что ждет область LLM в ближайшие годы
🔗 Ссылка на регистрацию: https://otus.pw/DSIV/
🤖 NVIDIA, Google DeepMind и Disney Research сотрудничают над созданием домашнего дроида в стиле R2D2.
@vistehno
⭐️ Gemini Image Editing NextJS Quickstart — это быстрый стартовый проект от Google Gemini, который демонстрирует, как интегрировать возможности редактирования изображений в веб-приложения на базе Next.js.
▪ Простота интеграции: Проект предоставляет готовый шаблон, позволяющий разработчикам мгновенно начать работу с Gemini Image Editing API без сложных настроек.
▪ Удобство использования: Чётко структурированный и хорошо документированный код помогает быстро разобраться в функционале и адаптировать решение под свои нужды.
▪ Мощные возможности: Использование передовых алгоритмов редактирования изображений от Google делает этот инструмент конкурентоспособным по сравнению с аналогичными решениями.
▪ Расширяемость: Лёгкая модификация и добавление новых функций позволяют создать уникальное и функциональное приложение для обработки изображений.
Если вы хотите быстро внедрить современный функционал редактирования изображений в своё Next.js приложение, Gemini Image Editing NextJS Quickstart — отличный выбор. Ознакомьтесь с проектом на
📌 GitHub
🎓Месяц погружения в генеративный AI
Представьте, что вы каждый день открываете новые возможности для роста и развития, применяя AI-технологии в бизнесе, работе и личной жизни. Автоматизируете рутинные процессы, становитесь продуктивнее, и начинаете мыслить в парадигме AI.
Становитесь тем, кто быстрее других ориентируется в стремительно меняющемся мире AI.
AI Mindset приглашает вас на свою онлайн-лабораторию – попробовать AI-инструменты на практике.
За 4 недели вы:
- Поймёте, как устроен генеративный AI и почему это уже изменило мир
- Научитесь создавать мощные промпты и эффективно общаться с AI
- Создадите личного AI-ассистента под свои задачи и привычки
- Запустите AI-агентов, которые автоматизируют рабочие процессы и освободят ваше время
- Узнаете, как создавать изображения, тексты и мультимедиа с помощью передовых AI-инструментов
- Сможете быстрее, продуктивнее и интереснее решать любые задачи
Формат лаборатории:
- Практические воркшопы, коворкинги и живое общение
- Экспертные сессии от лидеров отрасли
Что нас отличает от других обучалок по AI?
- Формат лабораторий: много практики, адаптивная под запросы участников и новинки рынка программа
- Треки по направлениям, как отдельные мини-лаборатории: Startup, Automation, Research, Ethics и др.
Старт: 24 марта
Регистрация
*почитать о других проектах ребят можно на их канале @ai_mind_set
☠️ The Information:
Китайское правительство забрало у разработчиков ИИ-модели DeepSeek паспорта и другие документы, чтобы они не выезжали из страны.
@vistehno
⚡️ Vondy: огромная базу ИИ-агентов для различных задач!
В Vondy можно подобрать нейроассистентов, которые возьмут на себя рутинную работу и сэкономят часы, чтобы вы могли уделить время отдыху, хобби или развлечениям.
▪ Агенты для любых задач: от кодинга, написания текста, дизайна и бизнеса до повышения продуктивности и генерации изображений, звуков и видео.
▪ Создайте своего агента: сервис предоставляет все необходимые инструменты, чтобы настроить помощника именно под ваши нужды.
▪ Бесплатно.
https://www.vondy.com/
@data_analysis_ml
⚡️ Новый апдейт Gemini содержит ряд интересных обновлений:
- Расширенные возможности модели: Обновлённая версия 2.0 Flash Thinking Experimental теперь поддерживает загрузку файлов и имеет увеличенное контекстное окно до 1 миллиона токенов, что позволяет решать более сложные задачи.
- Deep Research: Функция Deep Research стала доступна для всех пользователей. Теперь Gemini может быстро анализировать информацию из интернета и формировать подробные отчёты, показывая свой процесс рассуждения в реальном времени.
- Персонализация: Введена экспериментальная функция персонализации, которая связывает Gemini с Google-сервисами (например, Поиск, Календарь, Заметки). Это позволяет получать более индивидуальные и релевантные рекомендации на основе ваших предыдущих запросов.
- Появилась возможность создавать собственных виртуальных экспертов (Gems), что позволяет настраивать Gemini под конкретные задачи – будь то перевод, планирование питания или помощь в программировании.
Эти обновления доступны бесплатно в приложении Gemini.
https://blog.google/products/gemini/new-gemini-app-features-march-2025/