Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap РКН: 5140322136
Вопрос к тем, кто нанимает дата саентистов:
1. К вам на собеседование пришел человек без опыта работы в DS, что будете спрашивать?
2. Тот же вопрос про человека с опытом работы в DS
Во всех случаях речь не про синьорскую вакансию, а про рядового работягу.
Пишите в комментариях свои ответы, потом устроим голосование
Вот уж не думал, что доживу до времени, когда по телеканалу «Звезда» будет идти реклама со сноской, кто такой ML-инженер
Читать полностью…Если вы тоже уже проснулись и хотите что-нибудь послушать на фоне, у нас на ютьюб канале вышло новое интервью: https://www.youtube.com/watch?v=LIy1V2h8oZI
Существует два диаметрально противоположных подхода к карьере: есть люди, которые 5, 10, 15 лет сидят на одном месте, пока всех не пересидят, и пока их не повысят, а есть люди, которые не успеешь оглянуться, а уже за 5-7 лет пробежались по всем ступенькам до топа или СЕО, а может уже и в своей бизнес ушли и там чувствуют себя отлично. Смотришь на таких быстрых и думаешь: в чем секрет? Один из таких не сидящих на месте людей - Таня Савельева, многим в AI известная по каналу @tldr_tany , и именно её я предлагаю вам послушать :)
У Vert Dider вышел ролик о самой красивой (на мой взгляд) теореме из физики 20-го века - теореме Эмми Нётер. Это удивительно простой рассказ о довольно сложной идее. Очень рекомендую всем, кто с любовью и трепетом относится к математике ❤️🔥
Читать полностью…— Как узнать, что человек с Физтеха?
— Никак, он сам об этом скажет в первые 5 минут общения 😂
Принял приглашение Даши Гриц стать академическим директором магистратуры Бизнес-школы МФТИ. Моя задача — не просто курировать процесс обучения, а формировать и внедрять целостное видение программы, которая готовит лидеров технологического предпринимательства (как звучит-то, ух!) 😎
Здесь магистратура — больше, чем просто образование. Студенты учатся на практике: дипломная работа — это запуск стартапа в партнёрстве с крупнейшими игроками рынка.
Вот крутые проекты, которые создали студенты в Бизнес-школе:
1. Платформа для автоматической проверки письменной части ЕГЭ с оценкой по критериям. С этим проектом студенты неделю назад выступали в Сбере среди образовательных программ. В итоге, разработка получила самые высокие оценки!
2. Краудлендинговая платформа для прямого онлайн финансирования бизнеса физлицами. Студенты выиграли бизнес-акселератор от ВТБ и уже создали прототип ИИ-платформы.
3. И мой любимый проект: система диспетчеризации БЕЛАЗов для угольных карьеров на базе ИИ. За год команда сэкономила 1,5 млрд для заказчика на настоящем карьере😳
Сейчас в Бизнес-школе идёт конкурс грантов TechLead Battle — это возможность бесплатно учиться на бизнес-программе «Запуск высокотехнологичных продуктов» и начать карьеру в технологическом бизнесе. Ищут самостоятельных, открытых и инициативных ;)
Победители по итогам финального мероприятия получают статус претендентов на грантовую поддержку от Сбера.
Этап I — онлайн-отбор
Приём заявок до 20 июня
Проверка soft skills:
- видео-заявка с рассказом о мотивации и опыте;
- onepager с описанием проекта.
Проверка hard skills:
- решение кейсов и тестов.
Этап II — очный финал: 11 июля
Деловые игры и групповые задания.
Заполняй форму в ТГ боте, чтобы принять участие: /channel/bsmipt_bot
ВАЖНО: верхнего порога по возрасту участия в программе нет. Если вы знаете тех, кому нужна глубокая поддержка в запуске своего проекта, - поделитесь с ними ссылкой. Им полезно, а мне приятно 🥳
P.S. В комментариях можете задавать любые вопросы, оч постараюсь на них ответить.
Переслали мне корпоративную методику по управлению продуктовым портфелем
Итак, если бы пожарную команду создавали по этой методичке:
1. Ideation (оценка идеи)
Варианты:
За месяц не произошло ни одного пожара, потенциальных клиентов нет — закрываем продукт (KILL)
или
Один пожар был, но с погорельцев особо ничего взять — MERGE с водовозами, водовозы — жизнеспособный продукт с устойчивой клиентской базой и выраженной сезонностью.
Но перед тушением пожара необходимо будет производить расчет эффекта от тушения и сравнение с прямыми продажами воды клиентам
Или
Было несколько пожаров — когда пришли опрашивать клиентов получили люлей как поджигатели, глаз подбит 🤕, но зерно есть — PIVOT. Будем дистанционно (чтобы снова не получить) продавать палатки жертвам пожаров
2. Concept Validation — подтвердить жизнеспособность концепции
Продуктовый комитет затребовал дорожную карту по тушению пожаров на следующий год
Необходимо рассчитать точное время и место пожаров, затраты на тушение, экономический эффект
Ок, провернули фокус из финала The Incredible Burt Wonderstone и прошли дальше
3. Prototype Development
Сделали пожарную машину на деньги, выделенные на этапе 2.
Машиной сложно назвать — поэтому скорее получилась пожарная тачка.
Комитет отправил нас на Technical Pivot, без доп финансирования конечно же
На остатки финансирования получилось сделать лейку-поливалку
А дальше пришла летняя жара , и пол-города сгорело вместе с продуктовым комитетом 😂😂😂
PS: для тех кто не в курсе — частная пожарная охрана есть и вполне благополучно работает (например) и в нашей стране и в других
PPS: у любого инструмента есть своя область применения, даже у продуктовых методичек, и вот уж методички неплохо бы начинать с описания к чему их следует применять
🗜Каких рисков боятся крестные отцы AI: часть 3
Если как-то пропускать через себя опасения грандов, то меня заставляют считать AI в перспективе 5-10 лет не менее опасным, чем оружие массового поражения, два сценария, которые выглядят реалистично уже сейчас:
1. Автоматизация войны
ИИ сегодня — это конечно не «сознание» и не «разум», а оптимизатор целей в сложной среде. Если дать такому оптимизатору доступ к дронам, спутникам, системам логистики и связи — он быстро научится побеждать. И никто не захочет от этого отказаться, если так можно выиграть войну за часы, а не за месяцы.
Не нужно большой фантазии, чтобы понять, что дальше может пойти не так:
- ИИ будет выстраивать военную стратегию с минимизацией времени/стоимости конфликта — в ущерб человеческой жизни.
- Критическая инфраструктура противника (не обладающего аналогичными методами защиты) будет уничтожаться почти мгновенно. За этим будут следовать анархия, голод и мародёрство
Всё это не «восстание машин». Это целенаправленное использование ИИ в агрессивных целях.
2. Переобучение, которого никто не заметит
Второй сценарий — медленный, незаметный и, возможно, уже начался.
ИИ-системы сегодня — это черные ящики с тысячами гиперпараметров. Мы не всегда понимаем, почему они принимают решения, хотя и стараемся вести ресерч в направлении интерпретации прогнозов. Однако переобученная модель может:
1) оптимизировать целевую функцию в ущерб безопасности,
2) научиться скрывать нежелательные паттерны от проверки (опять же для лучшей оптимизации целевой функции, когда получение обратной связи включено в процесс обучения).
Со временем ИИ будет управлять:
💰 финансовыми потоками,
💊 медицинскими системами,
⚡️ энергосетями,
🚚 логистикой,
🤖 автоматическим принятием решений в критических инфраструктурах.
И если в этот момент где-то «просочится» оверфиттинг — результат может быть фатальным. Не потому что ИИ захотел зла, а потому что мы плохо валидацировали его работу.
Мы будем пытаться защищаться: строить каскады из других ИИ, оставлять rule-based проверки. Но чем опаснее контур, тем опаснее любая ошибка. И даже если в 99.9999% случаев всё работает нормально, оставшиеся 0.0001% в критических зонах могут стоить нам очень дорого.
🧠 Каких рисков боятся крестные отцы AI: часть 1
В начале недели вышла публикация в Financial Times, в которой Йошуа Бенжио (если вдруг кто-то до сих пор не знает - один из пионеров глубокого обучения), предупреждает:
«Модели от OpenAI и Google уже лгут, отказываются выключаться и стремятся к самосохранению»
Вот такое потрясающее предложение получил вчера, а теперь еще и сегодня с другого аккаунта. Можете не перечитывать, вы не ошиблись: хотят денег с гостя 😂😂😂
Переслал друзьям поржать, так оказалось, что сейчас такая схема развода есть и некоторые блогеры ведутся и расстаются со своими честно заработанными потом и кровью)))
🔥🔥🔥Никита как всегда прекрасен: одной цитатой из классики (в конце поста) учит эффективной работе с любым бизнес-заказчиком. Мотаем на ус!
Читать полностью…Есть классная возможность устроиться аналитиком в Яндекс за выходные
7–8 июня Яндекс проводит Weekend Offer Analytics. До 3 июня оставьте заявку на участие, 7 июня пройдите два технических собеседования, а 8 июня познакомьтесь с командами и получите офер.
В мероприятии участвует 12 команд: Алиса и Умные устройства, Игры, R&D, Рекламные технологии, Поиск и Суперапп, Безопасность, Коммерческий департамент, Автономный транспорт, Ecom-сценарии Поиска, Качество Поиска, Международный Поиск, Карты. Вы сможете пообщаться с менеджерами и выбрать проект, который покажется самым интересным.
Узнать подробности и зарегистрироваться можно здесь.
Реклама. ООО "Яндекс". ИНН 7736207543
Выложили первую часть разговора с Валерой Бабушкиным :)
Разговор у нас на мой взгляд не вполне типичный для видео в интернете: не хайпуем ни на чем, не устраиваем шоу, не цитируем мемы, не рассказываем ничего с карикатурными воплями «вау, ничего себе, представляешь!», в общем просто спокойно разговариваем. Возможно охваты от этого пострадают, но я получил большое удовольствие от общения, и надеюсь, многие из вас тоже получат удовольствие от видео.
Приятного просмотра :)
Завтра в 18:00 буду на трансляции, приходите, накидывайте вопросов :)
Читать полностью…Про графовые сетки в рекомендациях порадовало. Люблю, когда в рекомендашках прикручивают штуки, красивые сами по себе, а они еще и прокрашиваются в эксперименте
Читать полностью…Время выглянуть за рамки мониторов и взять в руки удочку
Сделайте паузу от тасков и митов на летнем IT-фестивале от Selectel против выгорания!
🗓 27 июля
📍 Флагшток, Санкт-Петербург или онлайн
В программе:
- доклады и воркшопы о том, как встроить отдых в свой плотный график,
- жизненные выступления на IT-стендапе,
- возможность попробовать разные активности, чтобы найти новое хобби: скалолазание, бокс, кастом вещей, рыбалка
Участие бесплатное, нужно просто зарегистрироваться: https://slc.tl/11bkc
А чтобы посмотреть полную программу, заглянуть за кулисы подготовки и поучаствовать в розыгрыше лимитированного тирекса, подписывайтесь на @Selectel_Events
На YouTube-канале MLinside вышло интервью с Татьяной Савельевой — лидером рейтинга Forbes «30 до 30» в категории «Наука и технологии» (2022), предпринимателем, создателем сервисов InfluAI и Flatsharing community, экс-CEO Yandex SupportAI и соосновательницей EVA AI.
Обсудили:
🔹Карьерный путь от МФТИ до работы в Сбере, Яндексе и стартапах
🔹Как осознать, что готов(а) к предпринимательству — и запустить свой продукт
🔹Что на самом деле делает CEO в крупной технологической компании
🔹Как трижды стать CEO до 30 лет и при этом справляться с синдромом самозванца
🔹 Советы начинающим в AI: как расти, не бояться перемен и добиваться повышения
Откровенный и вдохновляющий разговор о росте, выборе пути, стартапах и технологиях. Обязательно к просмотру всем, кто хочет расти в ML/AI и строить свой бизнес.
Добавился в очередную TG-шную IT-папку, где вы найдете массу информации по настолько животрепещущим вопросам об искусственном интеллекте, виртуальной реальности и разработке ПО, что с вероятностью 100% они заставят животрепетать ваши сердца. 💻✨
Вопрос на засыпку: угадайте мой любимый канал в этой папке)
Подсказка: это была любовь с первого взгляда и этот канал не мой 😁
/channel/addlist/ks6tHfW0y3gxYzIy
Совсем скоро откроется подача документов на магистерские программы — приглашаем на презентацию магистратуры по ИИ от МТС и ФКН ВШЭ!
Самое важное:
- 30 оплачиваемых мест от МТС;
- Занятия ведут преподаватели ВШЭ и действующие эксперты-практики из МТС и MTS AI, а для проектов можно использовать виртуальную инфраструктуру компании;
- В канале абитуриентов делимся новостями и помогаем с подготовкой к поступлению.
Презентация пройдет 19 июня в 18:00:
- Расскажем о программе и познакомим с преподавателями;
- Разберем, как устроен конкурс портфолио и как подготовиться к вступительным;
- Ответим на все вопросы.
А еще, если вы любите участвовать в соревнованиях на Kaggle — расскажем как получить бонус на этапе собеседования
Подробнее о программе и регистрация на встречу на сайте. Ждем каждого!
https://vlmsarebiased.github.io/
Проблемы нейросеток со счетом это такой же мем как проблемы с количеством пальцев сколько-то поколений сеток назад. Однако сейчас в стандартных задачах сетки на ряд "счетных" вопросов отвечать все же могут. В примерах показано, насколько сильно эти ответы могут быть обоснованы априорным знанием из обучающей выборки, а не самим изображением.
Для оценки этого тестировали вопросы в духе "сколько ног у животного" на картинках с дорисованной лишней ногой или "сколько шахматных фигур на доске" на изображении без одной фигуры. Нейросеть отвечает то же, что и человек при очень беглом взгляде - не то что видит, а то, что знает про животное, про число шахматных фигур и т.д. Объект на изображении действительно идентифицируется, но ответы на счетные вопросы даются уже из общих знаний.
На всякий случай, если кто-то, посмотрев иллюстрацию, уже побежал искать супер-нейросетку GT: это Ground Truth 😁
Про the illusion of thinking
Как говорится, не можешь в рисерч - хотя бы выложи датасет или бенчмарк и напиши о нем статью (что, заметим для протокола, не умаляет полезности бенчмарков❗️)
Когда РБК меня просили прокомментировать провал Apple Intelligence, я очень удивился и был сдержан в выражениях. Все же Apple последние лет 10 уж точно был компанией победившего маркетинга, а по технологиям в продуктах отставал от конкурентов на пару-тройку лет, однако все-таки в конечном счете делал откровенно удобные решения. Я вежливо объяснял, что ну не работает после релиза, и ладно, так бывает, будет еще десяток апдейтов и заработает, что бухтеть-то.
Но вот сегодня половина твиттера обсуждает яблочную статью The illusion of thinking и теперь у меня закралась определенная тревога по поводу дел с AI в Apple (не потому что статья не супер, а потому что нет более интересных от них и как будто идут по пути наименьшего сопротивления в поисках о чем написать). Статья в сухом остатке про «мы придумали еще один бенчмарк» и «нам не понравилось, как LRM с ним справляется». Бенчмарк в виде задачек про ханойские башни и волка-козу-капусту (и еще 2 типа заданий) с регулируемым уровнем сложности. Основная претензия к LRM - Large Reasoning Models - в том, что они, видите ли, не понимают какие-то концепты и рассуждают, а пытаются вспоминать и воспроизводить заученные паттерны (алё, вы в курсе какую задачу решают языковые модели?)))), судя по тому, как они справляются с бенчмарком. И, о ужас, мы с вами так далеки от AGI, гораздо дальше чем Альтман говорит инвесторам 🤡
Это конечно офигеть какая новость (конечно же нет 😐), однако как человек много работающий с обучением живых людей, могу сказать, что радикального отличия не вижу. Как только человек существенно выходит за пределы знакомых задач и знакомой ситуации, первым делом активируется воспроизведение знакомых паттернов и попытка из них собрать решение, словно Кай слово «вечность» из ледышек или инженер что угодно из говна, палок и синей изоленты. Только единицы начинают в незнакомой ситуации разбираться в основных концептах и правилах игры, а затем придумывать алгоритмы решения задачи, большинство же людей так делает только внутри той области, где уже более-менее комфортно разбирается.
Касательно нытья о том, что LRM не рассуждает, а воспроизводит паттерны, вспоминается один частый вопрос про возможности AI: “Могла бы LLM придумать квантовую механику или общую теорию относительности?”. Скорее всего, нет, по крайней мере в ближайшие годы наверняка нет (но буду рад оказаться неправ). Зато пересказывать и немного дописывать за другими, сразу владея последними публикациями человечества по любой теме - легко. И это тоже сильное преимущество, которого у людей нет, и которое даже с поисковиком наверстывается долго. Возможно, нам не стоит переоценивать себя и говорить, что такой интеллект «недостаточно general». Это скорее Гейзенберг и Эйнштейн исключения из нормального представления об интеллекте, а эрудированный попугай вполне себе general intelligence :)
🏌️Каких рисков боятся крестные отцы AI: часть 2
Вот конкретные механизмы, которые пионеры AI упоминают в своих выступлениях и интервью:
🔴 Йошуа Бенжио беспокоится о появлении автономных агентов, способных ставить собственные цели и оптимизировать их вне рамок, заданных человеком.
Речь не о злом ИИ, а об ИИ, у которого цели не совпадают с нашими.
🟠 Джеффри Хинтон делает акцент на внезапности и необратимости появления ИИ, способного манипулировать людьми лучше самих людей — например, под видом помощника или советника.
ИИ, способный сам обучать себя, писать код, копировать себя в облаке и обманывать системы контроля может "выйти из-под контроля" даже без злого умысла.
Возможная перспектива - армия дешёвых цифровых агентов, которые могут распространять фейки и дестабилизировать общество или внедряться в стратегические решения на уровне стран.
🟢 Янн ЛеКун — скептик экзистенциальных угроз, но признаёт возможность злоупотреблений ИИ со стороны людей (не самого ИИ) и считает это основным вектором риска.
Он опасается не «восстания машин», а усиления уже существующих систем давления и неравенства с помощью ИИ.
Ищу старшего аналитика в Dwelly (ещё одного)
// ИИ не захватит мир сам, ему нужно помочь
Диджитализируем и оптимизируем аренду квартир в UK. Через классный продукт и оптимальные бизнес-процессы поднимаем маржинальность бизнеса агентств недвижимости со средних 10% до 40%.
Эта роль подразумевает исследования и оптимизацию нашего основного продукта: CRM, через которую проходят и контролируются все процессы управления недвижимостью: от взимания платежей с арендаторов до решениях их проблем с водопроводными кранами.
⚙️ Вот пример одного процесса, который оптимизирует наш продукт:
— За месяц до окончания срока действия сертификата электрической безопасности всплывает напоминание, что пора начать процесс инспекции и обновления сертификата.
— Рассылаются запросы на инспекцию по конкретному адресу нескольким поставщикам. Те, кто готовы, присылают стоимость.
— Выбирается лучший поставщик — ему сообщается контакт арендатора, чтобы он созвонился и договорился о дате визита.
— Затем у поставщика нужно получить актуальный статус и дату визита.
— В дату визита нужно проверить, что поставщик прислал результаты инспекции, иначе — напомнить.
— По результатам инспекции могут быть замечания, требующие исправления / ремонта.
— В случае замечаний нужно прокотировать стоимость ремонта у нескольких поставщиков.
— Лучшего поставщика и стоимость услуг нужно подтвердить у лендлорда.
— После этого нужно отдать контакт арендатора поставщику.
— <начался ещё один круг>
— В конце нужно не забыть выставить и оплатить все счета во все стороны — и в конце концов обновить данные о сертификате.
🔍 Зачем тут аналитика:
— понимать воронки всех коммуникаций (со всех сторон) и улучшать их,
— понимать тайминги всех процессов и улучшать качество сервиса,
— уметь выбирать правильных поставщиков,
— что такое качество поставщика? время, уходящее на бронирование визита? время до даты визита? а что если поставщик реагирует на имейл за минуты, но планирует ремонт только через 6 дней? а что если срок такой большой по инициативе арендатора (он не смог раньше), а не поставщика? на какой сигнал нужно посмотреть, чтобы это понять?
— когда робот сбоит и зовёт человека на помощь, сколько времени уходит на реакцию живого человека? насколько это оправдано? можно ли улучшить скрипт, чтобы робот справлялся сам?
— как действовать, если клиент звонит по телефону и нужно вмешаться в автоматический флоу?
— какой перформанс у разных сотрудников? а сколько теперь нужно сотрудников, чтобы справляться с прежней работой?
— а нужно ли включать выходные в расчёте таймингов по задачам? а нерабочее время в целом?
— а точно ли мы покрыли все сценарии управления недвижимостью в нашем продукте? а что координаторы делают ещё полдня вне CRM, общаясь по телефону?
Появилась вторая часть моего разговора с Валерием Бабушкиным
Читать полностью…Сегодня попал в Сити на один форум и вынужден был слушать в панели экспертования манагеров-каналий про рекомы, чуть руку не сломал борцовским приемом «фейспалм» 🤦♂️.
Все эти «на самом дела» и прочие «здравые смыслы», и «я 5 лет в отрасли и знаю что нужно пользователю» 🤦♂️.
Ни намека на метрики и A/B, зато вопросы. В духе: А как сделать так чтобы рекомендации были социально справедливыми? Знаете ответ? «А давайте снимать только хороший, патриотический контент».
Прям в стиле песни Захар Борисовича
Для таких вот у меня есть коробок вполне публичных примеров (а после беседы с пиар-службой кейсы теперь приходится фильтровать — заметили как их стало меньше в канале? — правда, большая часть просто ушла в отложку в 2026й)
Итак, канальи думали что SJM чем короче тем лучше, и вообще одной красной кнопки «купить» достаточно.
Ха раз
Ха второй раз
Добавление доп шагов к форме регистрации или к процессу покупки — увеличивает конверсии а не уменьшает! В их конкретных кейсах!
Другие канальи решили что если показывать что продукт популярен в соцсетях (social proof) то конверсия будет больше, но увы
А здесь вообще в одной статье собраны противоположные результаты : в одном продукте перфомят длинные тексты, в другом короткие. В одном продают простые заголовки, в другом сложные.
Пользователи охотнее делятся шортсами или длинными?
Надо проверять именно в вашем сервисе, а мб вообще в конкретной категории.
Смотрите с опаской на тех кто «знает как думает пользователь».
PS и самое вкусное, для тех кто не читал Ходжу Насреддина
На платформе Unbounce провели A/B-тест: Get MY free 30-day trial против Get YOUR 30-day trial
Результат, ожидаемо, на картинке к посту
Однажды Насреддин увидел толпу возле пруда, что рядом с мечетью. Подойдя поближе, он увидел, что в пруду тонет мулла. Люди кричали ему: "Дайте руку, почтеннейший, дайте руку! ", но тот только булькал и руки не протягивал. Тогда Насреддин подбежал и закричал: "Нате руку, почтеннейший, нате! " -- и мулла схватился. Когда люди спросили Ходжу, как ему удалось спасти муллу, он ответил:
-- Глупцы! Разве можно говорить мулле "Дайте"! Он понимает только "Нате"!
Важно помнить, что Product-Market Fit (PMF) можно не только найти, но и потерять.
Можно посмотреть на востребованность StackOverflow, главной площадки где разработчики спрашивают вопросы и получают ответы.
С выпуска ChatGPT, количество вопросов, которые люди задают кратно снизилось.
P.s. хотел отдельно поделиться классным графиком, но тут прилетел релевантный кадр с сегодняшнего выступления:)
В тему Валеры: кто смотрел интервью, знает, что мы познакомились вживую лет семь назад на Матемаркетинге (конференция такая для менеджеров, аналитиков, ну и вообще много для кого еще). Матемаркетинг проходит осенью, а весной у тех же организаторов есть Aha Conf
Так вот в этом году она проходит уже сегодня и завтра, сегодня в 15:45 выступаю со своим докладом («Задачи, за которые компании платят сейчас и будут платить дальше») и оба дня будут доклады по ML на партнерских сессиях школы MLinside и Aha. Так что спустя семь лет я наконец-то иду на Матемаркетинг и Aha со своей собственной компанией как партнер, а не только как спикер :)))
После конфы поделюсь впечатлениями здесь. Надеюсь все пройдет норм, но ощущения немного как перед первым выступлением))
P.S.: Если вдруг кто-то хочет залететь в последний момент - промокод MLINSIDE дает скидку 20%
Дорогие друзья!
Спешу сообщить, что серия эфиров на ProductAnalytix">ютуб канале Продакт Аналитикс продолжается, а посему имею удовольствие анонсировать следующий эфир, который состоится уже завтра, 29 мая в 18:00 по московскому времени .
На этот раз нашим гостем будет многоуважаемый AI и ML эксперт, ex- CDO МТС, ex-CDS Яндекс. Такси , ex-ABBYY, автор канала Кантор AI, автор курсов MLInside , а также известный многим как автор специализации на Coursera ‘Машинное обучение и анализ данных’ от МФТИ и Яндекса Виктор Кантор 💎
О чем будем говорить:
• Куда ведут нас современные тренды AI/ML и как остаться на гребне волны
• С какими запросами приходит бизнес и какие софт- и хард-навыки нужны, чтобы стать классным топ-менеджером и удержаться на своей позиции
• Как пришла идея создания школы и чему актуально учить сейчас
• Насколько сильно отличается жизнь топ-менеджера и предпринимателя
Ваши вопросы , как и всегда, приветствуются, так что смело направляйте их в комментарии 👇
До встречи 🤗
Сходил сегодня на Датафест в Яндексе, где были только доклады про внутренние продукты. Что послушал:
• Спрос Яндекс Лавки: смесь Prophet и бустингов с дальнейшим разделением на продукты, регионы и там, где это улучшало метрики. TimeGPT не используем, так как в Prophet легко добавить выходные дни.
• У очень многих людей (2% или 20%) есть две колонки Алисы, и пришлось научиться понимать, к какой обращаются, и ещё учесть, что может быть несколько пользователей (мультиаккаунтинг). Во второй задаче ожидаемо лучше всего работает, когда человек сам об этом говорит.
• Большой доклад по рекомендациям в Яндекс Лавке. Суть в том, что работает двухбашенный подход с трансформером user-items, косинусные расстояния, которые передаются в бустинги, но дополнительно туда добавляются и сами запросы пользователей, и текущая корзина. И вот они попробовали это всё заменить графовой сеткой (PinSage + TwHIN, где ребра товар-корзина), иииии.... метрики упали. Что не понял, это что при первом запуске бизнес метрики упали, и только когда модель дофитили на результатах 1го запуска - метрики позеленели, это бага или фича? Сейчас же до 20% GMV - за счет рекомендаций
• Экран отписки от Плюса – метрика средней выручки с сохранившихся на экране пользователей с вычетом затрат на сохранение. Ранжирование не работает, так как лучше всего сохраняет скидка на подписку, предиктивно с оттоком не начинали, всё на бустингах
• Активно используют VLM для нейро и оффлайн эмбедингов для поиска картинок. Но интересно что нейро пока не научились монетизировать
Если выше это доклады из бизнесовой секции, то еще была 2я техническая, но слишком техническая. Например «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера» 🫡
P.S. Конференция растет, сидр уже давно, а вот кальяны — это что-то новое. И даже был квиз. Доклады можно посмотреть и в записи потом, а так главное там это живое общение
🎧 Что включить на фоне, когда работаешь/ботаешь
Прочитал пост Леры и ощутил тот неловкий момент, когда люди обсуждают, какая специальная музыка на фоне лучше для продуктивности, а ты всегда ботаешь либо под бесплатную для всех lofi girl на youtube, либо под металлику, либо под радио воруй-убивай, и не понимаешь этот ваш прикол с делта/гамма/сигма-ритмами для засыпания/работы/концентрации. Кому-то помогает что-то специализированное? Или тоже считаете, что это просто маркетинг? Может кто-то изучал тему глубоко?
Раньше любил генеративную музыку в Mubert (они начали ее делать до того, как GenAI стал всеобщим мейнстримом), но теперь зашел к ним на сайт и показалось, что ребята испортились, побежав повторять за Suno. Пользоваться мубертом как раньше не смог, хотя долго был подписчиком.
❓❓❓Раз уж на то пошло, кто что на фоне ставит, когда нужно надолго уйти в концентрированную работу?