kantor_ai | Unsorted

Telegram-канал kantor_ai - Kantor.AI

11059

Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap РКН: 5140322136

Subscribe to a channel

Kantor.AI

​​🔥🔥🔥 Отчет по рынку AI на 456 страниц от Stanford!

Да, огромный отчет, просто качайте его из сообщения ниже и читайте.

Никаких саммари привести просто невозможно, там 8 глав про technical performance, R&D, responsible AI, economy, science, policy, education and public opinion. Читайте интересные вам.

На что хочется обратить ваше внимание?

1/ 44.48% научных публикаций по AI в 2024 году было сделано исследователями из Азии (это отдельно East Asia и South Asia) и только 10.31% из Северной Америки. 🇨🇳 Китай против 🇺🇸 США в основном. 🇪🇺 Европа, кстати, выше США с 18.15%.

2/ Из всех публикаций только ~5.4% касаются Generative AI. В лидерах Machine Learning с ~75.7%.

3/ По количеству патентов на душу населения 🇺🇸 США и 🇨🇳 Китай идут очень близко и с 5.20 патентов и 6.08 занимают 4 и 3 место, соответственно. На первом месте 🇰🇷 Южная Корея с 17.27, далее 🇱🇺 Люксембург с 15.31.

4/ Однако по количеству заметных AI моделей 🇺🇸 США сильно впереди 🇨🇳 Китая – 40 против 15. Забавно, что моделей все же не так много, потому что на 3-м месте и далее страны с 1-й моделью (у 🇮🇱 Израиля, например, столько же, сколько у 🇸🇦 Саудовской Аравии).

5/ На Github 4.32М опенсорсных AI проектов.

6/ AI Agents пока еще не очень точные – самая топовая модель GPT-4o имеет success rate всего 36.2%.

7/ Всего в 2024 году зафиксировано 233 крупных инцидента с AI (типа как когда система определения лица определило неверного человека и его арестовали, или автономное авто совершило аварию).

8/ От 1.25% всех вакансий в 🇳🇱 Нидерландах до 3.27% всех вакансий в 🇸🇬 Сингапуре требуют AI skills.

9/ Где больше всего талантов в области AI?
Топ 3:
🇮🇱 Израиль 1.98%
🇸🇬 Сингапур: 1.64%
🇱🇺 Люксембург: 1.44%

Топ-3 страны по миграции AI талантов на 10,000 Linkedin members:
🇱🇺 Люксембург: 8.92%
🇨🇾 Кипр: 4.67%
🇦🇪 ОАЭ: 4.13%

10/ Всего в 2024 году появилось более 2,000 AI компаний, которые еще и привлекли венчурное финансирование.

Это только капля в море. Читайте отчет, данных куча.

@proVenture

#ai #research

Читать полностью…

Kantor.AI

В Data Science все начинается с Титаника 🚢

Вручил главному любителю профессионалу лего в data тусовке символичный подарок. К слову, угадайте с кем будет следующее интервью на ml_inside?si=zmnQnRB2bunk0f9K">канале MLinside? ;)

Читать полностью…

Kantor.AI

О том, как и зачем переходят из DS в продакты, и чем знание ML помогает в этой работе

Читать полностью…

Kantor.AI

К вопросу о том, нужна ли математика, чтобы заниматься машинным обучением. Этот пример очень хорошо иллюстрирует ситуацию: если вы хотите понимать, почему все работает так, как работает - нужна. Если вы хотите использовать как черный ящик - достаточно очень базовых понятий. И я не топлю ни за один, ни за другой вариант: есть тысячи людей по всему миру, которые успешно обучают ML-модели, не владея математическим аппаратом достаточным для понимания pdf из поста выше, отлично себя чувствуют, и модели их ничуть не хуже. А есть тысячи людей по всему миру, которые назовут математику из этой же pdf детской и тривиальной, т.к. способны работать и с более сложным математическим аппаратом (который тоже можно использовать в ML, например вот: https://arxiv.org/abs/2201.09656)

Читать полностью…

Kantor.AI

Взял из поста президента Шопифая в линкедине

Читать полностью…

Kantor.AI

Чем хуже тем лучше

Заметил интересную особенность своего тайм-менеджмента: если я мало успеваю, наиболее действенное решение - навалить дел еще побольше. Мозг удивительно изворотлив в том, чтобы находить отмазы, оправдания и вообще всячески лениться. В ситуации, когда некогда страдать фигней, мысли волшебным образом начинают идти в нужном направлении.

Отчасти за прокрастинацией стоит интуитивное понимание неоптимальности происходящего: вот я пытаюсь заставить себя сделать слайды к лекции за два часа и записать лекцию еще за час, а в глубине души понимаю, что что-то не так. И выясняю, что именно: нужно 10-20 часов потратить на подготовку, вспоминание всего, что хочется рассказать, структурирование и продумывание изложения, а потом еще 6 часов на слайды, и только потом записывать. Потому и не хотелось делать быстро и в рамках существующих слотов в расписании. Плохо ли, что есть это сопротивление мозга в такой задаче? Плохо ли, что не всегда получается делать "методом прогрессивного джипега"? Да, в общем-то, мне нормально, я так-то удовольствие должен получать от своей работы, а не быстрее-быстрее в сроки запихать. Да и люди в конце-концов тоже не дураки, видят разницу между нормально подготовленным контентом и халтурой.

Но вот другой пример: грустил я, тосковал, что протерял где-то свою прежнюю производительность труда, чувствую какую-то постоянную усталость, делать ничего не хочу, вот дайте мне одеяло и подушку часов на 12 в сутки, а еще на 8 кресло и камин. И кота наглаживать. Оставшиеся 4 часа я, так и быть, готов есть и общаться с какими-то людьми. Так-то если на недельку-другую, то дело благородное: отчего ж не поваляться. Но вот что-то затягивалось это все, и даже витамин D не помогал :)

И так я голову ломал и эдак, пока однажды проснувшись утром не начал прям не вставая с кровати работать. Взял ноут и занялся тем, что мне интересно и полезно для нашей школы ML. И такого запредельного буста бодрости у меня давно не было. Смотрели "Области тьмы"? Вот, честное слово, работа - чистый NZT. Только вот работа работе рознь. По встречам ходить языком трепаться дело хорошее, важное, но сколько вот эти встречи длятся? Ну час, ну два, ну по верхам потрепались и разбежались. А когда делаю что-то часов на 6-8 увлеченной работы - вот уж точно кайф. Тут вам и пресловутое состояние потока и незаметное течение времени при минимальных отвлечениях.

И так кстати со многими вещами, которые много раз начинал и не особо продвигались. Вот, например, я еще со школьных лет очень много людей подсадил на разные тайм-менеджерские техники. Но внедрить в свою повседневную жизнь какой-нибудь GTD или хотя б по Архангельскому Глебу планировать - фиг там. Зато как только я начинаю упорото вести хронометраж - вот тут прям сразу все становится чётко. Ну просит душа хардкора, а не эти ваши лавандовые рафы продуктивности без стресса.

С чем эти причуды моей психики связаны - с Физтеховским ПТСР ли, или еще с какой дурью в голове - кто его знает. Но общие наблюдения такие:

1) Если тяжело даются простые задачки - возьмись за задачки со звездочками, возможно ты не "не готов", а не заинтересован, вот и весь секрет.
2) Очень неплохое лекарство от приунывания - работа в удовольствие с глубоким погружением. Засада лишь в том, что аппетит приходит во время еды. Бывает будешь месяц избегать что-то сделать, а потом узнаешь, что именно это дело тебе и было самым классными и интересным. В общем, не нужно бояться: иногда то, что мы боимся делать, и есть то, чего мы действительно хотим.

Читать полностью…

Kantor.AI

Правда ли неплохих кандидатов отфильтровывают HRы?

Есть куча баек про то, как тимлид, недовольный отсутствием кандидатов на вакансию, идет в эйчар, сам берет несколько резюме и нанимает себе человека за неделю. А на вопросы в духе "почему вот этому отказали?" получает фантастические ответы в духе "у него ведь непрофильное образование" и другие гениальные реплики.

У меня заканчивает обучение первый поток Базы ML в MLinside, и я предлагаю как раз проверить эти байки про HR. План следующий: показываем несколько резюме тимлиду DS, если какие-то из них ему нравятся и хочется пообщаться, то не сразу ставим собеседование, а сначала на общих основаниях подаем резюме через отклик на вакансию. Если через две недели ничего не происходит, явно просим организовать собеседование с конкретным кандидатом. А тимлид получает отличную возможность поспрашивать HR, почему кандидат до него не дошел с первой попытки :)

Кто хочет поучаствовать в эксперименте в роли тимлида DS (и уже им работает😁) - пишите мне в личку: @vkantor

На всякий случай уточню: разумеется, после "Базы ML" мои студенты претендуют в основном на джунские позиции.

Читать полностью…

Kantor.AI

Выпустили на YouTube-канале MLinside новое видео с директором ШАД Лешей Толстиковым

В прошлый раз у нас было объективно мало времени и многое не удалось обсудить. В новом видео очень много говорим о ШАДе и о вопросах отбора слушателей на образовательную программу и их дальнейшего обучения.

Читать полностью…

Kantor.AI

Как вы относитесь к таким вот курсам?

Сначала увидел в интернете рекламу, удивился, перешел, и нашел это всё довольно забавным, даже наверное смешным. Особенно "10000 выпускников нашли работу". Кем? Критическим мыслителем?) Может теперь гончарные курсы или курсы кройки и шитья начнут считать, сколько их выпускников менеджерами устроились? В общем сам лендинг вполне себе тянет на домашку по курсу :)

С другой стороны, а вдруг наконец-то научатся??? 🤔🤔🤔

Читать полностью…

Kantor.AI

Ну что, пережили первоапрельскую шутку про тренинги личностного роста? Не останавливаемся на достигнутом

Читать полностью…

Kantor.AI

🚀Прими участие в ML Cup 2025 от Авито и выиграй 1,2 миллиона рублей!

Ты — специалист в области машинного обучения? Хочешь проверить свои силы в реальных задачах, с которыми ежедневно сталкиваются 1000+ специалистов Авито? Тогда не упусти шанс стать частью крупнейшего соревнования в этой области!

Что тебя ждет:

☑️Денежный призовой фонд
☑️Автоматизированная оценка решений
☑️2 практические задачи:

1️⃣Персональные рекомендации — предскажи, какие товары вызовут интерес у миллионов пользователей → ссылка на регистрацию.

2️⃣Поиск дублей — как с помощью CV находить похожие объявления даже при разных текстах и ракурсах фото → ссылка на регистрацию.

Выбирай одну или обе задачи, показывай лучшие результаты и получай шанс на победу! Участвовать можно как индивидуально, так и в команде до 4 человек. Загружай до 5 решений в день.

Регистрация уже открыта! Подробности и анкета по ссылкам выше.

Читать полностью…

Kantor.AI

Я принял волевое решение завязать с AI

И начать проводить тренинги личностного роста для сотрудников корпораций. Как строить карьеру, как работать с начальством, как стать руководителем и потом не распугать сотрудников, что делать, если сотрудник пытается вас «подсидеть», а коллега «слить» - вот это всё как мы любим.

Вдохновился конечно примером Блиновской, и тем что в сфере тренингов личностного роста клиент не должен быть готов к высшмату и программированию (в отличие от обучения DSов)

Еще мне сказали добавить в пост что-то про увеличение заработка, но я только начинающий личностный тренер (джун))) и пока не придумал продающих обещаний. Но точно вырастет, даю слово пацана.

Ставьте какашку, если купили бы 😁😁😁

Читать полностью…

Kantor.AI

Выбираем инфраструктуру для LLM 🎛

Присоединяйтесь к дискуссии о том, как облачные решения и выделенные серверы ускоряют обучение и внедрение больших языковых моделей. Обменяйтесь мнениями с лидерами рынка из neuro.net и Selectel на бизнес-ужине.

Смотреть подробную программу

На мероприятии будут камерные и комфортные условия, чтобы вы:
— познакомились с лучшими кейсами;
— обменялись опытом с коллегами;
— получили обратную связь от экспертов.

🗓 Когда: 26 марта, 19:00.
📍 Где: Москва, м. Пушкинская (офлайн, записи не будет)
👥 Для кого: IT-руководителей в отделах ML, CTO, CDO, CIO и других топ-специалостов, отвечающих за IT-инфраструктуру для ML.

👤 Зарегистрироваться

*Количество мест ограничено, после регистрации с вами обязательно свяжутся

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqvBPSqu

Читать полностью…

Kantor.AI

Срочные новости: в Тильду (конструктор сайтов) завезли AI 😱🔥

Я вообще очень нежно люблю Тильду, много раз ей приходилось пользоваться. Ребята очень крутые, что настолько упростили и сделали доступной верстку лендингов. Но оказалось, что команда Тильды следит за трендами и пошла дальше. Буквально на днях прислали мне для рекламы текст про их AI-функционал. Вот что пишут 👇

Если вы хотите создать свой сайт, который будет хорошо выглядеть на любом устройстве, но у вас нет подходящих навыков — попробуйте сгенерировать его за несколько минут в конструкторе сайтов Тильда.

Как это работает?
1. Вы вводите тематику вашего сайта. Например, сайт фитнес-студии или кофейни. Добавляете деталей, чтобы получить более качественный результат.
2. Уточняете запрос. Например, цветовую палитру или цель создания страницы.
3. AI подбирает подходящие блоки, изображения и пишет тексты.
4. Все готово! Вы можете легко кастомизировать сгенерированную страницу или сразу её опубликовать. Адаптировать мобильную версию не нужно, это происходит автоматически.

Еще в Тильде AI может генерировать тексты для конкретных блоков. Например, расписать преимущества компании или описание услуг. Также нейросеть поможет отредактировать ваш текст: изменить формулировку, сделать его короче или, наоборот, длиннее.

Искусственным интеллектом можно пользоваться на бесплатном тарифе Тильды. Узнайте больше о возможностях AI и попробуйте в своем проекте 👉 https://tilda.link/c115/?erid=2SDnjdpPZMW

Публикую этот пост и иду тестить. Обещаю потом поделиться впечатлениями 🙂

Читать полностью…

Kantor.AI

Шутки про data quality в конгрессе

Никогда не думал, что застану при жизни шутки в конгрессе США про качество данных в базах данных по населению. А твиттерские даже не выкупили стёб Трампа 🤣

Читать полностью…

Kantor.AI

Отчет Stanford HAI о развитии рынка AI

Какие-то подозрительные числа по топам стран. Ну и аналитика в духе «у вас тут машинлернинг или gen ai» грубовато звучит. Возможно это объясняет объем отчета (456 страниц): все равно никто не изучит его полностью.

Впрочем, это конечно все равно довольно поверхностные претензии, чтобы дать нормальную оценку надо вооружаться LLMками и «читать», попутно тренируясь отличать ответ по делу от галлюцинации.

Читать полностью…

Kantor.AI

▶️ На нашем YouTube-канале вышло интервью с Константином Чукреевым — Growth Product Lead в Manychat, ранее работал в Яндекс Лавке, где за короткий срок прошел путь от ML-разработчика до продакт менеджера уровня Middle+.

Константин рассказывает:
▪️ Как он переходил из аналитики и ML в продакт-менеджмент.
▪️ Какие задачи решал в Яндексе и Manychat.
▪️ Какие навыки нужны продактам и ML-специалистам для развития.
▪️Советы молодым специалистам по Data Science и ML
▪️ Будущее чатботов с ИИ и перспективы AI через 5–10 лет.
▪️ Как делать карьерный переход и кому стоит идти в продакт-менеджмент

🎯 Интервью для тех, кто хочет развиваться на стыке ML, аналитики и продукта.

🔥Спойлер: если вы хотите курс от MLinside и Константина специально для продакт-менеджеров — обязательно посмотрите это интервью!

👉 Смотреть здесь

Читать полностью…

Kantor.AI

Учитесь в универе и хотите узнать больше про NLP? Регистрируйтесь на бесплатный NLP-студкемп от Яндекс Образования и НГУ! Интенсив пройдет с 14 по 26 июля в Новосибирске, дорогу и проживание оплачивает организатор.

Обработка естественного языка с помощью ИИ все больше входит в нашу жизнь, но как быстро погрузиться в то, что работает под капотом? За две недели — с 14 по 26 июля — вы разложите современный NLP по полочкам — от теории до практики:
💡 поработаете с бенчмарками и обучающими датасетами;
💡 узнаете, как работают методы Deep Learning в NLP — от механизма внимания и трансформеров до мультимодальных LLM и RAG;
💡 сравните модели YandexGPT и Qwen;
💡 создадите свой проект на стыке науки и бизнеса.

Всё это — бесплатно и под руководством экспертов из Яндекса и НГУ. С вас — только желание развиваться и пройти отбор.

Заявку нужно оставить до 18 мая. Регистрируйтесь прямо сейчас и проведите лето с пользой!

Читать полностью…

Kantor.AI

Подвел итог в виде PDF с тремя достаточно строгими доказательствами :) Кто любит математику и кому интересно, как же аккуратно показать разреживающее свойство L1 регуляризатора - см. PDF в аттаче

Читать полностью…

Kantor.AI

У меня эта картинка внезапно ассоциируется с обучением с помощью ChatGPT и ему подобных нейросетевых сервисов. Самый крутой кейс использования в моей практике: супер-быстрое обучение без боязни чувствовать себя неловко. И особенно эффективно - вспоминание уже забытого :)

Но основной смысл картинки конечно тоже очень правильный. Открытость, непосредственность и отсутствие ужаса перед ошибками и глупыми вопросами фантастически бустит конструктивность вашей деятельности, не только обучения.

Читать полностью…

Kantor.AI

🔥Яндекс-браузер теперь переводит иностранные ролики так, что голос звучит почти как у оригинального автора — тембр и интонации сохраняются!

Без преувеличения, это та фича, которой я очень ждал :) Идея простая: положить конец «робопереводчикам», которые рушат атмосферу видео. Фокус апдейта — в генеративной модели, которая умеет делать «отпечаток» голоса спикера, а потом озвучить текст на другом языке тем же тембром.

Коллеги из Яндекса очень хорошо позаботились о скорости: перевод и озвучка происходят почти без задержки, так что смотреть можно сразу, не дожидаясь обработки. Собственно оптимизация и встраивание прямо в браузер и есть главная фишка: так-то уже давно мы видим примеры, когда заранее известное видео кастомно переводят, сохраняя голос и интонацию, а вот поставить все на поток и заставить работать на лету - это правда круто ❤️

Ценность фичи очевидна: любимый контент на YouTube или других платформах с ней звучит по-русски, но с привычной подачей автора. Это снижает порог для тех, кому сложно воспринимать лекции или интервью на английском на слух, и открывает дорогу к гораздо более «живым» локализациям подкастов и онлайн-курсов.

Как попробовать:
обновите Яндекс-браузер до свежей версии, включите «Перевод видео» в меню плеера и выберите русский звук. На роликах с поддерживаемыми языками вы услышите новую озвучку. Сравните с оригиналом — напишите в комментах, насколько похоже получилось, и где ещё нужен по-вашему такой voice-cloning-перевод :)

Читать полностью…

Kantor.AI

Митап ML-комьюнити

MLечный путь – ежегодный митап от Selectel для всех, кто делает ML. В этот раз делают фокус на практике и живом общении.

📍 23 апреля, 18:00, в офисе Selectel в Санкт-Петербурге и онлайн

Разберут реальные кейсы:
- инференс в рентген-вагоне,
- развертывание Edge-AI для комбайнов,
- использование Shared- и MultiGPU Inference.

Из новых форматов – ML Startup Pitch, где вы сможете дать фидбек по чужим проектам и получить идеи для улучшения своих.

Смотрите программу и регистрируйтесь по ссылке: https://slc.tl/fqyeh

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2Vtzqxhy1UE

Читать полностью…

Kantor.AI

Новый набор в ШАД

❗️Cейчас вовсю идет новый набор в Школу Анализа Данных Яндекса. ШАД был открыт аж в далеком 2007 году и стал первопроходцем образовательных программ по Computer Science и Data Science от коммерческих компаний.

В первые 5-7 лет в других компаниях ШАД был мемом. Любые образовательные инициативы корпоративные менеджеры часто комментировали «ну мы тут не будем жечь деньги в топке как Яндекс со своим ШАДом, мы же не благотворительная организация». Почему так? А очень просто: стоимость одного нанятого выпускника с учетом всех расходов на ШАД составляла более 1 миллиона рублей (я в Яндексе не работаю, поэтому могу смело называть числа, которые слышал). Согласитесь, за эту круглую сумму даже сейчас любой рекрутер загоняет джуна в поле, не то что в компанию наймет :)

Недальновидные корпоративные менеджеры ожидаемо крутили пальцем у виска, глядя на ШАД. А многие крутят до сих пор, если видят похожую экономику на старте своих проектов и закрывают их как только эйчар оказывается дешевле. Но ШАД тем временем создал репутацию, создал свою среду и тусовку очень умных людей (как студентов, так и преподавателей), стал поставлять Яндексу не только более крутые кадры, чем были на рынке, но и мега лояльных людей, для которых Яндекс стал семьей. Инвестиции кратно себя оправдали, сформировав сотни, если не тысячи сотрудников, которые не уходят из офиса ни в 18, ни в 20, не переходят на зарплаты втрое больше в другие компании, и больше всего ценят работу с умными людьми над интересной задачей. И это честный win-win: выиграла не только компания, но и люди, которые реально получают удовольствие от работы каждый день.

💪 Учиться в ШАДе очень сложно. Совмещать с работой или с семьей еще сложнее. А и с тем и с другим почти невозможно. Но если вы не боитесь трудностей, попробуйте поступить: https://shad.yandex.ru/special_graduates

🥇 Выпускник ШАД - это очень уважаемая в отрасли «лычка», но, конечно, еще более уважают за те знания, которые вы там получите. Смысл попробовать есть, но будьте готовы, что может потребоваться 3, 4, или даже 7 попыток, чтобы преуспеть. Свет клином на ШАДе конечно не сошелся: это не must, это точно нечто «сверх» того, что нужно Data Scientist’у, аналитику или разработчику. Но место хорошее, а для тех, кто любит по-жестче - лучшее :) Так что тем, кто будет поступать, желаю удачи, несгибаемости, и помнить, что все самое интересное впереди! 🤝❤️

Читать полностью…

Kantor.AI

Правда и мифы про рекомендательные системы

Записал подкаст про рекомендательные системы у друзей из онлайн-кинотеатра START :) Три замечательных гостя, три разных взгляда на область, рекомендую к просмотру 👍

Дисклеймер: контент для тех, кому интересна внутрянка, красивых сказок вроде этой или байки про пиво и памперсы не рассказываем

Читать полностью…

Kantor.AI

Последние дни регистрации на IT_ONE Cup. ML Challenge.

Создай AI-ассистента, который будет помогать в работе дизайнерам, системным и бизнес-аналитикам. Победители разделят призовой фонд в 1 500 000 рублей. Все участники смогут выиграть крутой мерч и приглашение в магистратуру ИТМО.

Регистрация открыта до 13 апреля включительно: https://cnrlink.com/itonecupmlkantor

Причины участвовать:
Достаточно создать Proof of concept сервиса, а не полноценный MVP.
Применишь свои знания в машинном обучении, обработке естественного языка и компьютерном зрении на практике.
Узнаешь самые действенные подходы к решению задач от экспертов.
Хватит базовых навыков в ML и желания экспериментировать – задачи не требуют обучения моделей с нуля.

На IT_ONE Cup. ML Challenge ты:
— Поработаешь с современными технологиями: LLM, NLP, RAG, MCP.
— Создашь AI-инструмент, который упростит работу других специалистов.
— Сможешь попасть в магистратуру ИТМО на факультет Программной инженерии и компьютерной техники. Число приглашений не ограничено – шанс будет у каждого.

Треки соревнования:
1. Динамические контекстные подсказки для системного аналитика.
2. AI-генератор дизайн-макетов по описанию требований.
3. Система визуализации BPMN-диаграмм.

Регистрируйся до 13 апреля включительно: https://cnrlink.com/itonecupmlkantor

Читать полностью…

Kantor.AI

Такие вот дела, а спрос-то есть) Может правда сделать курсы? :)

Читать полностью…

Kantor.AI

Сегодня мне исполнилось 33. Из последних новостей:

🏠 Переехал в дом, теперь смотрю на сосны и наслаждаюсь свежим воздухом. Очень нравится.

🎓 Продолжаю делать школу machine learning. Сейчас заканчивается наш первый поток в b2c (🥳🎉) и стартуют большие b2b проекты. Еще мы готовим запуск уже этой осенью совместных магистратур с очень крутыми учебными заведениями, но об этом расскажу подробнее, когда из предварительных договоренностей это превратится в программы, на которые уже ведется набор

🥚 Продолжаю с большим удовольствием заниматься кафедрами в Вышке и МФТИ и факультетом в МФТИ, в открытии которого довелось поучаствовать, благодаря работе в МТС. Начал получать удовольствие не только от ведения курсов, но и от методических советов и прочей сопутствующей деятельности. Не знаю, старость это или наконец-то начал понимать, зачем всё это нужно, но правда есть приятное ощущение, что у нас получается очень классная программа и крутой факультет :)

Читать полностью…

Kantor.AI

Ну что же, 300 🔥 есть, начинаем обсуждать вопросы с собесов.

Вот два вопроса на насущную тему «а сколько данных нужно». Делимся своими мыслями, потом подведу итоги :)

1. При обучении модели качество получилось недостаточно высоким. Была выдвинута гипотеза, что проблема в недостаточном объеме обучающей выборки. Как можно проверить эту гипотезу?

2. Часто данные не размечены, и вам бизнес-заказчик задает вопрос, какой объем выборки разметить. Как до знакомства с данными ответить на этот вопрос? Какие статистики могут помочь? Какие эффекты возможны при недостатке данных?

Читать полностью…

Kantor.AI

Зачем вести канал в телеграме

🤔 У меня очень своеобразная причина для ведения TG канала. Начиналось все с потребности делиться какими-то вещами про работу, преподавание и ML. Потом жизнь как-то так сложилась, что потребность всецело закрывается общением с близкими, друзьями и студентами (как в универе, так и со взрослыми, у меня в школе, в Сколково и на корпоративных курсах).

🙅‍♂️ Казалось бы, время закрывать канал за ненадобностью. Но вот не совсем. Вы могли заметить, что в наше время любой фрик имеет возможность самовыразиться в интернете не только в комментах, но и как блоггер. Но откуда появляется это «любой фрик»? А дело в том, что правило «помолчи, может за умного сойдешь» работает фантастически стабильно. Стоит человеку начать делиться своими мыслями и рассуждениями, давать советы, оценивать ситуации, комментировать новости, сразу становится понятно, какой забористый кисель у него в голове вместо мозгов.

💼 Похожую ситуацию я часто видел в корпоративной карьере. Те люди, которые лучше всего разносят руководство за неоптимальное управление и наиболее пылко рассказывают, а как надо было, сами столкнувшись с вызовами управления стабильно оказываются не такими боевитыми, как на словах. Не мешки ворочать, короче. Пример с управлением это просто пример деятельности, включающей многокритериальную оптимизацию в условиях неполной информации, так-то аналогичных примеров хватает в любой профессии :)

🤦‍♂️ Но вот засада: когда стоишь в сторонке и критикуешь, легко забыть о самом главном. Сам-то такой же. Сам-то тоже как рот откроешь, так слова быстрее мыслей могут побежать, если нет тренировки. А как на публику что скажешь или напишешь, так вообще жуть: и этих обидел, и тем не мил, и те, к кому обращался, вообще не поняли, что сказать хотел.

🚀 Так вот самое классное и полезное применение TG канала для его автора это свое собственное развитие. Во-первых, тренировка по формулированию и донесению мыслей. Во-вторых, развитие навыка подбирать нужные слова с учетом всех рисков (а их, когда пишешь даже на сто человек, всегда много). Ну а в-третьих, если я через год читаю свои старые посты и думаю «Боже мой, какую же ересь я нёс!», я спокоен, ведь значит еще что-то меняется в голове.

❤️ А еще есть в-четвертых: интересно что-то вбросить и читать комменты. Правда классные вещи пишете, много новых мыслей, очень люблю своих подписчиков.

Пишите, кстати, в комментариях, что бы вы хотели чаще видеть в этом канале :)

Читать полностью…

Kantor.AI

Вопросы на собеседованиях по ML

Вчера готовился к вебинарам про вопросы с собеседований по ML (в конце базового курсс ML у нас есть опциональный модуль с разбором вопросов в качестве повторения пройденных тем).

С учетом того, что сам лет 10 собеседовал по DS, вспомнил порядка сотни вопросов, которые задавал сам или задавали коллеги. Дальше просмотрел около 300 вопросов, которые спрашивают на собеседованиях сейчас.

Из интересных наблюдений:

🥋 вопросы Avito неплохо перекликаются с Яндексовыми по уровню понимания ML (это комплимент Avito)

🧑‍🏫 есть любители поспрашивать про математику на собеседованиях (запомнились ПСБ и Okko, возможно были и другие)

🪦 вопросы про SVM, который уже давно нигде во всей красе не используется, хоть и встречаются редко, но бывают (правда не в IT-компаниях)

👴🏻 вопросы про PCA еще пока держатся, встречаются чаще, чем SVM, иногда спрашивают даже про SVD

🔥 наиболее частые вопросы такие, какие я и предполагал: логрегрессия, линейная регрессия, регуляризация, градиентный бустинг, иногда случайный лес, метрики качества.

Некоторые вопросы перекликаются с теми, которые я давным-давно в Яндексе сам вводил в употребление и добавлял в Фемиду (внутренняя система, где хранятся вопросы и результаты собеседований), либо добавляли коллеги по мотивам моих собеседований. Например, ставший классическим вопрос про то, какие алгоритмы могут давать отрицательные прогнозы на новых данных, обучившись только на неотрицательных таргетах. Не утверждаю конечно, что совпадающие с моими вопросы позаимствовали именно у меня (знаю человека, который искренне верит, что его идею украли Apple и Amazon, смотрится крайне забавно), но тот факт, что всех собеседующих притягивает примерно к одним и тем же вопросам, по модулю небольшого количества выбросов, меня скорее радует.

Напишите в комментариях:
1) какие у вас есть наблюдения насчет собесов по ML?
2) какие вопросы на ваш взгляд задают чаще всего, и какие вопросы вам запомнились?


А если пост наберет 300 🔥огонёчков, я буду выкладывать примеры вопросов с собеседований и свои комментарии в канале (давайте выясним, интересно вам это или нет :)

Читать полностью…
Subscribe to a channel