Понятно про анализ данных, технологии, нейросети и, конечно, SQL. Услуги — leftjoin.ru Обучение — https://stepik.org/users/431992492 Автор — @valiotti Реклама — @leftjoin_ads, @Spiral_Yuri Перечень РКН: https://tapthe.link/PpkTHavwS
Карьера в Data — новый проект LEFT JOIN
Поиск работы — занятие утомительное. Надо обновить резюме, перерыть гору вакансий, потратить время на сопроводительные, тестовые и собеседования... Не то, чем хочется заниматься без необходимости.
С обратной стороны тоже не все гладко: из огромного числа откликов предстоит отобрать подходящие, провести серию собеседований и заинтересовать кандидата.
💙 Мы LEFT JOIN решили, что в наших силах сделать этот процесс приятнее для всех участников — так уж получилось, что у нас большая аудитория, где есть и работодатели, и потенциальные сотрудники. Так что почему бы не создать для них специальный канал, где они смогут найти друг друга.
Канал так и назвали — Карьера в Data. Что будем постить?
🔵 Вакансии для аналитиков, дата-инженеров, дата-саентистов, продакт-менеджеров разных уровней — от джунов до тим лидов.
🔵 Советы от HR, как составить резюме, написать сопроводительное и не запороть собеседование.
🔵 Инсайты про рынок труда, количество вакансий и динамику зарплат.
🔵 Разборы тестовых заданий и советы, как построить карьеру в данных, от тех, кто уже это сделал.
Даже если не ищете работу прямо сейчас, будет много полезной информации, чтобы оставаться в курсе последних тенденций в нашей сфере. Убедитесь сами!
@leftjoin_career 🔥
ИИ-поисковик по мемам и не только
У предпринимателя Харпера Рида было 12 000 картинок с мемами, желание разобраться, что такое «векторные представления», и некоторое количество свободного времени. Все это привело к тому, что он создал простое приложение на основе мультимодальных моделей CLIP и siglip, которое умеет искать по картинкам.
Оно принимает как текстовые запросы, так и изображения. В первом случае оно подберет картинки, соответствующие запросу, во втором — найдет похожие в своей базе.
🔜 Работает с любыми изображениями. То есть его можно использовать не только поиска мемов для важных переговоров в интернете, но и, например, чтобы искать по фотографиям в галерее. Вдруг вам нужно оперативно собрать в кучу все фотки любимого кота.
🔜 Проверьте сами — приложение бесплатное и лежит на GitHub.
🔜 Заодно рекомендуем почитать пост про разработку. Он доказывает, что в любой теме можно разобраться — было бы желание. Харпер признался, что никогда не делал ничего похожего и вообще до сих пор плохо понимает, что такое «вектор». Но ему захотелось разработать приложение, и он это сделал вполне успешно.
И главное — показал, как это делал по этапам. Так что если тоже хотите попробовать сделать что-то подобное, вот отличный повод погрузиться в тему.
Data Heroes: интервью с Марией Бородецкой
«Синхронизация» — онлайн-школа, где рассказывают про культуру, искусство, психологию и софт-скиллы. Соосновательница Мария Бородецкая говорит, что это уже не совсем эдтех, а скорее проект по саморазвитию, и его главный конкурент — не другие школы, а Netflix.
Про что еще поговорили?
🔵 Как проект прошел путь от лекций «для себя и для друзей» до успешного стартапа и пережил ковид.
🔵 Почему оффлайн — это лакшери, а за онлайном и искусственным интеллектом будущее.
🔵 Какую роль играет культурный код при выходе на международные рынки.
🔵 Почему маркетинг — это здорово, но учиться лучше на философа, математика или искусствоведа.
🔵 Какие метрики бизнеса самые важные для предпринимателя в онлайн-образовании.
🔵 И причем здесь Юрий Дудь*?..
🔜 Где посмотреть: YouTube
Где послушать: Apple Podcasts, Яндекс Музыка, Spotify
#dataheroes
*Юрий Дудь признан в России иноагентом.
Postgres против всех
Чем сложнее проект, тем длиннее и запутаннее стек — это не всегда удобно, но неизбежно.
Или нет.
Часто стек растет, потому что под каждую задачу или проблему стараются подобрать наиболее подходящий инструмент. Но как выбрать этот «подходящий инструмент»? На что смотреть — на цену, скорость работы, простоту использования?
Или просто выбрать PostgreSQL? 👀
Нашли для вас короткую статью, почему вместо раздувания списка инструментов иногда можно просто выбрать проверенный временем, универсальный и понятный PostgreSQL.
Хотя по сути дело даже не в конкретной БД — на месте PostgreSQL может оказаться любой другой вариант. Дело в самом подходе — не усложнять себе жизнь, внедряя множество инструментов под разные задачи. И вместо этого стремиться к тому, чтобы ИТ-инфраструктура была понятной и не перегруженной. Так проще с ней работать и поддерживать работоспособность.
🔜 А что вы думаете — как найти баланс между перегруженностью и простотой, которая уже не тянет стоящие перед командой проекта задачи?
Стратегия управления на основе данных
Data-driven подход — это такая штука, к которой все стремятся, но не все понимают, что это такое и как к этому прийти.
▶️ Data-driven — это подход, когда все решения в компании принимаются на основе цифр. Чтобы этого добиться, нужно твердо понимать, зачем эти цифры нужны, о чем говорят и как влияют на развитие бизнеса. Система аналитики должна быть максимально согласована с целями и с миссией компании.
▶️ В идеале к этому состоянию надо идти по определенным шагам. Чтобы не превращать пост в простыню, вынес их на карточки.
Но что надо обязательно учесть: в реальности у большинства компаний нет точного понимания, как должна выглядеть аналитика и какие данные они хотят видеть. А делать выводы на основе цифр хочется уже сейчас.
В начале пути важно научиться работать со всеми доступными данными. Они уже у вас как-то собираются — например, в CRM-системе; можно начать собирать их в хранилище для построения отчетности, делать первые выводы, смотреть, чего не хватает. Постепенно бизнес будет развиваться и вместе с этим появится понимание, какие данные и метрики вам нужны. ❗️
@datakolya
OpenAI купила Rockset и Multi
Обе сделки выглядят как acqui-hire — покупка компании в первую очередь для того, чтобы нанять работающих в ней людей.
💬 Rockset — база данных для real-time аналитики. Она умеет оперативно обрабатывать огромные массивы данных и подходит для создания поисковых систем и рекомендательных алгоритмов, мониторинга и алертинга.
💬 OpenAI планирует интегрировать разработки Rockset в свои продукты. Предположительно, это поможет повысить точность ответов ChatGPT.
💬 Это хорошие новости для пользователей нейросети и не очень — для клиентов Rockset. Компания будет постепенно «отключать» их от своих сервисов и полностью сконцентрируется на работе на благо ИИ. Им придется найти новую БД до конца сентября.
Еще сложнее придется клиентам компании Multi.
💬 Multi — платформа для распределенных команд. Она позволяет расшаривать экран во время созвонов сразу нескольким пользователям, всем вместе редактировать документы, писать, рисовать на экране. В общем, работать удаленно, но всем вместе, как будто вы сидите рядом в одном помещении.
💬 Правда, только до 24 июля. После все данные клиентов будут удалены.
Вот такая цена прогресса — в любой момент может прийти OpenAI и присвоить себе ваш любимый сервис, чтобы он улучшал ChatGPT
Что получится, если заставить ChatGPT заполнить налоговую декларацию?
Программист Майк Макферсон решил это выяснить, а заодно — взглянуть на нейросети под довольно любопытным ракурсом. Их часто рассматривают как самостоятельный инструмент, который генерирует тексты, картинки, видео, код и так далее. Но что, если воспринимать ИИ как операционную систему, которая связывает несколько элементов вместе и помогает взаимодействовать с ними?
🔜 Возможности нейросетей сегодня впечатляют — и все же они до сих пор ограничены. Но их можно расширить, если «подружить» ИИ с другими приложениями, библиотеками или базами данных.
В 2022 Майк создал библиотеку Python tenforty — она помогает юзерам посчитать, сколько налогов они должны государству в зависимости от доходов, расходов, семейного положения и прочих факторов. Сразу оговоримся — эта штука знакома только с законодательством США.
Он планировал когда-нибудь сделать на ее основе приложение, но вместо этого сделал кастомную GPT Tax Driver. Ее функция та же — считать налоги и вычеты, только при этом она еще понимает запросы на естественном языке, пишет подробные ответы и даже может нарисовать график.
🔵 В целом, она с этими задачами отлично справляется, хотя иногда неправильно понимает суть вопроса или игнорирует некоторые требования пользователя.
🔵Это теоретически удобный инструмент, но он предъявляет высокие требования к пользователю — надо тщательно подходить к написанию промптов и внимательно перепроверять ответы.
🔵 Несмотря на эти недостатки, у подхода «ИИ как ОС» точно есть потенциал — он делает разработку приложений намного проще и быстрее.
Ищем спеца по датавизу в команду Valiotti Analytics
Если вы любите дизайн, данные и визуализацию, то у нас к вам деловое предложение.
С нас:
🔵 Разнообразная и интересная работа — надо будет создавать крутые дашборды для наших заказчиков совместно с командой аналитиков, писать стайлгайды и статьи про датавиз.
🔵 Достойная зарплата, классная молодая команда, корпоративный английский и другие плюшки.
🔵Полная удаленка с гибким графиком.
С вас:
🔵 Владение Power Point, Google Slides, Keynote и графическими программами — Figma, PS, Illustrator.
🔵 Опыт работы с визуализацией данных.
🔵 Знакомство с Tableau и аналитикой данных — большой плюс.
Подробное описание вакансии читайте по ссылке.
Это про вас? Тогда пишите скорее нашему HR Татьяне @tanya_zab. Будет классно, если у вас есть портфолио!
Если это не про вас, но у вас есть кандидат на примете — помогите нам найти друг друга и отправьте ему этот пост. ❤️
PDF Search: заставьте AI искать нужную информацию за вас
Многим из нас приходится постоянно работать с огромным количеством всевозможных файлов и документов, и чем больше их становится, тем сложнее находить среди них нужную информацию.
Современные технологию эту проблему не создали, но усугубили. И они же предлагают решение. Кто намного лучше людей справляется с большими объемами данных? Искусственный интеллект.
ИИ за несколько минут прошерстит документы, которые человек будет перечитывать полдня.
Это обещают создатели PDF Search — приложения для iPhone, Mac и iPad
🔵 Оно ищет информацию в ваших документах по запросу. ИИ здесь нужен для того, чтобы не просто высматривать ключевые слова, но и понимать контекст и поисковые запросы на естественном языке.
🔵 ИИ анализирует содержание документа целиком и в выдаче показывает наиболее релевантные страницы. Если подходящих документов несколько, он может вытащить из них информацию под ваш запрос в отдельную PDF-ку.
🔵 Отдельное приложение PDF Converter конвертирует в PDF файлы других форматов, чтобы PDF Search смог работать и с ними тоже.
🔵 И, конечно же, вы можете синхронизировать свои устройства, чтобы PDF Search смог работать со всеми файлами, какие только у вас есть.
Приложение платное, но есть пробный период.
Neosync: помощник по работе с данными для разработчиков
Neosync — open source решение, которое позволяет анонимизировать реальные данные и генерировать синтетические. Оно пригодится для тестирования кода, воспроизведения багов или заполнения БД начальными данными.
🔜 В общем, для ситуаций, когда вам нужен набор данных, максимально приближенных к реальным. Или когда вы не можете использовать реальные данные — например, потому что они содержат чувствительную информацию, которую нигде «светить» нельзя.
У разработчиков часто есть специальные датасеты для таких задач, но проблема в том, что тестовые данные, как правило, плохо передают все особенности того, что творится в реальности. Neosync предлагает решение:
🔵 анонимизирует реальные данные, убирая из них всю информацию, по которой их можно идентифицировать;
🔵 генерирует набор синтетических данных с нуля на основе схемы вашей базы данных.
При этом он сохраняет все взаимосвязи между таблицами. А еще умеет интегрироваться с Postgres, MySQL, AWS S3 и другими популярными системами и платформами.
Больше про функционал и возможности инструмента можно узнать на странице на GitHub.
Quary: BI для инженеров
Есть Big Data — это большие объемы данных, обработать которые под силу только машинам. Есть Small Data — это, наоборот, небольшие данные, справиться с которыми может и человек.
💬 А что делать, если данные еще не большие, но табличек уже многовато и заполнять их вручную становится слишком сложно? Эту стадию развития бизнеса разработчики Quary назвали Middle Data, и именно для таких случаев они и создали свой продукт.
🔵 Он умеет подключаться к базам данных и внешним источникам через API, преобразовывать данные, собирать их в таблицы и визуализировать на графиках. Дашборды и отчеты в разработке.
🔵 Все это делается с помощью кода, поэтому инструмент и позиционируется как «BI для инженеров».
🔵 Полноценную систему аналитики он не заменит, но поможет навести в данных порядок.
Это open source проект, так что узнать о нем побольше и скачать все необходимое для работы можно на GitHub.
AI-видео от Алексея Лоткова
ИИ-картинками уже никого не удивишь — наступило время ИИ-видео. К тому же, мощных нейросетей, которые умеют генерировать ролики, скоро станет больше. Зимой всех уже впечатлила Sora, готовимся встречать Veo от Google и записываемся в лист ожидания китайской Kling.
🔥 А пока ждем, можем позалипать в работы художника и моушен-дизайнера Алексея Лоткова. С помощью After Effects, Stable Diffusion, ComfyUI и Photoshop он создает крутые сюрреалистичные видео.
Как вам такое творчество? Ставьте ❤️, если заходит, или 💔, если нет. И в комментариях заодно расскажите подробнее, что думаете.
Белые ночи, BI и DataLens
В комьюнити BI-системы DataLens уже больше 10 000 пользователей, и оно продолжает расти. Еще бы, DataLens регулярно выкатывает новые фичи, делится новостями с сообществом и организовывает различные мероприятия. И уже скоро состоится одно из них — первый питерский митап «Yandex DataLens Белые Ночи».
🔜 Митап пройдет 25 июня в 17:00 в офисе Яндекса в БЦ «Феррум», и это — отличная возможность, встретиться с коллегами, обсудить новости и отдохнуть на афтерпати с диджейским сетом.
Обещают, что интересно будет всем, кто уже пользуется DataLens или хочет начать, а также потенциальным партнерам и заказчикам.
🔜 В программе кейсы и лайфхаки от экспертов, секретный доклад от Сергея Громова (создателя «BI-круга Громова») и много нетворкинга. Будут говорить про монетизацию данных, повышение эффективности работы с датасорсами и планы DataLens.
Все это — бесплатно, но с обязательной регистрацией.
Нейроаналитика от GPT-4o
Флагманская нейросеть от OpenAI умеет не только шутить красивым голосом, подозрительно похожим на Скарлет Йоханссон, но и работать с данными.
А именно:
🔵 загружать таблицы из облачных сервисов вроде Google Drive и Microsoft OneDrive;
🔵составлять и редактировать таблицы по запросу пользователя;
🔵визуализировать данные на графиках и диаграммах;
🔵анализировать информацию.
Со всеми задачами нейросеть справляется весьма неплохо и рисует на основе ваших данных симпатичные таблицы и графики, которые потом можно использовать в отчетах и презентациях. GPT-4o не просто генерирует картинку или табличку, но и дает скопировать код, который за это отвечает.
🔜 У аналитиков она хлеб не отберет, но точно ускорит работу над некоторыми рутинными задачами. Сделает график (причем любой, какой попросите, и во всех возможных цветах) на основе таблицы или таблицу на основе графика, сама напишет выводы из данных, чтобы вам не пришлось ручками печатать их.
Главное — не забывать перепроверять все, что вам пишет GPT-4o. Даже флагманские модели не защищены от галлюцинаций.
А вы уже пользовались этими функциями GPT-4o? Как вам результат? 👀
Что известно про Apple Intelligence
Apple не может без инноваций и даже расшифровка AI у нее теперь своя, особенная — Apple Intelligence.
Компания представила свой ИИ вчера на конференции WWDC 2024. Целиком выступление можно посмотреть на YouTube. Кроме Apple Intelligence там рассказали про visionOS для Vision Pro, очередную версию iOS, новые функции у AirPods и Apple TV и другие новости. Но нам интереснее всего последний блок презентации про Apple Intelligence.
💬 Это — персонализированный ИИ на основе нескольких генеративных моделей, который получит поддержку на iPhone, iPad и Mac
Apple Intelligence сможет работать с текстами, изображениями и разными приложениям. Если конкретнее, то он поможет вычитать или переписать сообщение (в почте и не только), написать краткое содержание звонка или текста, сгенерировать по запросу кастомный эмодзи или картинку, а заодно сделает Siri еще умнее, чем раньше. Голосовая помощница научится понимать команды, даже если человек запнулся или оговорился. Также он получит интеграцию с ChatGPT.
💬 Главная особенность Apple Intelligence — персонализация
Его представляют как ИИ, который максимально подстраивается под пользователя. Например, сможет выбрать из кучи оповещений самые приоритетные для получателя и обратить внимание именно на них. Или найти среди множества фотографий снимки с определенным человеком. Потому что он знает, как выглядят ваши друзья и родственники.
Также ИИ сможет понимать команды на естественном языке. То есть ему можно будет сказать: «Найди файлы, которые начальник прислал мне на прошлой неделе», и он, как обещают, с задачей справится.
💬 Большая часть операций выполняется на устройстве
Если же Apple Intelligence понадобятся дополнительные ресурсы, он постучится в облако с говорящим названием Private Cloud Compute. Apple уверяет, что оно только предоставляет вычислительные мощности и не хранит никакую пользовательскую информацию.
Apple Intelligence будет доступен на iPhone 15 Pro и iPhone 15 Pro Max, на iPad с процессорами M-серии и на Mac этой осенью.
Путь к карьере аналитика начинается здесь
Студентам говорят, чтобы они забыли все, чему их учили в школе, начинающим специалистам — чтобы забыли все, чему их учили в университете. Будто образование, даже очень качественное, не подготовит к тому, что ждет дальше.
Но, конечно, хотелось бы, чтобы было иначе. Особенно, когда речь заходит про онлайн-курсы, куда идут за новой профессией. Хочется верить, что они действительно помогут найти работу и уверенно себя чувствовать на ней.
🔜 Мы тут собрались (в основном), потому что любим данные и SQL, так что нам особенно близка тема курсов по аналитике.
Особенность сферы в том, что в ней очень важно понимать требования бизнеса. Не просто писать красивые запросы, а уметь решать прикладные задачи и погружаться в работу компании. Это сложнее, чем писать на Python или SQL, но именно за это и платят хорошим аналитикам 120к+ в месяц.
Хорошая новость — этому тоже учат.
🔵Курс «Аналитик PRO» на 75% состоит из практики. Он длится год, в течение которого студенты работают над реальными задачами и бизнес-проектами индивидуально и в группах. За это время вы освоите Excel, Python, SQL, BI-системы и многое другое, а после успешного прохождения курса вам будет что написать в резюме и показать в портфолио, чтобы заинтересовать работодателя!
🔵 Курс разработали в онлайн-школе Changellenge >> Education. Она специализируется на обучении аналитике и вполне в этом успешна — ее выпускники работают в Яндексе, VK и Газпроме. Мечты сбываются, если ваша мечта — стать аналитиком и найти крутую работу.
🔵 Фаундер школы – Андрей Алясов – сначала сам был аналитиком в Microsoft, потом консультантом в Kearney, учился в Гарварде и Лондонской бизнес-школе. И весь этот опыт лег в основу курсов по аналитике.
Хотите узнать больше — оставьте заявку на бесплатную консультацию. Если программы школы понравятся, то не забудьте наш промокод LEFTJOIN — за него дадут скидку 25 000 рублей на любой курс. Срок действия промокода ограничен
В российских вузах начнут готовить специалистов по ИИ
Роль ИИ постоянно растет, и он постепенно проникает во все сферы деятельности — от науки до повседневной жизни. Так что неудивительно, что в разных странах уже появляются целые программы в вузах, посвященные искусственному интеллекту.
И в России тоже.
🔜 В новом учебном году Яндекс и Сбер запускают вместе с НИУ ВШЭ, ИТМО, МФТИ и Университетом Иннополис программу AI360 или ИИ360. Там будут готовить специалистов по ИИ, которые будут двигать вперед науку и технологии. А если конкретнее — ML-исследователей и AI-архитекторов.
Что ждет студентов?
🔵 Фундаментальная подготовка с углубленным изучением математики.
🔵 Доступ к технологиям от Яндекса и Сбера и изучение лучших мировых практик в сфере ИИ.
🔵 Научная деятельность со второго курса. Студенты смогут присоединиться к исследованиям и посетить международные конференции.
Легко не будет, но чтобы дополнительно поддержать студентов во время учебы, им обещают повышенную стипендию на протяжении всех 4 лет обучения. Подать документы можно до 25 июля.
Box plots: датавиз не для всех
Смысл визуализации данных — в том, чтобы представить сложную информацию наглядно и понятно. Так, чтобы человек мог быстро в ней разобраться и извлечь что-то полезное для себя.
Но иногда что-то идет не так.
Вот давайте честно, вам нравятся box plots — они же «ящики с усами» или диаграммы размаха?
💬 Если не знаете, что это, то вот объяснение на русском, а вот — видео на английском.
В теории это прекрасный способ визуализации, в который очень плотно упакован большой объем информации:
🔵 максимальное, минимальное и медианное значения;
🔵 квартили и асимметрия данных — если в каком-то квартиле сильный разброс значений, это будет видно по длине «уса» или «ящика»;
🔵 сравнение сразу нескольких сущностей по всем этим показателям.
Проблема в том, что эта информация изображена контринтуитивно. Про это есть длинный материал, но если кратко, то вот главные тезисы.
🔵 Чтобы разобраться в box plots, надо, как минимум, знать, что такое квартиль. Из-за этого возникают сложности с восприятием. Например, если один «ус» очень длинный, подсознательно воспринимается, будто в нем больше всего значений, но на самом деле — в нем просто большая разница между максимумом и минимумом. Число значений во всех частях графика одинаковое.
🔵 Дизайн заставляет думать, что крупная часть в центре, сам «ящик» — самая значимая, а «усы» как бы приложение. Хотя с чего бы?
🔵 К тому же, кажется, будто на графике три элемента: «ящик» и два «уса». На самом деле их 4: два «ящика» разделены медианой.
С одной стороны, все эти недопонимания — проблема зрителя. Box plots существуют давно, инструкций, как их читать — достаточно. Кто захочет, тот вникнет. Но всю ту же информацию, которую содержат «ящики» можно показать более наглядно и доступно. А не в этом ли цель всего датавиза?
По ссылке выше есть примеры — распределение значений показывают «тепловыми картами» и точками. Чем ярче участок на графике или чем плотнее на нем расположены точки, тем больше там значений.
А вы пользуетесь ли box plots в работе? Вам легко в них разбираться?
Внедрили аналитику на старте и увеличили прибыль до 1,2M$
Недавно в комментариях попросили «что-нибудь посложнее». Окей, есть и посложнее.
💬 Как с нуля построить аналитику для быстро растущего стартапа?
💬 Как на практике выглядит «data-driven подход», и как данные помогают принимать решения в бизнесе?
💬 Какие знакомые любому предпринимателю проблемы решает аналитика?
Разбираемся на реальном примере кейса Valiotti Analytics — кастомной системе аналитики, которую сделали для EdTeh-стартапа Refocus. Мы присоединились к проекту прямо на старте и построили инфраструктуру по работе с данными, которая росла вместе с компанией. От двух отчетов с данными из AmoCRM она выросла в полноценную систему из 40+ дашбордов по продажам, маркетингу и продуктовому направлению.
🔜 Что мы такого сделали с данными, что компания выросла в 25 раз — в новой статье фаундера Valiotti Analytics на vc.ru. Если интересно заглянуть прямо внутрь системы аналитики и узнать, как и что в ней работает, это отличный шанс!
💙 Новый интересный пост от создателя LEFT JOIN и фаундера Valiotti Analytics на канале Коля Валиотти • Дата консалтинг про данные и внедрение data-driven подхода в компании!
Читать полностью…Data Heroes с Александром Шестопаловым из BBE
Гостем нового выпуска подкаста стал коммерческий директор Bang Bang Education Александр Шестопалов. Это онлайн-школа дизайна и технологий, где студентов учат дизайну, анимации, монтажу и вот теперь аналитике.
Александр в эдтехе больше 8 лет — он успел поработать в маркетинге GeekBrains и Skillfactory. В BBE он с нуля построил команду маркетинга
Про что говорили?
💬 Про эдтех. Почему эта сфера сложная, но интересная? Чем отличаются массовые онлайн-школы от нишевых в подходах к продвижению и созданию курсов? Почему BBE, онлайн-школа творческих профессий, решила вести курсы для аналитиков?
💬 Про работу с людьми. Как нанимать людей и не ошибаться (или ошибаться, но редко)? Как проверить скиллы соискателя на собеседовании, и почему если человек сделал тестовое с помощью ИИ, это не всегда плохо?
💬 Про аналитику. Как устроена аналитика в эдтехе? За какими метриками следит коммерческий директор?
💬 Про будущее и технологии. С какими задачами ИИ справляется хорошо, а в чем все еще не может заменить человека? И что ждет эдтех — уйдем ли вы офлайн или сфера будет расти и дальше?
Выпуск уже на всех платформах: Яндекс Музыка, Apple Podcasts, Spotify.
Пишите, как вам подкаст?
#DataHeroes
Мы теряем интернет
«Все, что попадает в интернет, остается там навсегда» — слышали такую фразу? Ее еще любят припоминать, когда заходит речь об эффекте Стрейзанд или той самой фотографии Бейонсе, которую ее адвокат удалил из интернета.
Оказывается, это неправда.
🔜 38% веб-страниц, существовавших в 2013, сегодня уже недоступны — это обнаружила команда дата саентистов из Pew Research Center. Они изучили ссылки на новостных и правительственных сайтах, в примечаниях в «Википедии» и твиты. Последние — чтобы разобраться, как «цифровой распад» сказывается на соцсетях.
Для того, чтобы отследить появление и исчезновение страниц за 10 лет, с 2013 по 2023 годы, они использовали Common Crawl. Это бесплатный архив, который каждый месяц собирает данные об доступных сайтах в интернете. В выборку исследователей попало чуть меньше миллиона разных страниц.
🔵23% новостных страниц и 21% страниц на правительственных сайтах содержат как минимум одну битую ссылку.
🔵 50 000 статей из «Википедии» в сумме содержали больше миллиона ссылок в разделе «Примечания» — то есть они вели на внешние сайты. Из них 11% оказались нерабочими.
🔵 За 10 лет почему-то исчезла половина твитов, написанных на турецком и арабском языках.
🔵 1/5 опубликованных твитов исчезают в течение нескольких месяцев.
Даже немного грустно от мысли, сколько информации — полезной и не очень — потеряно и сколько еще мы потеряем. Может, когда-нибудь и знаменитая фотография Бейонсе исчезнет.
ML и нейросети в российских сервисах
Большинство обсуждаемых новостей про нейросети и искусственный интеллект предсказуемо генерируют США и Китай. Но ими дело не ограничивается, поэтому мы решили посмотреть, как дела за их пределами — например, в России.
Самый очевидный пример — маркетплейсы. Они внедряют ИИ, чтобы сделать проще заполнение карточек текстами и картинками.
🔵 «Яндекс Маркет» добавил в личные кабинеты продавцов YandexGPT, создающую описание по информации в карточке. Wildberries тестирует сервис, которому достаточно только названия товара, чтобы составить текст.
🔵 Также внедряют нейросети, генерирующие картинки с товарами. YandexART представили в декабре прошлого года. Она до сих пор в бете и доступна не для всех категорий товаров. У Wildberries и Ozon аналогичные функции тоже пока находятся на стадии тестирования.
🔵 Ozon пошел дальше всех и еще в прошлом году выкатил сервис для генерации обложек на основе ML. Результат работы прикрепили к посту — кажется, дизайнерам боятся пока нечего.
🔵 «Яндекс Маркет» заботится не только о продавцах, но и покупателях — для них нейросеть генерирует персонализированные подборки товаров.
ML‑калькулятор для расчета стоимости квартир. Опять «Яндекс» — на этот раз «Яндекс Недвижимость».
🔵Сервис «Про дом» рассчитывает стоимость покупки или аренды жилья на основе данных в карточке: этаж, площадь, число комнат. Он принимает во внимание также состояние дома и цены на соседние квартиры в моменте и в динамике.
«2ГИС» наводит порядок в карточках.
🔵 Нейросеть собственного изготовления сортирует фотографии по альбомам — отделяет фото интерьера от экстерьера и фото блюд из меню от фото парковки.
🔵 Сберовская GigaChat делает то, что в комментариях на vc.ru метко назвали «жмых по отзывам» — то есть краткое описание места или заведения на основе того, что о нем писали люди.
А нам все не дает покоя ML-обложка от Ozon. Если наберется 100 👍🏻 — наш дизайнер сделает свою версию.
Ставьте лайки, если интересно, что получится!
Вероятностные крестики-нолики
Новая версия игры, где вы своими же действиями можете принести оппоненту победу.
🔜 Поле такое же, как всегда — сетка 3 х 3. И суть игры та же — игроки ходят по очереди и пытаются нарисовать три крестика или три нолика подряд. Но у каждой клетки прописаны вероятности — что произойдет, если вы попытаетесь поставить в ней крестик. Есть три варианта развития событий.
🔵 Благоприятный— игрок нарисует свою фигуру.
🔵 «Ну такой» — клетка останется пустой.
🔵 Неблагоприятный — игрок нарисует фигуру противника.
Вероятность каждого результата прописана прямо на клетке и никогда не равна 100%.
У игры есть два уровня сложности и два режима — против компьютера и против человека.
🔜 Как пишет автор до этой идеи он додумался, когда размышлял о том, какую большую роль в жизни играет случайность. Иногда вы можете все сделать правильно, но все равно проиграть, потому что удача была не на вашей стороне. Но все равно после какого-то количество попыток, если продолжать стараться, вы обязательно добьетесь своего.
Идеальный курс по SQL: какой он?
Наша команда уже выпустила один курс по SQL и Python — «Марафон Данных». Его прошли больше 10 000 человек, а средняя оценка составила 4,8 баллов.
Еще не идеал, но уже весьма неплохо! 🔥
Мы почти готовы выпустить продолжение — новый курс, который поможет более глубоко познакомиться с SQL, от основ перейти к более сложным и продвинутым функциям и отточить знания на практических задачах. Чтобы он получился еще лучше и полезнее, просим вас пройти короткий опрос по ссылке.
В нем всего 5 вопросов, но они помогут нам понять, какие задачи вам интересны и чему уделить особое внимание. Всем, кто пройдет опрос, обещаем бонус — промокод на новый курс. ❤️
Главная задача продуктового аналитика
Можно долго рассуждать, зачем нужны аналитики, маркетологи, проджекты, продакты и так далее, приводить много аргументов и доказывать свою ценность для компании. Но так или иначе конечная цель у нас у всех одна — помогать бизнесу зарабатывать деньги и увеличивать прибыль.
Просто каждый делает это по-своему. Как это делают продуктовые аналитики, рассказывает на своем канале @firstanalyticsguide Ярослав Хромов. Он построил собственную компанию с прибылью 50М+ и рулил аналитикой в Wakie, Fura и Turbo, так что он знает, о чем говорит.
Про что он пишет:
💬 как научиться определять Use Case, понимать, в чем польза вашего продукта, и составить модель монетизации;
💬 как и зачем измерять вовлеченность;
💬 и почему не надо строить дерево метрик (и что надо вместо него).
В общем — про пользу и практический опыт. И даже в посте про то, как он проиграл деньги в казино, сможет объяснить случившееся с точки зрения продуктовой аналитики!
🔜 Любите такое? Тогда вам сюда
Как подружить бизнес и Telegram?
Объяснят на конференции TG Market Conf 21 июня.
🔜 50+ спикеров, 200+ партнеров и 1000+ участников соберутся в Цифровом Деловом пространстве на Покровке в Москве, чтобы рассказать, как привлекать аудиторию, объяснить, как делать чат-ботов, и показать примеры успешного бизнеса — чтобы было понятно, на кого равняться. Обещают целый день лекций, дискуссий, мастер-классов и обмена опытом с коллегами и экспертами.
Вход платный, количество билетов ограничено. Не упустите, если хотите узнать, как продвигать свой бизнес в TG. 🔥
Датавиз сегодня и 100 лет назад
Любопытная вещь — датавиз.
💬 Думаю, что первая ассоциация с этим словом (или с двумя словами, если расшифровать до «data visualization») — это что-то про бизнес-аналитику, интерактивные дашборды, про современность и технологичность. Но ведь люди искали способы графически отображать информацию на протяжении всей своей истории. А отличные и до сих пор актуальные книги по датавизу писали еще 100+ лет назад.
💬 Как раз про это на канале Ромы Бунина @revealthedata вышел пост. Рому знают, наверное, почти все, кто в русскоязычном пространстве связан с данными и их визуализацией. Я сам давно с ним знаком и его канал рекомендую всем, кому интересна тема датавиза. И что круто, он еще и активный участник коммьюнити: проводит вебинары и лекции, ходит на конференции, помогает школьникам осваивать основы визуализации данных и притягивает к себе таких же классных талантливых людей.
💬 И один из них, Виталий Балобанов, и написал для его канала пост про книги от пионера в области датавиза — Вилларда Коупа Бринтона. Они обе вышли еще в прошлом веке, но актуальность до сих пор не потеряли. В общем, получился интересный экскурс в историю. Но, кстати, посты, которые пишет сам Рома ничуть не хуже, почитайте и их тоже. 😁
Написать этот пост я решил не только из уважения к тому, что делает Рома, но и потому что мы с ним оба попали в новую папку каналов про аналитику. Мы все, кто в ней оказался, рассказываем про своих «соседей» по папке подписчикам — каждый про кого-то одного.
Этот флешмоб еще и весьма удобная штука для читателей. Этакая рецензия на каждый канал, можно зайти, всех посмотреть и выбрать, кто больше по душе. Надеюсь, конечно, что все, потому что подборка получилась реально хорошая. 🔥
«Найти и удержать»: пять дискуссий о маркетинге
18 июня пройдет бесплатная онлайн-конференция о маркетинге. Руководители из разных сфер расскажут, как привлекать лидов и превращать их в постоянных клиентов, продвигать бренд, работать с рекламными каналами и форматами, выстраивать процессы в команде.
🔜 Спикеры — руководители маркетинга из EdTech, Fashion, Beauty, общепита и магазинов техники. Будет много знакомых брендов: Zarina, Yves Rocher, «Нетология», Redmond, «Тануки» и другие.
Старт в 12 по МСК. Всего будет 5 выступлений — около часа на каждое выступление. Можно выделить весь день и посмотреть все или выбрать несколько самых интересных.
🔥 Участие бесплатное, понадобится регистрация через Telegram-бот.
Где вкусно позавтракать в Питере, поужинать с видом на море и попробовать азиатскую кухню?
🔜 Можно спросить у нейросети от Сбера GigaChat. Она круто разбирается в гастрономии: может написать рецепт вкусного домашнего обеда или полезного десерта, дать совет по правильному питанию и придумать меню на неделю.
👀 Как всегда с ИИ, чем подробнее промпт, тем лучше ответ. А чтобы написать его было проще, команда проекта придумала карточки с идеями для вдохновения. Уже можно полистать их и потестить сетку на практике.