devsp | Unsorted

Telegram-канал devsp - Data Science | Machinelearning [ru]

17988

Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence) Англоязычный канал по DS и Machinelearning -https://t.me/ds_international По сотрудничеству - @g_abashkin

Subscribe to a channel

Data Science | Machinelearning [ru]

➡️ Машинное обучение: общие принципы и концепции

В этой статье я рассказываю про основные концепции, типы обучения, типы задач в машинном обучении и также делаю постановку задачи машинного обучения (МО). Все это я рассказываю в своем стиле и понимании.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

🤖 Псст, ИИ нужен? 5 полезных инструментов для разработчика

Статья предлагает подборку инструментов, платформ и шаблонов для работы с языковыми моделями и создания ИИ-ассистентов. Рассматриваются протестированные в МТС решения, упрощающие разработку и интеграцию.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

Qwen3‑235B — новая языковая модель от Яндекса, доступная в облаке.

Подходит для создания ассистентов, автоматизации клиентской поддержки, генерации текстов и внедрения ИИ в e‑commerce.

Работает через Yandex Cloud AI Studio, без сложной настройки. Возможна интеграция по API. Технология уже доступна для тестирования и подключения.

Реклама. ООО Яндекс.Облако. ИНН 7704458262

Читать полностью…

Data Science | Machinelearning [ru]

💳 Как мы провели ИИ-трансформацию стратегических процессов Сбера

Статья рассказывает об ИИ-трансформации Сбера, включая ключевые задачи, такие как стресс-тестирование, анализ рынков и прогнозирование эффективности сотрудников. Рассматривается использование ИИ до и после трансформации.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

Эксклюзивный временный доступ к папке «AI & TECH & IT» — это уникальная коллекция каналов по интересным статьям и способам заработка в сфере искусственного интеллекта и технологий.

В папке можно найти:
🟠 Как продавать и записывать на услуги 24/7 с помощью ИИ?
🟠 Создание вирусных, захватывающих ИИ-видео.
🟠 Актуальные новости в сфере информационных технологий.

📎 Подписывайтесь на папку «AI & TECH & IT» прямо сейчас — изучайте каналы и прокачивайте свои скиллы в сфере ИИ и технологий!

ПОДПИСАТЬСЯ

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ KAN 2.0: Kolmogorov-Arnold Networks Meet Science

Статья представляет перевод работы о нейронных сетях на основе алгоритма Колмогорова-Арнольда (KAN). Рассматриваются новые исследования, связь с наукой и использование библиотеки pykan на Python для практических задач.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

👩‍💻 Проверка, являются ли две строки анаграммами

Напишите функцию, которая принимает две строки и проверяет, являются ли они анаграммами. Анаграммы — это слова, которые содержат одинаковые буквы в одинаковом количестве, но в разном порядке. Игнорируйте регистр и пробелы.

Пример:

result1 = are_anagrams("listen", "silent")
print(result1) # Ожидаемый результат: True

result2 = are_anagrams("hello", "world")
print(result2) # Ожидаемый результат: False


Решение задачи🔽

def are_anagrams(str1, str2):
# Удаляем пробелы и приводим к одному регистру
str1 = ''.join(str1.lower().split())
str2 = ''.join(str2.lower().split())

# Проверяем, равны ли отсортированные символы
return sorted(str1) == sorted(str2)

# Пример использования:
result1 = are_anagrams("listen", "silent")
print(result1) # Ожидаемый результат: True

result2 = are_anagrams("hello", "world")
print(result2) # Ожидаемый результат: False

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ Нейросетевой апскейлинг дома: вторая молодость для классических мультфильмов

Статья рассказывает, как с помощью нейросетей улучшить качество старых видеозаписей, включая VHS и DVD. Описываются инструменты, процесс и результаты с примерами, доступные каждому без глубоких технических знаний.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

➡️ Matrix Reloaded: зачем дата-сайентисту линейная алгебра

Рассказываю, как векторы, матрицы и собственные значения помогают понимать ML-модели. Без теорем и нотаций — только визуалки и живые кейсы с работы.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

➡️ Семантическая сегментация: самый полный гайд

Статья раскрывает, как семантическая сегментация помогает машинам «видеть», разбивая изображение на классы объектов. Обсуждаются её применение в автономных авто, медицине и обработке спутниковых снимков для точного распознавания контекста.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

Получи грант на обучение в Центральном университете

Несгораемый грант до 2 800 000 Р на учебу в бакалавриате Центрального университета.

Подробнее о гранте:

– Покрывает до 100% стоимости обучения
– Выдается на все 4 года обучения в вузе
– Сумма гранта не уменьшается, а может увеличиться за дополнительные достижения и успехи в учебе.

Для учеников 10-х и 11-х классов. Участвуй в отборе!

Подать заявку

#реклама
apply.centraluniversity.ru

О рекламодателе

Читать полностью…

Data Science | Machinelearning [ru]

👩‍💻 Чем отличается метод .transform() от .apply() в pandas?

В pandas методы .transform() и .apply() часто используются для обработки данных по столбцам и строкам, но они работают по-разному. Метод .apply() применяет функцию к каждому элементу или ряду, и возвращает объект любой формы (например, DataFrame или Series). В отличие от него, .transform() применяет функцию к каждой ячейке или группе и возвращает объект той же формы, что и входной.

➡️ Пример:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [10, 20, 30]})

# Используем .apply() для вычисления суммы по столбцам
print(df.apply(sum)) # Вернет Series с суммами столбцов

# Используем .transform() для нормализации каждого значения в столбце
print(df.transform(lambda x: (x - x.mean()) / x.std()))
# Вернет DataFrame с нормализованными значениями


🗣 .apply() подходит для сложных операций и агрегаций, а .transform() удобно использовать для обработки данных с сохранением исходной структуры.


🖥 Подробнее тут

Читать полностью…

Data Science | Machinelearning [ru]

🎓 Онлайн-магистратура по ML от УрФУ и Нетологии
Если ты хочешь глубже разобраться в машинном обучении, архитектуре данных и продакшене ИИ-систем — посмотри в сторону новой магистратуры «Инженерия машинного обучения» от УрФУ и Нетологии.
💡 За 2 года ты:
— Освоишь разработку ML-моделей и пайплайнов
— Будешь работать с Big Data и проектировать инфраструктуру под хранение/обработку данных
— Получишь практику на реальных проектах, хакатонах и Kaggle
— Пройдёшь путь от математики до продакшена
— Получишь два диплома: от УрФУ и Нетологии
📚 Формат — полностью онлайн, можно совмещать с работой. Отличный вариант для разработчиков, которые хотят прокачаться в ML и выйти в индустрию с сильным бэкграундом.
👉 Подробнее: https://netolo.gy/egvt

Читать полностью…

Data Science | Machinelearning [ru]

Печатает приглашение...
на Cloud․ru Tech Lab!

🗓 Когда: 24 июля, 18:00
📍 Где: Москва, Гоэлро Лофт (м. Электрозаводская)

В программе — четыре доклада от экспертов Cloud․ru и приглашенных гостей про AI-агентов, RAG, Ragas и сборку MCP-сервера без кода. После — тестируем AI-решения в демозоне, практикуем нетворкинг и остаемся на afterparty.

Что в программе:

😶‍🌫️ Открытие митапа
Дмитрий Юдин, технический лидер по развитию искусственного интеллекта, Cloud․ru

😶‍🌫️ «Как мы встроили AI-агента в онлайн-обучение»
Стас Гридин, менеджер проектов и Илья Жбанов, Data Science инженер, Cloud․ru

😶‍🌫️ «Model Context Protocol (MCP): главный тренд AI-индустрии»
Игорь Латкин, управляющий партнер и системный архитектор, KTS

И еще два секретных доклада — от наших экспертов и приглашенного гостя.


Митап будет особенно полезен разработчикам, продуктовым менеджерам и архитекторам, а также всем, кто интересуется внедрением AI в свои сервисы.

Какой формат участия выбрать?
Офлайн, если хочется присутствовать лично на площадке.
Онлайн, если вы не в Москве. Всеми записями Cloud․ru поделится после митапа.

😶‍🌫️Регистрируйтесь на митап

Читать полностью…

Data Science | Machinelearning [ru]

🖥 Как работает Трансформер: очень простое описание

Вот очень простое объяснение для тех, кто не хочет вдаваться в сложную математику, но и не готов принимать эту ключевую технологию как магию, которая просто работает. Конечно, никакого волшебства тут и нет — идея на самом деле довольно проста..

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

📋 Документация — это не про "всё", а про "важное"

Ты не обязан описывать каждую кнопку, каждый метод. Но ты обязан объяснить, как с этим жить.

👉 Совет: документируй не детали, а маршруты: как запустить, как добавить фичу, как починить баг. Хорошая документация — это не энциклопедия, а инструкция к выживанию.

Читать полностью…

Data Science | Machinelearning [ru]

📖 «Охота на электроовец: большая книга искусственного интеллекта» или как написать книгу про ИИ без регистрации и SMS

История о том, как за 6 лет я написал двухтомник, посвящённый искусственному интеллекту и машинному обучению.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ Что такое генераторы в Python и зачем они нужны?

Генераторы — это функции в Python, которые возвращают значения по одному с помощью ключевого слова yield, вместо полного возврата всех значений сразу. Они полезны для работы с большими объемами данных, так как сохраняют память, генерируя значения на лету.

➡️ Пример:

# Генератор для получения первых N чисел Фибоначчи
def fibonacci(n):
a, b = 0, 1
for _ in range(n):
yield a
a, b = b, a + b

# Используем генератор
for num in fibonacci(5):
print(num)

# Вывод: 0, 1, 1, 2, 3


🗣️ В этом примере генератор fibonacci вычисляет числа по запросу, вместо сохранения всех значений в памяти. Это делает генераторы особенно удобными для работы с потоками данных или бесконечными последовательностями.


🖥 Подробнее тут

Читать полностью…

Data Science | Machinelearning [ru]

🤖 Как удалить Excel навсегда: делегируем юнит-экономику на Wildberries нейронке

Статья объясняет, как нейросети помогают оптимизировать юнит-экономику продавцов на WB, особенно при работе с большим ассортиментом. Рассматриваются подходы к автоматизации анализа и принятию решений.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

📈 Подборка статей для вашей карьеры

«Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно

Из учителя в QA: мой путь в IT

Рынок дата-инженеров и прогноз на 2025

Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году

Ошибайся смело: жизненные уроки из мира machine learning

Читать полностью…

Data Science | Machinelearning [ru]

🔥 Самые интересные статьи за последние дни:

о3 теснит программистов? Как OpenAI снова всех удивила

AI, который всё за нас решит

Второе пришествие мейнфреймов. Всё больше компаний хотят запускать ИИ у себя в офисе

Обзор на разнообразные интерфейсы Stable Diffusion. Automatic1111 — не одинок

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ Альфа-Банк оплатит студентам магистратуру по HR-Tech

Он запустил программу совместно с ВШЭ. Эксперты научат разрабатывать HR-технологии и управлять цифровыми продуктами. Расскажут, как формировать, развивать и мотивировать команды.

Студенты пройдут оплачиваемую стажировку в Альфе, лучших позовут в команду. Подать заявку можно до 8 августа.

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ Пишем свою Diffusion модель с нуля

Статья предлагает разобраться в устройстве Diffusion моделей, их математике и принципах работы. Автор делится простыми объяснениями, примерами кода и результатами генерации изображений на собственной модели.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

👩‍💻 Задачка по Python

Напишите функцию, которая принимает список чисел и возвращает все значения, которые являются выбросами. Выбросы определяются как значения, которые находятся ниже первого квартиля (Q1) минус 1.5 * IQR или выше третьего квартиля (Q3) плюс 1.5 * IQR, где IQR — межквартильный размах.

➡️ Пример:

Входной список:
[10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100]

Ожидаемый вывод:
[100]


Решение задачи ⬇️

import numpy as np

def find_outliers(data):
q1 = np.percentile(data, 25)
q3 = np.percentile(data, 75)
iqr = q3 - q1
lower_bound = q1 - 1.5 * iqr
upper_bound = q3 + 1.5 * iqr
return [x for x in data if x < lower_bound or x > upper_bound]

# Пример использования:
input_data = [10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100]
result = find_outliers(input_data)
print(result) # Ожидаемый результат: [100]

Читать полностью…

Data Science | Machinelearning [ru]

🤔 Prompt Me One More Time. Учим LLM строить графы знаний из текстов

Статья описывает метод, разработанный для автоматического наполнения графов знаний с помощью LLM, что снижает вероятность «галлюцинаций» и повышает точность ответов. Решение Prompt Me One More Time подробно представлено на TextGraphs-17 конференции ACL-2024.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

Если вы работаете с нейросетями — от файнтюнинга LLM до генерации изображений — без мощных видеокарт не обойтись. Но покупать железо — долго, дорого и не всегда оправдано.

immers.cloud — облачный GPU-сервис, созданный специально для ИИ-задач. Мы знаем, что нужно разработчику и data scientist-у:

💰 Посекундная тарификация: тарифы от 23 рублей/час, платите только за время, когда сервер реально работает.
⚡️ Быстрый старт: нужный сервер поднимается за пару минут.
📈 Гибкость и масштабируемость: 12 моделей видеокарт на выбор
🔧 Удобство: готовые образы для ML задач, чтобы не тратить время на настройку.

А если нужно прерваться — можно просто заморозить ВМ с помощью функции Shelve: данные сохранятся, а платить за простои не придется.

🎁 Дарим +20% к первому пополнению. чтобы было приятнее начать 

Читать полностью…

Data Science | Machinelearning [ru]

👩‍💻 FlexiPrompt: Удобное создание динамических промптов в Python

Статья знакомит с FlexiPrompt — лёгкой библиотекой для генерации промптов в Python при работе с языковыми моделями. Рассмотрены её преимущества: быстрая интеграция, гибкая настройка диалога и возможность создания нескольких агентов в одной LLM.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

⚙️ Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение

Статья продолжает разбор моделирования температурного временного ряда с двойной сезонностью. Основное внимание уделено подбору оптимальных параметров сезонной модели САРПСС для точного описания данных.

Читать...

Читать полностью…

Data Science | Machinelearning [ru]

👩‍💻 Задачка по Python

Напишите функцию, которая принимает DataFrame и заменяет отсутствующие значения (NaN) в каждом числовом столбце на среднее значение этого столбца. Если столбец содержит только NaN, оставьте его без изменений.

➡️ Пример:

   feature1  feature2  feature3
0 1.0 10.0 NaN
1 2.0 NaN NaN
2 NaN 30.0 NaN
3 4.0 40.0 NaN

feature1 feature2 feature3
0 1.00 10.0 NaN
1 2.00 26.7 NaN
2 2.33 30.0 NaN
3 4.00 40.0 NaN


Решение задачи ⬇️

import pandas as pd

def fill_missing_with_mean(df):
numeric_columns = df.select_dtypes(include=['float', 'int'])
for column in numeric_columns:
if df[column].notna().any(): # Проверяем, есть ли значения не NaN
df[column] = df[column].fillna(df[column].mean())
return df

# Пример использования:
data = pd.DataFrame({
'feature1': [1.0, 2.0, None, 4.0],
'feature2': [10.0, None, 30.0, 40.0],
'feature3': [None, None, None, None]
})

result = fill_missing_with_mean(data)
print(result)

Читать полностью…

Data Science | Machinelearning [ru]

🔥 Самые интересные статьи за последние дни:

Разбей и властвуй: как создать кастомный токенизатор в SpaCy

Функция property() в Python: добавляем управляемые атрибуты в классы

Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

cgroups и namespaces в Linux: как это работает?

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя

Читать полностью…
Subscribe to a channel