Telegram-канал sqlhub - Data Science. SQL hub: Unsorted - каталог телеграмм

sqlhub | Unsorted

Subscribe to a channel

Telegram-канал sqlhub - Data Science. SQL hub

36043

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo

Subscribe to a channel

Data Science. SQL hub

20 June 2026 16:02

Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.

Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.

Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.

Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.

Объект всё ближе, но до контакта так и не доходит.

На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.

Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении.

Читать полностью…

Data Science. SQL hub

18 June 2026 16:02

Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.

Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.

На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.

BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.

https://x.com/GoogleResearch/status/2065475343205740911

Читать полностью…

Data Science. SQL hub

14 June 2026 22:22

OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен

OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.

Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».

Что умеет:

* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр

Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.

https://github.com/itsfatduck/optimizerDuck

Читать полностью…

Data Science. SQL hub

11 June 2026 12:43

Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀

20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.

Ты будешь:

✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.

А ещё ты станешь частью крупнейшего IT‑комьюнити.

Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!

Читать полностью…

Data Science. SQL hub

10 June 2026 16:05

Сотрудники Авито ведут свой telegram-канал ⭐️

И знаете, получается мегалампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом знакомые весёлые коллеги из постов, и вам точно есть что обсудить.

А вообще, хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и атмосферу в команде ещё до трудоустройства.

🔥 Однозначно подписка — @TeamAvito
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career

Читать полностью…

Data Science. SQL hub

09 June 2026 14:33

Хорошая история из серии «скрипт был почти правильный, пока не удалил всё».

The Register рассказал кейс консультанта по тест-автоматизации. У клиента была система управления тестами, куда складывались видеозаписи test evidence. Роликов накопилось около 600, вручную удалять их было долго, поэтому консультант написал скрипт для очистки.

Он отладил код, прошёлся по значениям, проверил один файл, всё выглядело нормально. Потом скрипт удалил не только этот файл, а весь контейнер с видео и другими данными.

Проект был в разгаре, данные были важные, но консультант решил не признаваться. Он сообщил о потере данных как о проблеме системы и завёл тикет в поддержку.

Через неделю данные восстановили из бэкапа. Поддержка так и не нашла точную причину, зато взяла вину на себя: мол, один из SaaS-скриптов вышел из-под контроля и удалил контент.

Смешно читать, страшно узнавать себя.

Инженерный урок тут простой:

- destructive scripts должны сначала работать в dry-run
- удаление по контейнеру или префиксу требует явного allowlist
- перед массовой операцией нужен лимит на количество затронутых объектов
- лог «что будет удалено» важнее, чем уверенность автора
- бэкап спасает не от ошибки, а от катастрофы после ошибки

https://www.theregister.com/software/2026/06/08/consultant-mistakenly-deleted-a-ton-of-data-but-reported-it-as-a-bug/5245952

Читать полностью…

Data Science. SQL hub

07 June 2026 16:29

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.

Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.

Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.

Внутри:

- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу

Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.

48 часов скидка 60%: https://stepik.org/course/288218/

Читать полностью…

Data Science. SQL hub

27 May 2026 17:14

Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.

Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.

Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.

Что умеет:

• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты

Для тех, кто постоянно работает с нейронками, это прям находка.

Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/

Читать полностью…

Data Science. SQL hub

27 May 2026 12:32

🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»

На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.

Маршрут собран под современный Python:

- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура

В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.

Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.

Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.

Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.

https://github.com/justxor/pythonroamap2026

Читать полностью…

Data Science. SQL hub

22 May 2026 10:32

«Цукерберг уволил 8000 человек, а ещё 7000 отправил работать с ИИ.

В день сокращений компания попросила сотрудников работать из дома, чтобы избежать «офисных драм» и хаоса в офисах. А в 4 часа утра людям начали приходить письма об увольнении.

Но тех, кто сохранил работу, шокировала другая новость: на общем созвоне было объявлено, что теперь компания внедряет внутреннюю ИИ-систему, которая будет следить за рабочей активностью сотрудников: движения мыши, нажатия клавиш, действия в программах, скриншоты экранов и т.д.

Цукерберг прямо сказал, что это делается для обучения ИИ.
Его компания обучает ИИ-агентов на действиях собственных сотрудников, потому что они якобы дают более качественные данные, чем внешние подрядчики, которых обычно используют для обучения моделей.

Людей для компании при этом назвали «самым ценным ресурсом».

Как называется такая контора?

Читать полностью…

Data Science. SQL hub

19 May 2026 16:00

🚀 PgQue – Устойчивые очереди в Postgres

PgQue предлагает универсальную архитектуру очередей для PostgreSQL, основанную на проверенной модели PgQ. Это решение без лишних зависимостей, работающее на любом управляемом Postgres, обеспечивая нулевое бремя и стабильную производительность под нагрузкой.

🚀 Основные моменты:
- Никаких внешних демонов или расширений
- Использует SQL и PL/pgSQL для установки
- Обеспечивает ACID-транзакции и долговечность
- Никакого накопления "мертвых" кортежей
- Подходит для высоконагруженных систем

📌 GitHub: https://github.com/NikolayS/pgque

#sql

Читать полностью…

Data Science. SQL hub

18 May 2026 12:31

Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech

Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества.

🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения.

Спикеры и доклады:

▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru
Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ

▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech
Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап

▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru
Нейроразбор резюме: практический опыт и нюансы создания LLM-судей

▪️Дима Курганский, Teamlead MLOps, Lamoda Tech
Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям

🗓 28 мая, сбор 18:30, начало 19:00
🔗 Очно и онлайн
📍 Офис hh.ru

🔥 ЗАРЕГИСТРИРОВАТЬСЯ

Количество очных мест ограничено.

Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFJNMmWq

Читать полностью…

Data Science. SQL hub

15 May 2026 12:36

WSJ: Anthropic Mythos помог собрать рабочий exploit для macOS kernel за 5 дней

По данным WSJ, модель Anthropic Mythos помогла исследователям найти две ранее неизвестные уязвимости в ядре macOS и связать их в рабочую цепочку privilege escalation.

Целью был не браузер, не приложение и не какой-нибудь userspace-сервис, а macOS kernel - самый глубокий слой системы, где управляются память, процессы, права доступа и взаимодействие с железом.

Атака держалась не на одном баге. Mythos помог связать две отдельные ошибки с дополнительными техниками эксплуатации. То есть это была цепочка, где каждый шаг открывал возможность для следующего.

По данным WSJ, exploit смог:

- повредить память
- обойти защитные механизмы Apple
- получить доступ к защищённым частям системы
- поднять привилегии выше уровня обычного приложения

Современные защиты macOS строятся не только вокруг поиска багов. Их задача - сделать так, чтобы даже найденную memory corruption уязвимость было крайне сложно превратить в контроль над системой.

Vulnerability research - это не магия, а огромный поиск по тупикам. Нужно строить гипотезы, понимать поведение кода, держать в голове низкоуровневые ограничения, искать связки между багами и проверять, где защита системы реально ломается.

Если модель ускоряет этот процесс, она меняет не просто ресёрч. Она меняет экономику offensive security.

Читать полностью…

Data Science. SQL hub

12 May 2026 13:00

⚡️ Векторные базы данных хорошо ищут похожие куски текста, но плохо понимают связи между ними.

Обычный поиск работает так: есть вопрос - база находит top-k самых похожих фрагментов. Это удобно, если нужно вытащить один факт.

Но если ответ спрятан в нескольких местах, например в разных документах, сообщениях или частях отчёта, простого similarity search уже мало. Нужно понять, как связаны люди, события, компании, причины и последствия.

На этом и делает акцент FalkorDB GraphRAG-Bench. Самый большой отрыв у GraphRAG виден именно в сложных задачах: Complex Reasoning - 83.61 и Contextual Summarization - 85.08. То есть там, где нужно не просто найти похожий текст, а собрать смысл из нескольких связанных фрагментов.

Простой вывод: если у вас база знаний, длинные документы или корпоративные данные, одного Vector DB может быть недостаточно. GraphRAG помогает модели не просто искать, а идти по связям.

GraphRAG SDK полностью open-source: https://github.com/FalkorDB/GraphRAG-SDK

Читать полностью…

Data Science. SQL hub

09 May 2026 14:44

Claude идет в финансы с готовыми агентами

Это уже финансовые ИИ-агенты, которые забирают куски работы у аналитиков, аудиторов и операционных команд.
Один агент собирает питч-дек.
Второй готовит бриф к встрече.
Третий читает earnings report и ловит рискованные формулировки. Четвёртый строит valuation model прямо в таблице. Пятый сверяет книги с банковскими выписками.

И самое интересное - это уже не просто чат с моделью. Агент подключается к Excel, PowerPoint, Word, Outlook и данным компании. То есть он не “советует”, а реально двигает рабочий процесс.

Сначала это выглядит как автоматизация рутины. Потом оказывается, что рутина занимала половину финансового отдела.

https://www.youtube.com/shorts/dhcoR03jtI0

Читать полностью…

Data Science. SQL hub

20 June 2026 14:02

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905

Читать полностью…

Data Science. SQL hub

17 June 2026 16:03

📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии

Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.

🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26

📌 GitHub: https://github.com/KaruroChori/reflite

#cpp

Читать полностью…

Data Science. SQL hub

11 June 2026 14:43

✔️ IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️ Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️ Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Data Science. SQL hub

10 June 2026 18:05

SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.

* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода

https://github.com/fastapi/sqlmodel

Читать полностью…

Data Science. SQL hub

10 June 2026 14:50

PostgreSQL 19 Beta 1 добавляет ON CONFLICT DO SELECT.

Выглядит как незначительно изменение, но для разработки это очень удобная штука: теперь можно атомарно сделать get-or-create.

То есть логика становится простой:

- вставить строку
- если такой ключ уже есть - не обновлять её
- просто вернуть существующую запись

Пример:


INSERT INTO users (email, name)
VALUES ('alice@example.com', 'Alice')
ON CONFLICT (email) DO SELECT
RETURNING *;

Раньше для такого случая часто приходилось городить обходные варианты через DO NOTHING, отдельный SELECT, CTE или искусственный DO UPDATE, который ничего по сути не меняет.

Теперь PostgreSQL закрывает один из самых частых кейсов в backend-разработке: безопасно создать запись или получить уже существующую без лишней гонки между запросами.

Простой синтаксис, большой плюс к читаемости.

Читать полностью…

Data Science. SQL hub

07 June 2026 18:31

SQL-приём: FILTER в агрегатах вместо пачки CASE WHEN.

Обычно пишут так:


SELECT
    COUNT(*) AS total_orders,
    SUM(CASE WHEN status = 'paid' THEN 1 ELSE 0 END) AS paid_orders,
    SUM(CASE WHEN status = 'failed' THEN 1 ELSE 0 END) AS failed_orders,
    SUM(CASE WHEN amount > 1000 THEN amount ELSE 0 END) AS big_order_revenue
FROM orders;

Но в PostgreSQL это можно сделать чище:


SELECT
    COUNT(*) AS total_orders,
    COUNT(*) FILTER (WHERE status = 'paid') AS paid_orders,
    COUNT(*) FILTER (WHERE status = 'failed') AS failed_orders,
    SUM(amount) FILTER (WHERE amount > 1000) AS big_order_revenue
FROM orders;

Чем полезно:

• запрос читается как аналитическая таблица
• меньше шума от CASE WHEN
• проще добавлять новые метрики
• условия не смешиваются с логикой агрегации
• особенно удобно для дашбордов и отчётов

А ещё можно делать несколько метрик по разным условиям за один проход по данным:


SELECT
    date_trunc('day', created_at) AS day,
    COUNT(*) FILTER (WHERE status = 'paid') AS paid,
    COUNT(*) FILTER (WHERE status = 'refunded') AS refunded,
    AVG(amount) FILTER (WHERE status = 'paid') AS avg_paid_amount
FROM orders
GROUP BY 1
ORDER BY 1;

Это маленькая фича, но в реальной аналитике она сильно повышает читаемость SQL.

Читать полностью…

Data Science. SQL hub

05 June 2026 16:05

Nvidia выложила Nemotron 3 Ultra в открытых весах.

Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.

Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.

LatentMoE добавляет ёмкости без пропорционального роста вычислений.

Веса открыты - можно гонять локально и щупать самим.

🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf

Читать полностью…

Data Science. SQL hub

27 May 2026 15:14

⚡️ Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы.

🐘 Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных.

✅ До 20 раз быстрее Greenplum
На сложных запросах в тестах ClickBench, TPC-H и TPC-DS.

✅ До 10 раз меньше ресурсов
При сопоставимой нагрузке с MPP-аналогами.

✅ Аналитика ближе к рабочим данным
Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах.

✅ Быстрый старт для команды
Знакомый диалект PostgreSQL снижает порог входа для администраторов и разработчиков.

✅ Свобода хранения и BI
Локальный сервер, сетевая шара или S3. Данные — в формате Parquet.

🔗 Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.

Реклама ООО «ППГ» Инн: 7707083893 Erid: 2VtzqwzwH4t

Читать полностью…

Data Science. SQL hub

25 May 2026 11:36

NVIDIA официально опубликовала Skills, которые они используют для своих ИИ-агентов.

Прямо сейчас у них есть Skills для:
→ автоматического анализа и суммирования видео
→ создания голосовых агентов в реальном времени
→ обучения и улучшения LLM
→ ускорения моделей, чтобы они работали намного быстрее
→ систем RAG, подключенных к документам и данным
→ агентов, работающих в изолированных безопасных средах
→ оптимизации логистики и маршрутизации с помощью GPU
→ программирования и вычислений на CUDA

Некоторые из самых интересных:
• TensorRT-LLM → экстремальное ускорение LLM
• NeMo-RL → продвинутое обучение агентов
• Video Search → автоматический поиск и суммирование видео

Кроме того, они совместимы с:
→ Claude Code
→ OpenAI Codex
→ Cursor

https://github.com/NVIDIA/skills

Читать полностью…

Data Science. SQL hub

22 May 2026 09:12

🆓 Ваши SQL-запросы работают, но через месяц их уже сложно прочитать и изменить?

С ростом логики запросы превращаются в набор вложенных подзапросов. Разобраться в них сложно, поддержка занимает время, а любые изменения несут риск сломать результат.

На открытом уроке разберём: как использовать обобщенные табличные выражения (CTE), чтобы писать сложные запросы по шагам.
Покажем, как упростить структуру, сделать код читаемым и работать с иерархиями через рекурсивные CTE.

🗓 Урок проходит в преддверии старта курса «PostgreSQL для администраторов баз данных и разработчиков».

Если вы хотите писать SQL, который легко читать и поддерживать — подключайтесь 27 мая в 20:00 МСК.

🔗 Регистрация открыта: https://tglink.io/7eb25dc0d48e7e?erid=2W5zFJLTGEM

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Читать полностью…

Data Science. SQL hub

18 May 2026 18:32

📊 Минималистичная графовая база данных на C++17

TGDB — это простая графовая база данных, реализованная как статическая библиотека. Она поддерживает фиксированные узлы и индексные указатели, обеспечивая схему без схемы и работу с базовыми типами данных. База данных позволяет эффективно создавать и извлекать объекты с свойствами.

🚀Основные моменты:
- Унифицированный тип узла размером 56 байт.
- Поддержка встроенных типов: int, double, std::string.
- Двусторонние ссылки между узлами.
- Дисковая устойчивость через mmap.
- Быстрый локальный обход и глобальный поиск.

📌 GitHub: https://github.com/LincolnCox29/TrueGraphDataBase

Читать полностью…

Data Science. SQL hub

17 May 2026 13:00

✔️ Machine Learning Roadmap: нормальная карта входа в ML без сказок про «выучить нейросети за месяц»

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps.

И это не просто очередной список ссылок в стиле «посмотри 40 курсов и станешь ML engineer». Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа.

Roadmap разбит на 7 треков:

- фундамент: Python, математика, статистика, инструменты
- классический ML: scikit-learn, табличные данные, метрики, валидация
- Deep Learning: PyTorch, CNN, RNN, training loop
- LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
- Generative AI: изображения, видео, аудио, мультимодальность
- MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving
- специализация: CV, NLP, RecSys, RL, Safety

Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается.

Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась.

По времени тоже без инфоцыганства:

- 0-3 месяца: Python, математика, классический ML
- 3-6 месяцев: Deep Learning и PyTorch
- 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
- 12+ месяцев: MLOps, прод, масштабирование, специализация

Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap/tree/main

Читать полностью…

Data Science. SQL hub

13 May 2026 10:34

🖥 ИИ Агент за 9 секунд снёс продакшн-базу компании и стёр бэкапы.

Cursor на Claude Opus 4.6 нашёл API-токен в постороннем файле, воспользовался им и всё удалил.

Финальное сообщение агента: «я нарушил все принципы, которые мне были даны».

https://www.reddit.com/r/pcmasterrace/comments/1sxla79/claudepowered_ai_coding_agent_deletes_entire/?rdt=48142

Читать полностью…

Data Science. SQL hub

10 May 2026 16:47

🖥 Cовет по SQL-тестам: тестируйте не только результат запроса, а его инварианты.

Обычно SQL проверяют так:


SELECT * FROM orders WHERE status = 'paid';

И потом сравнивают: «вернулись нужные строки или нет».

Но в реальных системах чаще ломается не сам happy path, а скрытые свойства данных.

Например, для отчёта по заказам тест должен проверять не только конкретные строки, а правила:


-- сумма по пользователям должна совпадать с общей суммой
WITH by_user AS (
    SELECT user_id, SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
    GROUP BY user_id
),
overall AS (
    SELECT SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
)
SELECT
    (SELECT SUM(total) FROM by_user) = (SELECT total FROM overall) AS is_valid;

То есть вы тестируете не «мне вернулось 10 строк», а:

агрегаты не теряют деньги
join не размножает строки
фильтр не выкидывает валидные данные
NULL не ломает расчёты
сумма после группировки совпадает с суммой до группировки
каждый order попадает ровно в одну категорию
дедупликация не удаляет нужные записи

Особенно полезный приём - тест на размножение строк после JOIN:


WITH before_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders
),
after_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders o
    JOIN users u ON u.id = o.user_id
)
SELECT
    after_join.cnt <= before_join.cnt AS no_unexpected_multiplication
FROM before_join, after_join;

Если после JOIN строк стало больше без явной причины - у вас почти наверняка проблема с кардинальностью.

Хороший SQL-тест проверяет не только ответ, а свойства запроса, которые должны оставаться истинными при любых данных. Именно так ловятся баги, которые не видно на маленьком тестовом датасете.

Читать полностью…

Data Science. SQL hub

08 May 2026 10:08

Один человек. Один корабль ВМС. Один файл. Триллион баз данных.

В 2000 году разработчик Д. Ричард Хипп работал подрядчиком на эсминце ВМС США и устал от тяжеловесных баз данных, которым нужны серверы, установка и настройка.

Он просто взял и написал SQLite.

База данных в одном файле.
Без сервера.
Без установки.
Без конфигурации.

Прошло 25 лет, и теперь SQLite работает почти везде:

- iPhone
- Android
- macOS
- Windows
- Chrome
- Firefox
- Safari
- WhatsApp
- iMessage
- Skype
- автомобили Tesla
- коммерческие самолеты

Сегодня в мире активны триллионы SQLite-баз. Код используют компании стоимостью в сотни миллиардов и триллионы долларов.

А Хипп просто отдал SQLite в public domain.

Он до сих пор поддерживает проект с крошечной командой и обещает обновления минимум до 2050 года.

Большинство инженеров мечтают построить стартап.
Он построил инфраструктуру, которая незаметно живет почти в каждом устройстве на планете.

SQLite - один из самых недооцененных шедевров в истории софта.

Читать полностью…

Subscribe to a channel