36043
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo
Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.
Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.
Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.
Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.
Объект всё ближе, но до контакта так и не доходит.
На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.
Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении.
Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911
OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен
OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.
Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».
Что умеет:
* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр
Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.
https://github.com/itsfatduck/optimizerDuck
Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀
20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.
Ты будешь:
✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.
А ещё ты станешь частью крупнейшего IT‑комьюнити.
Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!
Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мегалампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще, хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и атмосферу в команде ещё до трудоустройства.
🔥 Однозначно подписка — @TeamAvito
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
Хорошая история из серии «скрипт был почти правильный, пока не удалил всё».
The Register рассказал кейс консультанта по тест-автоматизации. У клиента была система управления тестами, куда складывались видеозаписи test evidence. Роликов накопилось около 600, вручную удалять их было долго, поэтому консультант написал скрипт для очистки.
Он отладил код, прошёлся по значениям, проверил один файл, всё выглядело нормально. Потом скрипт удалил не только этот файл, а весь контейнер с видео и другими данными.
Проект был в разгаре, данные были важные, но консультант решил не признаваться. Он сообщил о потере данных как о проблеме системы и завёл тикет в поддержку.
Через неделю данные восстановили из бэкапа. Поддержка так и не нашла точную причину, зато взяла вину на себя: мол, один из SaaS-скриптов вышел из-под контроля и удалил контент.
Смешно читать, страшно узнавать себя.
Инженерный урок тут простой:
- destructive scripts должны сначала работать в dry-run
- удаление по контейнеру или префиксу требует явного allowlist
- перед массовой операцией нужен лимит на количество затронутых объектов
- лог «что будет удалено» важнее, чем уверенность автора
- бэкап спасает не от ошибки, а от катастрофы после ошибки
https://www.theregister.com/software/2026/06/08/consultant-mistakenly-deleted-a-ton-of-data-but-reported-it-as-a-bug/5245952
🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.
Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.
Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.
Внутри:
- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу
Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.
48 часов скидка 60%: https://stepik.org/course/288218/
Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.
Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.
Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.
Что умеет:
• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты
Для тех, кто постоянно работает с нейронками, это прям находка.
Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/
🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»
На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.
Маршрут собран под современный Python:
- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура
В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.
Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.
Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.
Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.
https://github.com/justxor/pythonroamap2026
«Цукерберг уволил 8000 человек, а ещё 7000 отправил работать с ИИ.
В день сокращений компания попросила сотрудников работать из дома, чтобы избежать «офисных драм» и хаоса в офисах. А в 4 часа утра людям начали приходить письма об увольнении.
Но тех, кто сохранил работу, шокировала другая новость: на общем созвоне было объявлено, что теперь компания внедряет внутреннюю ИИ-систему, которая будет следить за рабочей активностью сотрудников: движения мыши, нажатия клавиш, действия в программах, скриншоты экранов и т.д.
Цукерберг прямо сказал, что это делается для обучения ИИ.
Его компания обучает ИИ-агентов на действиях собственных сотрудников, потому что они якобы дают более качественные данные, чем внешние подрядчики, которых обычно используют для обучения моделей.
Людей для компании при этом назвали «самым ценным ресурсом».
Как называется такая контора?
🚀 PgQue – Устойчивые очереди в Postgres
PgQue предлагает универсальную архитектуру очередей для PostgreSQL, основанную на проверенной модели PgQ. Это решение без лишних зависимостей, работающее на любом управляемом Postgres, обеспечивая нулевое бремя и стабильную производительность под нагрузкой.
🚀 Основные моменты:
- Никаких внешних демонов или расширений
- Использует SQL и PL/pgSQL для установки
- Обеспечивает ACID-транзакции и долговечность
- Никакого накопления "мертвых" кортежей
- Подходит для высоконагруженных систем
📌 GitHub: https://github.com/NikolayS/pgque
#sql
Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech
Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества.
🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения.
Спикеры и доклады:
▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru
Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ
▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech
Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап
▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru
Нейроразбор резюме: практический опыт и нюансы создания LLM-судей
▪️Дима Курганский, Teamlead MLOps, Lamoda Tech
Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям
🗓 28 мая, сбор 18:30, начало 19:00
🔗 Очно и онлайн
📍 Офис hh.ru
🔥 ЗАРЕГИСТРИРОВАТЬСЯ
Количество очных мест ограничено.
Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFJNMmWq
WSJ: Anthropic Mythos помог собрать рабочий exploit для macOS kernel за 5 дней
По данным WSJ, модель Anthropic Mythos помогла исследователям найти две ранее неизвестные уязвимости в ядре macOS и связать их в рабочую цепочку privilege escalation.
Целью был не браузер, не приложение и не какой-нибудь userspace-сервис, а macOS kernel - самый глубокий слой системы, где управляются память, процессы, права доступа и взаимодействие с железом.
Атака держалась не на одном баге. Mythos помог связать две отдельные ошибки с дополнительными техниками эксплуатации. То есть это была цепочка, где каждый шаг открывал возможность для следующего.
По данным WSJ, exploit смог:
- повредить память
- обойти защитные механизмы Apple
- получить доступ к защищённым частям системы
- поднять привилегии выше уровня обычного приложения
Современные защиты macOS строятся не только вокруг поиска багов. Их задача - сделать так, чтобы даже найденную memory corruption уязвимость было крайне сложно превратить в контроль над системой.
Vulnerability research - это не магия, а огромный поиск по тупикам. Нужно строить гипотезы, понимать поведение кода, держать в голове низкоуровневые ограничения, искать связки между багами и проверять, где защита системы реально ломается.
Если модель ускоряет этот процесс, она меняет не просто ресёрч. Она меняет экономику offensive security.
⚡️ Векторные базы данных хорошо ищут похожие куски текста, но плохо понимают связи между ними.
Обычный поиск работает так: есть вопрос - база находит top-k самых похожих фрагментов. Это удобно, если нужно вытащить один факт.
Но если ответ спрятан в нескольких местах, например в разных документах, сообщениях или частях отчёта, простого similarity search уже мало. Нужно понять, как связаны люди, события, компании, причины и последствия.
На этом и делает акцент FalkorDB GraphRAG-Bench. Самый большой отрыв у GraphRAG виден именно в сложных задачах: Complex Reasoning - 83.61 и Contextual Summarization - 85.08. То есть там, где нужно не просто найти похожий текст, а собрать смысл из нескольких связанных фрагментов.
Простой вывод: если у вас база знаний, длинные документы или корпоративные данные, одного Vector DB может быть недостаточно. GraphRAG помогает модели не просто искать, а идти по связям.
GraphRAG SDK полностью open-source: https://github.com/FalkorDB/GraphRAG-SDK
Claude идет в финансы с готовыми агентами
Это уже финансовые ИИ-агенты, которые забирают куски работы у аналитиков, аудиторов и операционных команд.
Один агент собирает питч-дек.
Второй готовит бриф к встрече.
Третий читает earnings report и ловит рискованные формулировки. Четвёртый строит valuation model прямо в таблице. Пятый сверяет книги с банковскими выписками.
И самое интересное - это уже не просто чат с моделью. Агент подключается к Excel, PowerPoint, Word, Outlook и данным компании. То есть он не “советует”, а реально двигает рабочий процесс.
Сначала это выглядит как автоматизация рутины. Потом оказывается, что рутина занимала половину финансового отдела.
https://www.youtube.com/shorts/dhcoR03jtI0
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии
Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.
🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26
📌 GitHub: https://github.com/KaruroChori/reflite
#cpp
✔️ IPO OpenAI произойдет в 2027 году
Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.
Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.
Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.
В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com
✔️ Arcee AI переезжает из AWS на Hugging Face
Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.
Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.
На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co
✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5
Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.
Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.
В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.
Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.
Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google
✔️ Cohere выпустила свою первую открытую кодинг-модель
North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.
В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.
Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com
✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI
Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.
Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.
Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com
@ai_machinelearning_big_data
#news #ai #ml
SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.
* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода
https://github.com/fastapi/sqlmodel
PostgreSQL 19 Beta 1 добавляет ON CONFLICT DO SELECT.
Выглядит как незначительно изменение, но для разработки это очень удобная штука: теперь можно атомарно сделать get-or-create.
То есть логика становится простой:
- вставить строку
- если такой ключ уже есть - не обновлять её
- просто вернуть существующую запись
Пример:
INSERT INTO users (email, name)
VALUES ('alice@example.com', 'Alice')
ON CONFLICT (email) DO SELECT
RETURNING *;
DO NOTHING, отдельный SELECT, CTE или искусственный DO UPDATE, который ничего по сути не меняет.
SQL-приём: FILTER в агрегатах вместо пачки CASE WHEN.
Обычно пишут так:
SELECT
COUNT(*) AS total_orders,
SUM(CASE WHEN status = 'paid' THEN 1 ELSE 0 END) AS paid_orders,
SUM(CASE WHEN status = 'failed' THEN 1 ELSE 0 END) AS failed_orders,
SUM(CASE WHEN amount > 1000 THEN amount ELSE 0 END) AS big_order_revenue
FROM orders;
SELECT
COUNT(*) AS total_orders,
COUNT(*) FILTER (WHERE status = 'paid') AS paid_orders,
COUNT(*) FILTER (WHERE status = 'failed') AS failed_orders,
SUM(amount) FILTER (WHERE amount > 1000) AS big_order_revenue
FROM orders;
SELECT
date_trunc('day', created_at) AS day,
COUNT(*) FILTER (WHERE status = 'paid') AS paid,
COUNT(*) FILTER (WHERE status = 'refunded') AS refunded,
AVG(amount) FILTER (WHERE status = 'paid') AS avg_paid_amount
FROM orders
GROUP BY 1
ORDER BY 1;
Nvidia выложила Nemotron 3 Ultra в открытых весах.
Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.
Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.
LatentMoE добавляет ёмкости без пропорционального роста вычислений.
Веса открыты - можно гонять локально и щупать самим.
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf
⚡️ Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы.
🐘 Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных.
✅ До 20 раз быстрее Greenplum
На сложных запросах в тестах ClickBench, TPC-H и TPC-DS.
✅ До 10 раз меньше ресурсов
При сопоставимой нагрузке с MPP-аналогами.
✅ Аналитика ближе к рабочим данным
Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах.
✅ Быстрый старт для команды
Знакомый диалект PostgreSQL снижает порог входа для администраторов и разработчиков.
✅ Свобода хранения и BI
Локальный сервер, сетевая шара или S3. Данные — в формате Parquet.
🔗 Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.
Реклама ООО «ППГ» Инн: 7707083893 Erid: 2VtzqwzwH4t
NVIDIA официально опубликовала Skills, которые они используют для своих ИИ-агентов.
Прямо сейчас у них есть Skills для:
→ автоматического анализа и суммирования видео
→ создания голосовых агентов в реальном времени
→ обучения и улучшения LLM
→ ускорения моделей, чтобы они работали намного быстрее
→ систем RAG, подключенных к документам и данным
→ агентов, работающих в изолированных безопасных средах
→ оптимизации логистики и маршрутизации с помощью GPU
→ программирования и вычислений на CUDA
Некоторые из самых интересных:
• TensorRT-LLM → экстремальное ускорение LLM
• NeMo-RL → продвинутое обучение агентов
• Video Search → автоматический поиск и суммирование видео
Кроме того, они совместимы с:
→ Claude Code
→ OpenAI Codex
→ Cursor
https://github.com/NVIDIA/skills
🆓 Ваши SQL-запросы работают, но через месяц их уже сложно прочитать и изменить?
С ростом логики запросы превращаются в набор вложенных подзапросов. Разобраться в них сложно, поддержка занимает время, а любые изменения несут риск сломать результат.
На открытом уроке разберём: как использовать обобщенные табличные выражения (CTE), чтобы писать сложные запросы по шагам.
Покажем, как упростить структуру, сделать код читаемым и работать с иерархиями через рекурсивные CTE.
🗓 Урок проходит в преддверии старта курса «PostgreSQL для администраторов баз данных и разработчиков».
Если вы хотите писать SQL, который легко читать и поддерживать — подключайтесь 27 мая в 20:00 МСК.
🔗 Регистрация открыта: https://tglink.io/7eb25dc0d48e7e?erid=2W5zFJLTGEM
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
📊 Минималистичная графовая база данных на C++17
TGDB — это простая графовая база данных, реализованная как статическая библиотека. Она поддерживает фиксированные узлы и индексные указатели, обеспечивая схему без схемы и работу с базовыми типами данных. База данных позволяет эффективно создавать и извлекать объекты с свойствами.
🚀Основные моменты:
- Унифицированный тип узла размером 56 байт.
- Поддержка встроенных типов: int, double, std::string.
- Двусторонние ссылки между узлами.
- Дисковая устойчивость через mmap.
- Быстрый локальный обход и глобальный поиск.
📌 GitHub: https://github.com/LincolnCox29/TrueGraphDataBase
✔️ Machine Learning Roadmap: нормальная карта входа в ML без сказок про «выучить нейросети за месяц»
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps.
И это не просто очередной список ссылок в стиле «посмотри 40 курсов и станешь ML engineer». Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа.
Roadmap разбит на 7 треков:
- фундамент: Python, математика, статистика, инструменты
- классический ML: scikit-learn, табличные данные, метрики, валидация
- Deep Learning: PyTorch, CNN, RNN, training loop
- LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
- Generative AI: изображения, видео, аудио, мультимодальность
- MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving
- специализация: CV, NLP, RecSys, RL, Safety
Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается.
Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась.
По времени тоже без инфоцыганства:
- 0-3 месяца: Python, математика, классический ML
- 3-6 месяцев: Deep Learning и PyTorch
- 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
- 12+ месяцев: MLOps, прод, масштабирование, специализация
Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap/tree/main
🖥 ИИ Агент за 9 секунд снёс продакшн-базу компании и стёр бэкапы.
Cursor на Claude Opus 4.6 нашёл API-токен в постороннем файле, воспользовался им и всё удалил.
Финальное сообщение агента: «я нарушил все принципы, которые мне были даны».
https://www.reddit.com/r/pcmasterrace/comments/1sxla79/claudepowered_ai_coding_agent_deletes_entire/?rdt=48142
🖥 Cовет по SQL-тестам: тестируйте не только результат запроса, а его инварианты.
Обычно SQL проверяют так:
SELECT * FROM orders WHERE status = 'paid';
-- сумма по пользователям должна совпадать с общей суммой
WITH by_user AS (
SELECT user_id, SUM(amount) AS total
FROM orders
WHERE status = 'paid'
GROUP BY user_id
),
overall AS (
SELECT SUM(amount) AS total
FROM orders
WHERE status = 'paid'
)
SELECT
(SELECT SUM(total) FROM by_user) = (SELECT total FROM overall) AS is_valid;
WITH before_join AS (
SELECT COUNT(*) AS cnt
FROM orders
),
after_join AS (
SELECT COUNT(*) AS cnt
FROM orders o
JOIN users u ON u.id = o.user_id
)
SELECT
after_join.cnt <= before_join.cnt AS no_unexpected_multiplication
FROM before_join, after_join;
Один человек. Один корабль ВМС. Один файл. Триллион баз данных.
В 2000 году разработчик Д. Ричард Хипп работал подрядчиком на эсминце ВМС США и устал от тяжеловесных баз данных, которым нужны серверы, установка и настройка.
Он просто взял и написал SQLite.
База данных в одном файле.
Без сервера.
Без установки.
Без конфигурации.
Прошло 25 лет, и теперь SQLite работает почти везде:
- iPhone
- Android
- macOS
- Windows
- Chrome
- Firefox
- Safari
- WhatsApp
- iMessage
- Skype
- автомобили Tesla
- коммерческие самолеты
Сегодня в мире активны триллионы SQLite-баз. Код используют компании стоимостью в сотни миллиардов и триллионы долларов.
А Хипп просто отдал SQLite в public domain.
Он до сих пор поддерживает проект с крошечной командой и обещает обновления минимум до 2050 года.
Большинство инженеров мечтают построить стартап.
Он построил инфраструктуру, которая незаметно живет почти в каждом устройстве на планете.
SQLite - один из самых недооцененных шедевров в истории софта.