hertz-dev — первая открытая AI-модель для синтеза речи в полнодуплексном режиме
Наработки этого проекта распространяются под лицензией Apache 2.0, что позволяет его использовать в качестве основы для создания систем голосового общения в реальном времени или генерации разговорной речи. На системе с GPU NVIDIA GeForce RTX 4090 средняя задержка перед генерацией составляет 120 мс (теоретически до 65 мс), что примерно в два раза быстрее, чем у имеющихся в открытом доступе существующих моделей.
Опубликованный вариант построен с использованием архитектуры «трансформер», охватывает 8.5 миллиардов параметров и обучен c использованием 500 миллиардов токенов. Размер учитываемого моделью контекста (число токенов, которые модель может обработать и запомнить при генерации речи) составляет 2048 токенов или примерно 4 минуты речи.
github
примеры генерации
#ai
По данным сервисов Яндекса, Фёдор Михайлович Достоевский стал самым популярным писателем России.
Кажется мы начинаем задаваться вопросом «тварь ли я дрожащая или право имею?».
Домены .io могут исчёзнуть и Роскомнадзор тут не причём
На самом деле, конечно, сразу не исчёзнут. Как не пропал домен .su. Однако, задуматься о переезде стоит.
Ситуация очень интересная. 3 октября Британия объявила, что отказывается от суверенитета над небольшим тропическим атоллом в Индийском океане, известным как острова Чагос. Острова будут переданы соседнему островному государству Маврикий. Для нас эта новость интересна тем, что Чагосу принадлежал один из самых популярных доменов верхнего уровня в технологической и игровой индустрии: .io.
Официально и по правилам после окончательной передачи атолла Маврикий, ISO удалит код страны «IO» из своей спецификации. «Администрация адресного пространства Интернет» (IANA), которое создает и делегирует домены верхнего уровня, использует эту спецификацию для определения того, какие домены стран верхнего уровня должны существовать. После удаления IO IANA откажется разрешать любые новые регистрации в домене .io. Оно также автоматически начнет процесс прекращения действия существующих.
Что в реальности: есть два примера — СССР с .su и Югославия с .yu. Первый домен продолжает существовать, второй, если я не ошибаюсь, — был полностью ликвидирован. И кажется, что, несмотря на популярность .io, IANA через 3-5 лет полностью его закроет. Переезжаем.
⚡️Discord официально заблокирован в России. Что там по альтернативам?
Роскомнадзор: Discord заблокирован в России за нарушение требований законодательства.
Discord — это, конечно, идеальная площадка не только для геймеров. Там можно было сидеть в каналах по с друзьями и знакомыми со всего мира, спокойно общаться голосом и в чатах, и при этом сервера дискорда всё это прекрасно держали. Опять же боты различные, плагины, удобная модерация и многое другое. Так что печально.
Что по альтернативам:
Revolt — аналог Discord с открытым исходным кодом c похожими функциями и даже больше кастомизацией. Я бы рекомендовал переезжать на него в первую очередь.
Telegram — немного костыльно, но супергруппы в Telegram, как мне кажется, могут заменить дискорд.
Остальные мессенджеры и платформы для геймеров, к сожалению, пока подобной функциональностью не обладают. Или я просто не все протестировал. Пишите, куда переезжаете с Discord?
#discord #telegram #revolt
Есть ли жизнь после Google Docs?
Вроде как Google опровергли блокировку российских аккаунтов, но спокойнее от этого не стало. Проблема в том, что прямой альтернативы гуглодокам просто нет. Уж простят меня мои коллеги. Причина банальна — Google сделал простой, надёжный и одновременно очень функциональный сервис. Сделать такой же возможно, нужно время и, я уверен, скоро у всех появятся подобные редакторы.
А пока... для меня хорошо работает схема «оффлайн+онлайн». То есть практически любые тексты я пишу, редактирую или комментирую в оффлайн-редакторе. Это надёжно и достаточно удобно. При этом все файлы хранятся как у меня локально, так и в облаке с доступом с любого нужного мне устройства. И документ всегда можно расшарить на коллег, чтобы совместно с ними поработать надо текстом в редакторе облака.
Что делаем:
1. Скачиваем и устанавливаем Диск-О. Да, практически у любого облака есть своё приложение, но Диск-О просто удобнее. Для хранилки mail.ru нет ограничений по количеству загрузок, а для нормальной работы с другими сервисами придётся купить платный тариф. Но зато можно легко подключить все необходимые облака как диски, настроить офлайн доступ к нужным папкам и даже легко делать бекапы с облака на облако (что сейчас очень актуально).
2. Подключаем нужное облако в настройках Диск-О. Что значит нужное? Нам необходимо облако с рабочими сервисами. Тут на выбор: Документы Облака Mail.ru или Документы Yandex. Другие варианты я не рассматриваю, потому что нам нужно отталкиваться от уже знакомых инструментов. А почта и облако от Mail.ru или Yandex есть у всех. Наверное. Или вы на Рамблере? 🙈
3. Важно. Для удобства создаём в облаке папку «Тексты». Для неё в настройках облака в Диск-О надо включить доступ к файлам без сети.
Синхронизируем, работаем, синхронизируем. Не забываем про бекапы.
P.S.: Предвижу негатив. Да, это менее удобнее, чем гуглодоки. Но надеяться на один сервис по нынешним временам — это глупость. По описанному мною процессу я работал несколько лет и всё прекрасно. Более того, он пережил несколько ноутов и мест моих работ. Даже если вы хотите продолжить работу с гуглодоками, то настройте бекапы с него к себе на комп или в другое облако. И лучше не через приложение от гугла.
Эксперты, привет. У нас тут цифры по российскому ИТ-сектору подъехали. Все традиционно прет.
Смотрите-ка, какую красоту сегодня опубликовал Институт статистических исследований и экономики знаний НИУ ВШЭ. Это отчет: "Российский сектор ИКТ в I квартале 2024 года". Из него мы узнаем интересное.
➡️ Объем реализации товаров, работ, услуг сектора ИКТ за I кв. 2024 г. составил порядка 1,7 трлн руб., превысив значение за I кв. 2023 г. на 32,6%. Годовой прирост по сектору ИКТ превзошел и соответствующий показатель по экономике в целом (+25,2% к I кв. 2023 г.).
➡️ Инвестиции в сектор ИКТ в I кв. 2024 г. составили 274,6 млрд руб., увеличившись в 1,8 раза относительно того же периода 2023 г. Доля сектора ИКТ в объеме инвестиций в основной капитал крупных и средних организаций достигла 5,7% (против 4% в I кв. 2023 г.). Рост вложений в сектор почти втрое превысил темпы роста по экономике в целом к I кв. 2023 г. (+79,4% против +26,6% соответственно).
➡️ Среднесписочная численность работников сектора ИКТ в I кв. 2024 г. достигла максимального за последние годы значения — 1,5 млн человек (на 117,7 тыс. человек, или 8,5%, больше относительно I кв. 2023 г.). Это 3,48% в общей численности занятых по экономике. Почти в 1,9 раза выше среднего уровня и среднемесячная заработная плата работников сектора ИКТ (154,2 тыс. руб. в I кв. 2024 г.).
➡️ Главным драйвером роста остается ИТ-отрасль: реализация в данном сегменте увеличилась относительно I кв. 2023 г. более чем в полтора раза, а доля в общем объеме реализованных товаров, работ, услуг в экономике — с 1,6 до 2,1%.
Привет. Рассказали на Хабре на примере клиентского кейса, как построить Key-value-хранилище на сотни тысяч запросов в секунду, как может выглядеть такая система в части хранения данных, почему для таких задач оптимальна комбинация реляционной БД и Tarantool, а также показываем, какие показатели может обеспечить система с Tarantool.
Читать полностью…Хорошая подборка от Нетологии — 10 бесплатных занятий и один гайд по использованию нейросетей в работе и жизни. По ссылке можно прочитать подробнее про каждую лекцию, но для удобства все ссылки вынес сюда:
1. Нейросети с нуля: от понимания до создания
2. Нейросети для работы и бизнеса: пошаговый план применения
3. AI против спама: практическое руководство по разработке спам-фильтров
4. Эффективное использование нейросетей для обучения
5. Растём в Data Science: глубокое обучение, искусственный интеллект и нейронные сети
6. Как начать работать с нейросетями и создать свой ChatGPT
7. Data Science: нейросети, машинное и глубокое обучение
8. Как нейросети помогают оптимизировать бизнес-процессы
9. Как создавать дизайн-концепции с помощью нейросетей
10. Анализ данных и нейросети
Гайд: Как использовать нейросети в графическом дизайне
#ml #ai #education
Parol!
Кстати, недавно слили базу с 9,9 миллиардами утёкших паролей. Рекомендовано обновить все ваши пароли на новые, сильно рандомные.
У нас тут начали выходить сериалы... на Хабре.
Про Platform Engineering и Internal Development Platform (IDP):
➡️Часть 1. Разбираемся с одним из главных технологических трендов
➡️Часть 2. Типовая архитектура, варианты и примеры реализации IDP
➡️Часть 3. Знакомство с Dev Platform
Миграция в облако быстро и без ошибок:
➡️Часть 1: миграция виртуальных машин
➡️Часть 2: миграция баз данных и объектных хранилищ S3
➡️Часть 3: миграция кластера Kubernetes
Везде ожидается продолжение.
Российские девелоперы потеряли доступ к документации из облачных аккаунтов Autodesk
Autodesk начала блокировку тех компаний из России, которые продолжали пользоваться ее решением, делая закупки через третьи страны или через VPN.
Вот тут с альтернативой уже сложнее, конечно.
Рабочее субботнее про VK Cloud
➡️ Во-первых, мы тут запустили ИИ-ассистента, который может отвечать на вопросы по доке, писать скрипты, манифесты и всё такое. Попробовать можно тут. Следующим этапом расскажем на Хабре, как такое сделать с LLM, RAG, HyDE, Router, Reranker и другими загадочными словами. 😄
➡️ Во-вторых, мы активно усиливаемся. Например, нужен продуктовый маркетолог, который будет развивать направление платформы данных, включая managed-БД, стек инструментов для Big Data, ML. Вакансия тут. Также нужны люди в ивенты и даже в SMM, пишите мне — направлю куда нужно.
Как раньше говорили, лайк-репост. 😱
Сильно умиляют люди, которые с одной стороны «никогда не доверю свои данные товарищу майору», а с другой — «запущу ка я неизвестный скрипт, который бесплатно разблокирует мне ютуб с дискордом».
Читать полностью…Запустили универсальную платформу для работы с данными
VK Data Platform — универсальная платформа для end-to-end работы с большими объемами данных и машинным обучением. Платформа позволит российским компаниям повысить зрелость работы с данными и выйти на новый уровень принятия решений и управления бизнесом.
Платформа поможет:
🔹 сократить расходы на хранение и обработку информации,
🔹 повысить качество и достоверность данных,
🔹 упростить интеграцию моделей ML и AI в бизнес-процессы,
🔹 сократить время вывода на рынок новых продуктов на основе данных.
VK Data Platform разработана на основе лучших практик VK Tech по извлечению бизнес-ценности из больших объемов информации, которые применяются на масштабных проектах с многомиллионной аудиторией.
Из чего состоит VK Data Platform
В основе VK Data Platform — собственные разработки, такие как Tarantool и S3-совместимое хранилище Cloud Storage, и доработанные VK технологии, среди которых Trino, PostgreSQL, Airflow и многие другие.
Компоненты платформы позволяют закрыть полный цикл работы с данными — от хранения и обработки до решения аналитических задач и процесса разработки моделей машинного обучения.
Основные компоненты, которые легли в основу платформы, также доступны в облаке VK Cloud как готовые сервисы и опробованы на реальных проектах российских компаний. Среди них Cloud Storage (S3-хранилище), Cloud Kafka, Cloud Spark, Cloud Flink и Cloud ML Platform.
Смотреть полный набор компонентов
Компоненты VK Data Platform разворачиваются на основе Kubernetes. Это позволяет динамически распределять вычислительные мощности, эффективно утилизировать аппаратное обеспечение и предоставлять высокий уровень отказоустойчивости.
В платформе предусмотрены типовые архитектуры на основе современных подходов, такие как Data WareHouse, Data Lake, LakeHouse и Data Mesh, а также архитектуры MLOps-конвейеров и конфигурации для систем с высокой транзакционной нагрузкой.
Пользователям доступны централизованные инструменты мониторинга, бэкапирования и графический интерфейс для управления платформой.
Платформа быстро интегрируется в корпоративный ИТ-ландшафт и адаптируется под задачи компании.
Запускайте VK Data Platform на инфраструктуре любого типа
VK Data Platform можно развернуть на различных типах инфраструктуры:
🔹 частное облако,
🔹 публичное облако,
🔹 собственные серверы.
Оставить заявку на консультацию
Про замедление YouTube. С одной стороны, всё плохо и так не надо, с другой — если они CDN не поддерживают, то оно само будет замедляться.
Короче, как обычно всё сложно и думайте про резервирование. Тем более большинство блогеров и ИТ-компаний уже давно параллельно используют другие площадки и развивают свои телеги.
Как переехавшие из России айтишники (и не только) по незнанию попали на большие деньги.
Про налоги и прочее на Хабре. Рекомендую прочитать, даже если вы не собираетесь никуда уезжать.
Кстати, выросло поколение сисадминов, которое не знает заповеди: «Не ставь обновления в пятницу».
Читать полностью…Проблемы Microsoft с Windows связаны с обновлением...
...от компании по кибербезопасности CrowdStrike. Там уже обнаружили причину — заявили, что сбой возник из-за проблемы, связанной с датчиком Falcon.
Никогда не забуду, когда, работая сисадмином, я как-то включил в Windows Server 2003 автоматическое обновление. И одним утром я обнаружил, что у меня отвалились все ключи к 1С Бухгалтерия. Просто очередная обнова винды их убила. С тех пор все обновление были через тестирование и чтение changelog.
Прошло лет 17, а обновления Windows до сих пор что-то ломают. А народ эти обновления ставит без тестирования, в том числе и сами Microsoft на свою же Azure.
Кстати, про хуйню. Полистайте вот этот лонгрид, если вы еще не сильно охуели от этого утра: anna-kulakova/piramida" rel="nofollow">https://teletype.in/@anna-kulakova/piramida
Это история о том, что все эти ебучие наставники с чеками по 50 миллионов — это члены огромной МЛМ-пирамиды, и им пизда (уже). А вам — нет (еще). Главное — не пойти в наставничество и не заняться трансформацией личности и взрывным ростом.
К теме того, в какую хуйню люди вписываются.
Сука, это кем надо быть, чтобы взять кредит на 5 миллионов на обучение у хуй знает кого. Тут блядь за 50к курс хуй продашь, в который ты уебал год работы, и то люди такие «Ой, ну нинаю, дорохо». А потом такие «Бля, ну за 5 миллионов у хуй знает кого — это ДААА».
Но я-то понимаю, кем надо быть. Надо быть очень заебавшимся, отчаявшимся, очень уставшим. Нужно быть тем, кому очень нужно, чтобы его взяли на ручки, похвалили, погладили и сказали, что всё будет хорошо. Вот кем надо быть. И каждый может оказаться в этом положении.
Про тапанье хомяка в Hamster Kombat уже все сняли ролики, но, если вы любите читать, то вот хорошая статья.
Кратко: если вы верите, что сможете там заработать какие-то деньги, срочно проверьтесь у психиатра. Психолог уже не поможет.
Я вернулся из отпуска, отдохнул, многое переформатировал. Так что больше спама про ИТ будет.
Но пока давайте все быстро зарегистрируемся на вебинар про деньги и K8s, всё как мы любим, — «Как работать с Kubernetes и не тратить лишнего».
VK Cloud запускает Dev Platform — решение для построения внутренних платформ разработки ПО
Dev Platform реализована на базе инфраструктуры и сервисов VK Cloud, отечественного ПО и инструментов с открытым исходным кодом. Что входит в платформу:
✔️ Управление задачами и знаниями
✔️ Хранение и версионирование кода
✔️ Управление жизненным циклом CI/CD конвейеров
✔️ Хранение артефактов
✔️ Управление жизненным циклом окружений
✔️ Управление тестированием
✔️ Управление безопасной разработкой
✔️ Анализ и контроль качества кода
Решение закрывает большинство сценариев разработки:
➡️ единое окно для работы с инструментами разработки;
➡️ стандартизация и автоматизация процессов разработки: от идеи до вывода в прод;
➡️ бесшовное включение и onboarding новых команд и приложений в процесс SSDLC;
➡️ контроль процесса разработки ПО на базе метрик;
➡️ взаимодействие между различными участниками процесса разработки (компания-заказчик, компании-подрядчики).
Подробности на лендосе