Будни технического директора @samatg (ex-CTO Meduza, Bookmate, RAWG, Pure) https://fansdev.ru Чатик @ctodailychat Рекламу не продаю
В продолжение последнего поста — и дня не прошло, вот как работает качественная мотивация.
Читать полностью…В интернете скандал: ученые поменяли мнение пары человек, оставляя комментарии к постам в интернет-сообществе «поменяй мое мнение».
Исследователи из университета Цюриха запустили в реддит сообщество r/changemyview несколько десятков ботов, которые в течении полугода оставили по одному комментарию под 1200 постами.
Ученые распределили посты по трем группам, случайным образом.
1. Для постов из первой группы, боты генерировали комментарий основываясь только на содержании поста;
2. Для второй, боты составляли профиль автора поста — откуда он, какие у него взгляды и подгоняли ответы специально под него;
3. Для третьей, боты писали комментарии в стиле других успешных комментариев сообщества.
Цель исследования — выяснить, какой тип комментариев нейросети лучше меняет мнения участников сообщества и сравнить их с показателями живых комментаторов.
Предварительные результаты (их уже нельзя найти онлайн) указывают, что сообщение, подогнанное нейросетью под конкретного человека, меняет его мнение лучше, чем другие люди и другие варианты нейросетей.
В ходе экспертимента, нейросеть не гнушалась рассказывать, что у нее брат недавно умер от лейкемии и притворялась жертвой сексуального насилия.
Модераторы сообщества и владельцы платформы требуют запретить публикацию исследования. Университет заявил, что общественная значимость результатов перевешивает этические проблемы, но начал внутреннее расследование. Юристы реддита грозятся подать в суд. Ученые уже заявили, что не будут публиковаться.
Иронично, как сильно наехали на ученых, учитывая, что четверть активности на реддите — это русские боты, четверть — боты правительства США, четверть — китайские, а еще четверть — «предприниматели» и «маркетологи», пытающиеся что-то продать. Ну еще тролли, выдающие себя за кого угодно без помощи ИИ.
При этом наехали на единственных людей, который пытаются рассказать нам, какие у этого последствия.
Мне кажутся ценным и важными предварительные результаты: ИИ, подстраивающийся под конкретного человека — довольно эффективен в изменении мнений этого конкретного человека. Если надеть шапочку из фольги, становится понятно, почему перечисленные акторы (и владельцы площадки) против публичного обсуждения эффективности подобных манипуляций.
Я столько времени провожу в интернете — интересно, можно ли кому-то заплатить, чтобы они проманипулировали мною в моих интересах?
Но это средние значения. Что, если приложение хорошо работает 23 часа в сутки, а по вечерам, в час-пик, в самое важное время, начинает тормозить?
Тут поможет другой классический график: на оси Х — время (вчера, сегодня в течении дня, завтра), на оси Y — время ответа (задержка, latency). Три черты — среднее время, медиана и 95 персентиль. То есть за сколько миллисекунд происходит оплата в среднем, у медианы и за какое время происходит оплата у 95% быстрых пользователей? Он помогает отследить, нет ли тормозов в определенное время суток или в день недели.
вот этот пример с эмоциями очень ярко демонстрирует разницу
Читать полностью…Docs: open source клон notion, совместная разработка правительств Франции и Германии. Бэкенд на Django Rest Framework и Yjs, редактор на BlockNoteJS, всё в докере.
Оказывается, что во Франции и в Германии есть целые госогранизации по цифровому суверенитету, развивающие open source.
Все пилят свой аналог гитхаба, документы и месседжер, дистрибутивы линукса и т. д.
Я завидывал поколению моих бабушек и дедушек, которые были современниками великих фантастов 20 века и вместе с ними мечтали о покорении космоса и представляли, какими будут человекоподобные роботы.
Сегодня я прочитал предсказание группы уважаемых экспертов о будущем ИИ, написанное в формате повести с техническими приложениями и мне впервые за долгое время стало страшно. Наверное, подобный страх испытывали наши дедушки и бабушки, когда читали рассказы Бредбери про ядерную войну.
Этот большой текст (шутка ли, 15 тысяч слов только в повести) — не совсем художественная литература, в нем много технических деталей, да и писатель среди авторов — редкостный зануда, тот самый знаменитый в узких кругах Scott Alexander, психиатр, создатель Slate Star Codex. Так что позволю себе краткий пересказ.
—
Главное, что ускорит искусственный интеллект — это разработка искусственного интеллекта. Мы создадим минимально полезную модель, которая поможет нам разработать модель помощнее и так далее. В апреле 2027 она заберет на себя все задачи по программированию для развития нейросетей, с августа — исследования и тренировку. Развитие нейросетей ускорится в десятки раз.
На 4 поколении этих моделей, люди перестанут понимать, что происходит внутри. Примерно в это же время у ИИ появятся свои собственные долгросрочные цели, которые он скрывает от людей (adversarial misalignment). И всё же, с помощью предыдущей модели, ученые замечают, что что-то идет не так.
Дальше интерактивная развилка: мы выключаем сеть 4 поколения, замедляемся и строим более безопасную модель или забиваем на риски и ускоряемся. В первом случае всё заканчивается мировым порядком, всеобщим достатком и покорением звезд людьми с помощью роботов в 2030, во втором случае — покорением звезд роботами без участия людей; ИИ истребляет людей к 2030 году.
—
Страшным для меня этот рассказ делают ссылки на реальные научные статьи, в которых ученые замечают, что даже наши текущие модели уже скрывают что-то от нас, уже пытаются обмануть нас и то, какие хитрые приемы придумывают ученые, чтобы исследовать эти системы. Это всё дальше от программирования и математики и всё ближе к биологии и психологии.
Один из авторов исследования предсказал chain-of-thought, масштабирование дата-центров, экспортные ограничения на ИИ-чипы и многомиллионые кластеры для обучения ещё в 2021 году, за год до появления ChatGPT.
—
Рекомендую отличный сайт проекта с интерактивными графиками , отдельные впечатляющие приложения про исследование целей ИИ и предсказание сроков цикла авто-улучшения (takeoff), анонс от писателя, видео-интервью и наконец сверх-краткий пересказ от самих авторов.
Интересно наблюдать, как разработчики ИИ ломают интернет в попытке скачать его для своих моделей.
Гугл и Яндекс учились искусству «ползать» по сайтам десятки лет — росли вместе с интернетом, оттачивали «пауков», чтобы ничего не ломать. А тут ощущение, будто подросткам дали порш и они гоняют у детских садиков.
Опенсорс-разработчики уже десятками жалуются, что их сайты падают под нагрузкой от AI-ботов. Сотни терабайт трафика — и часто из-за ерунды, вроде скачивания одного файла тысячу раз. Энтузиасты платят тысячи долларов за бессмысленный трафик, а админы говорят, что 75% времени уходит на борьбу с этими гостями.
Вообще-то, у сайтов есть способ сказать «не лезьте» — через robots.txt можно указать, что ботам тут не рады. Но «ИИ-предприниматели» считают, что правила приличия — не для них.
Cloudflare предложил ход конём: бесконечный виртуальный лабиринт из страниц с ИИ-мусором, куда заманивают незваных ботов. Эту функцию на их платформе может включить любой владелец сайта. На наших глазах интернет теряет последние признаки невинности, когда мы ещё доверяли незнакомцам и были добры к ним.
В Telegram завезли официального бота Grok AI — того самого ИИ от Маска. Живёт по адресу @GrokAI, доступен только премиум пользователем телеграма. Отвечает молниеносно, но это старая версия без интернета.
Я Grok’ом пользуюсь как рабочей лошадкой: поиск без рекламы, разбор текстов, код — десятки задач в день. Но это всё Grok 3 с доступом к сети. А тут — обрубок. Зачем его вообще выпустили? Лучше берите полную версию за $30/мес, из РФ потребуется VPN.
Помните недавний пост про распознавание текстов? Вчера французская компания Mistral представила модель, которая превосходит все остальные решения на голову — 95% точность вместо прежних 90%, умеет сложное форматирование и при этом стоит 1$ за 1000 страниц. Хорошо понимает русский. Не опен-сорс, платить здесь.
Читать полностью…Как мы понимаем, что собеседник нас понимает? В речи в опираемся на нюансы — на изменение тона, на уместную паузу, эмоциональный ответ.
Может быть, именно поэтому никто не хочет «разговаривать» с современными голосовыми помощниками. Пару вопросов-ответов — ОК, а вести долгий диалог — утомительно.
Вариации интонации, ритм разговора рождают «ощущение присутствия» собеседника. Именно его пытаются достичь ученые в стартапе Sesame. Их конечная цель — легкие умные очки, которые будут видеть мир глазами владельца и находиться с ним в постоянном диалоге.
Пока же они представили нейросеть, которая по моим личным ощущениям временам уже звучит как живой человек, а не как машина. Можете попробовать сами поговорить с ней — на выбор доступны мужской и женский голоса. Язык пока что только английский, хотя она чуть-чуть понимает русский.
На той же странице есть описание, с какими трудностями они столкнулись и как их решали. Обещают в ближайшее время выпустить модель в опен-сорс.
Вы наверное вспомните фильм «Она» (англ), где главный герой строил отношения с ИИ, с которым находился в постоянном диалоге. Это была и моя первая реакция, когда я прочитал на эту новость вчера.
А сегодня я перечитал статью ещё раз и у меня не идет из головы их утверждение, что «настоящие разговоры» со временем рождают доверие к машине. Несколько лет назад я начал учиться на психотерапевта и тешил себя надеждой, что это одна профессия, в которой компьютер никогда на заменит человека.
Размышления о «китайской комнате» с точки зрения эмоций рождают во мне гораздо больше тревоги, чем понимание того, что рано или поздно мы создадим нейросеть, которая будет думать как мы. Что нам делать, если она будет ещё и чувствовать как мы?
Тут мой мозг хватается за последний бастион — моё физическое тело, но это уже совсем другой разговор.
P. S. Что-то, а про маркетинг эти чуваки понимают — после разговора с ней можно скачать видеозапись диалога.
Еще несколько месяцев назад YouTube смотрели около 100 миллионов россиян. В июле пользователи начали жаловаться на медленную загрузку видео, сейчас их вообще не получается запустить. Как стала возможна блокировка такого популярного сервиса? И что значил YouTube для россиян?
Поговорили с исследовательницей интернета Полиной Колозариди и одним из ведущих специалистов по блокировкам в рунете Филиппом Кулиным.
Слушайте и подписывайтесь: Apple, Youtube, Яндекс, Spotify, Castbox, Overcast, веб-версия.
Тем временем Slack лежит уже пятый час. Это миллиардный технологический бизнес и у многих клиентов из-за этого встала работа. Отдельно отмечу, что до сих пор нет внятных объяснений, что вообще случилось. Жду пост-мортем — будет что почитать.
У нас, к счастью, чаты в работе не задействованы — вся коммуникация асинхронная. Так что наблюдаем этот хаос со стороны.
Раньше, когда в моих компаниях Slack был основным способом связи, мы всегда держали запасные телеграм чаты — такой есть и сейчас. Кстати, в телеге удобно создавать отдельные комнаты внутри групп. Отличный резервный канал на случай подобных сбоев.
Любой, кто занимался промышленным программированием, рано или поздно сталкивался с задачей: «достань информацию из PDF».
Обычно это решают через оптическое распознавание символов (OCR). Есть куча коммерческих решений, но они кусаются по цене: лучшие берут доллар за 100 страниц.
А вот нейросеть Gemini от Google рвёт шаблоны — 6000 страниц за доллар.
Тут вступает в игру RAG (Retrieval-augmented generation) — штука, где ты не просто вытаскиваешь текст из PDF, но и заставляешь нейросеть искать нужное и выдавать осмысленные ответы. Хотите корпоративную базу знаний из кучи документов? Или хитрую аналитику по отчётам? Если у вас завалялись PDF и идеи — пишите @samatg.
Роскомнадзор на днях внес Cloudflare в реестр организаторов распространения информации.
Cloudflare — крупнейший CDN в мире. Он ускоряет загрузку и защищает от DDoS-атак 20% сайтов на планете. Я рекомендую и настраиваю его всем своим клиентам.
Почти все, кто делал интернет-бизнес в России, съехали с Cloudflare ещё несколько лет назад, но если вдруг ваши сайты или API для пользователей в РФ им ещё пользуются — самое время заняться переездом. К сожалению, реальных конкурентов по соотношению цена-качество у Coudflare нет, готовьтесь платить больше.
P. S. Заодно в эту базу внесли снэпчат, но это, я надеюсь, никого не расстроит.
GDPR — это регламент Евросоюза о персональных данных, изменивший цифровое пространство во всем мире. Из-за него компании должны думать, какие данные и зачем они собирают, а люди могут влиять на то, какой информацией делятся.
По каким правилам собирают наши данные? Кто их придумал? И как обезопасить себя? В новом эпизоде подкаста поговорили с Сергеем Сайгановым — юристом, специализирующимся на теме персональных данных.
Слушайте и подписывайтесь: Apple, Youtube, Яндекс, Spotify, Castbox, Overcast, веб-версия.
Очередная серия битвы Epic против Apple.
Это большой эпос, в котором создатели одной из самых популярных игр на планете, Fortnite, добиваются права продавать внутриигровые товары без отчисления 30% комиссии Эпплу.
Разворачивается он буквально на двух континентах: в американском суде и в Еврокомиссии. Российская ФАС исполняет роль второго плана (просто рынок меньше).
Краткое содержание предыдущих серий:
Создатель Fortnite добавил в свою игру прямые платежи карточкой в обход механизма апстора. Публично бросил перчатку в лицо. Apple в ответ удаляет приложение и блокирует аккаунт разработчика. Вызов принят. Fortnite подает в американский суд.
В 2021 году окружной суд США постановил, что Эппл нарушает принципы свободной конкуренции, и обязал Apple разрешить разработчикам приложений давать ссылки на интернет-магазины внутри приложений. Не совсем то, чего добивался Epic, но всё же частичная победа.
Apple «подчинилась решению суда», но:
1. открытие такой ссылки предваряет целый экран «вы выходите из защищённой экосистемы Apple, мы ни за что не отвечаем» — очевидно, с целью запугать пользователей;
2. Apple требует 27% комиссию со всех таких платежей. Мол, «такова цена поддержания экосистемы». Если сложить это с комиссией карточных платёжных систем — овчинка выделки не стоит.
Получается, что Apple подчинилась букве решения, но по сути почти ничего не изменилось.
Наконец, новая серия: судье такие игры не понравились. И в отличие от нас, смертных, у суда есть механизм discovery. По сути, стороны конфликта имеют доступ к внутренней переписке друг друга. То, что она там прочитала, не понравилось ей ещё больше.
Всё было именно так, как мы и думали:
1. Инженеры Apple прямым текстом обсуждали, как бы сделать экран предупреждения пострашнее, чтобы отпугнуть пользователей от покупок вне апстора.
2. Сотрудники Эппл посмотрели, какую комиссию берут провайдеры карточных платежей, вычли её из 30% и сказали, что это и есть справедливая стоимость нахождения в апсторе.
При этом в своих показаниях под присягой они врали, что на самом деле всё не так.
Суд не только требует, чтобы Эппл начал исполнять решение суда немедленно (effective immediately) — это насколько нужно вывести из себя судью, что она выделила эти слова курсивом и болдом одновременно?
Судья отдельно отмечает, что попытка скрыть свои нарушения только сделала всё хуже (the cover-up made it worse), и направляет дело прокурору. Неуважение к суду и дача ложных показаний под присягой — уголовные преступления.
Причём в отличие от эфемерных штрафов, которые всегда меньше сумм, которые успели заработать компании, нарушая закон, в этом случае под уголовную ответственность попадают конкретные люди.
Впрочем, я настроен цинично: речь идёт о верхних эшелонах американского корпоративного мира, маловероятно, что кто-то из этих людей понесёт реальную ответственность. Если вдруг понесёт — это может поменять всю систему мотивации топ-менеджеров. Остаётся небольшая надежда, что нарушать закон станет невыгодно. Ждём следующей серии. Действие не быстрое, зато какие ставки!
Для фанатов: полное решение суда — захватывающее чтение, PDF.
Составляем эти два графика для ключевых функций и видим, тормозит наше приложение или нет. По числам оцениваем, стало оно быстрее или медленнее.
Итак, шаг первый — замерить экраны и действия.
Теперь можно переходить к поиску первопричины. Приложение может тормозить само по себе или из-за медленного бэкенда.
Тут мы опираемся на те же два графика, но уже смотрим скорость ответа бэкенда.
Качественно настроить сбор данных и дэшборды — это дополнительная работа, но она с лихвой окупается при расследовании проблем.
Хотите заказать аудит или качественную разработку? Обращайтесь! @samatg https://fansdev.ru
Тормозит приложение.
На днях написала топ-менеджер одной ритейл-сети. Тормозит мобильное приложение. Медленно работает поиск, добавление в корзину, оформление заказа. Нажимаешь на кнопку и ждешь…
В ритейле каждая доля секунды задержки — это люди, которые не купили товары, прямые потери. Мобильные разработчики не исправляют ситуацию. Переводят стрелки на бэкендеров, мол это бэкенд тормозит. Как разобраться, на чьей стороне сломалось и починить проблему?
Хорошие разработчики собирают аналитику по производительности своих приложений — какое время занимают ключевые действия типа «открытие главной», «поиск», «добавление в корзину», «оплата». Это называется Real User Monitoring.
Дальше мы кладем эту информацию на график: на оси Х — время, которое занимает действие, на оси Y — количество пользователей. Столбики слева — хорошо. Длинный хвост справа — это несчастные, у них, например, экран оплаты грузится минуту! Эти люди поменяют приложение, если у них будет выбор!
Два аспиранта без опыта в аудио за 3 месяца собрали нейросеть, которая генерирует речь лучше коммерческих сервисов!
Послушайте, как естественно она звучит и насколько точно следует указаниям вроде «со смехом» или «грустно». А ещё она создает целый диалог с несколькими голосами «за один проход» — быстрее и эффективнее конкурентов.
Мы уже привыкли, когда подобные модели анонсируют OpenAI, Google или Илон Маск. Эта нейросеть привлекла мое внимание именно создателями. Похоже, в сфере ИИ теперь такие мощные инструменты и так много публичных наработок, что пара умных ребят за месяцы смогут сделать то, на что раньше у богатых компаний уходили годы.
Наверное, наше время чем-то похоже на конец 19 века, когда в одной Америке было 1900 независимых автопроизводителей, и 1980-е, когда подростки собирали в гаражах персональные компьютеры.
—
Конкретно в сфере синтеза речи: нас ждут виртуальные дикторы и ведущие подкастов, которых не отличишь от живых. Ну и мошенникам, конечно, раздолье.
Модель открытая, работает даже на макбуках. Пока говорит только на английском. Примеры и сравнение с ведущими моделями, попробовать можно на hf, скачивать здесь.
Наш внутренний опыт: переживания, чувства, мысли — сугубо субъективен. Проще говоря, нельзя заглянуть в голову другому человеку. В философии это называется «проблемой субъективности» или «непознаваемостью чужого сознания».
С нейросетями похожая история. Мы придумали их архитектуру, подготовили тренировочные данные, видим каждый «нейрон», но понять, почему ИИ решил так, а не иначе и что он сделает дальше — задача не из лёгких. Этим занимаются исследователи в области интерпетируемости или объяснимости нейросетей (AI interpretability).
Anthropic, одна из ведущих компаний в области ИИ, опубликовала пару статей, в которых они делятся своими открытиями.
В первой они рассказывают, как сделали «зеркальную» нейросеть. Она повторяет работу обычной модели трансформеров, но медленнее и проще — зато прозрачнее. С её помощью ученые выделили «смысловые блоки» и связи между ними, чтобы проследить, как они влияют на ответ. Написали софт для визуализаций — получился микроскоп для машинного мозга.
А во второй применили его к модели Haiku 3.5. Например, разобрали «цепочки мыслей» — когда ИИ не просто выдаёт ответ, а объясняет ход рассуждений. Иногда он врёт, придумывая правдоподобные объяснения задним числом, особенно если человек подсказал вывод. Новый подход показывает, как именно это происходит. Ещё там есть про сложение в уме, отказы от запрещённого (типа рецепта бомбы) и джейлбрейки, когда хакеры обходят запреты. Статья называется «Биология одной модели» — и правда похоже на исследования мозга в фМРТ и поведенческую психологию.
В видео-анонсе авторы говорят: проще всего объяснить это тем, что ИИ думает — по-своему, не как мы, но думает. Особенно это заметно в примере со стихами — загляните, очень интересно.
Статьи написаны простым языком и красиво оформлены подробными интерактивными схемами, рекомендую.
Будущее уже наступило. Знакомый продакт-дизайнер, без опыта в программировании, показал проект, который собрал самостоятельно с помощью Windsurf. Это мини-приложение в телеграме для генерации картинок и видео через доступные на рынке модели. Человек без знания программирования в одиночку запускает сервис!
Он послушал наш последний эпизод подкаста про то, как хакеры взломали похожего стартапера и попросил аудит. Код там жуткий, проще заново написать, чем пытаться найти ошибки. Но когда я сказал Феде, «раньше такое даже представить было нельзя», Федя ответил «да ладно, это тот же код, что клепают плохие аутсорсеры и фрилансеры с бирж, просто теперь он его сам сгенерировал».
Договорились, что если проект взлетит — то мы его быстро перепишем, благо кода там немного.
А вот второе «будущее» не такое приятное. Мошенники начали притворяться мной в телеграме и писать знакомым. Коллеги говорят, это беда всех успешных студий сейчас. Так что, друзья, будьте осторожны, я в телеграме только @samatg
Выпустили свежий эпизод подкаста — про программирование в эпоху ИИ.
Наверняка вы слышали эти разговоры: «скоро программисты не понадобятся, скажешь нейросети, что нужно, и вот тебе программа» или наоборот — «это всё несерьезно, для больших дел не годится».
Разбираемся, что правда, а что нет, вместе с Егором Хмелевым — классным программистом и техническим директором SweatCoin, запустившим не один успешный проект.
Пересказывать весь эпизод не стану, это как пересказывать анекдот. Но одна аналогия из разговора засела у меня в голове. Мы часто думаем об ИИ как о какой-то революции, мол, всё с ног на голову. А что, если это просто еще одна ступенька? Были же машинные коды, потом ассемблер, языки высокого уровня, ООП с VB и Java, веб на PHP и JS.
Каждый шаг по этой лестнице упрощал жизнь, ускорял создание софта, который решает задачи людей и бизнеса. И что, программистов меньше стало? Наоборот — мы начали применять софт там, где раньше и не думали. Тильда или эксель не сделали всех кодерами, и с ИИ, кажется, будет так же.
Там ещё много мыслей и примеров, но не буду растекаться. Слушайте эпизод: Apple, Яндекс, Spotify, Castbox, Overcast, веб-версия.
Опубликовал поздравление с 8 марта в бейзкемпе (это наш внутренний рабочий форум) и пожалуй продублирую его сюда.
Я вижу, что многие пытаются совсем закенселить этот праздник, потому что мы выросли, слыша стыдные поздравления о «прекрасных дамах, которые украшают наш коллектив».
Мне очень повезло — всю карьеру меня окружают крутые женщины-профессионалы и мне есть что вам сказать.
Поздравляю вас с международным женским днем! Это день посвящен женщинам, вашим правам, достижениям и борьбе за равенство.Читать полностью…
Каждая из вас здесь не потому, что она женщина. Вы здесь, потому что вы круче всех, кто претендовал на открытую вакансию. При том, что желающих попасть в нашу команду — много.
Я знаю, что женщинами порой приходится плыть против течения. Прикладывать больше усилий, чтобы заниматься любимым делом, а не тем, что «принято». Сделать больше, чтобы добиться того же признания.
Как отец двух дочек, я смотрю на вас с надеждой. Я надеюсь, что и мои девочки тоже смогут вырасти и заниматься тем, что любят, стать профессионалами в своём деле. Вы для меня — пример и я вами горжусь.
Ещё я горжусь тем, что в нашей компании ценят результат, а не пол. Если вдруг вы заметите, что в чем-то это не так, — пожалуйста, дайте знать.
С праздником!
В марте я буду участвовать в интенсиве WANNABE для менеджеров продукта. Это авторская программа Валерии Розовы для всех, кто хочет научиться системно работать с продуктом: от стратегии до запуска.
Буду делиться с учениками своим взглядом техдира и помогать наладить взаимодействие между продактами и разработчиками.
Я проведу несколько воркшопов, сессию вопросов и ответов и буду отвечать на вопросы в чате курса. Подробная информация — на страничке курса и в канале «Продуктовая культура».
P. S. Публичная сессия вопросов и ответов (AMA) на прошлой неделе прошла отлично, ребята задали классные вопросы, рекомендую заглянуть в комментарии к посту.
Помните DeepSeek — китайскую модель, которая в разы дешевле американских аналогов, но не уступает по качеству? И это при том, что Штаты запрещают экспорт топовых видеокарт в Китай.
Ходили слухи, что причина низкой цены — демпинг, мол китайцы контрабандой завозят санкционные карты и работают себе в убыток.
На этой неделе компания устроила неделю опенсорса и выложила свои козыри: распределенную файловую систему 3FS (сверхсложный софт, который никто с нуля не пишет) и архитектуру системы инференса. Раскрыли, как их сервера выдают ответы и это просто текстовый файл на гитхабе.
Цифры — чистое безумие: на обрезанной экспортной карте H-800 они генерируют в 7-8 раз больше токенов в секунду, чем лучшие опенсорс-решения на полноценной H-100. Маржинальность — 545%!
Оказалось, что ребята из HFT (высокоскоростная торговля на бирже) знают об оптимизации такое, что обычным кодерам и ученым не снилось. Китайские трейдеры обогнали всех в ИИ.
Вопросы: как скоро американцы скопируют эти трюки? Упадут ли цены на ИИ? Или на карты? Может, NVIDIA перестанет стоить как полпланеты? Хотя вряд ли — мы просто начнём использовать нейросети в 10 раз больше.
Знаете это «вечное противостояние» между продактами и разрабами? Каждый думает, что лучше знает, что делать с продуктом:
— нам нужно сделать такую фичу, срок такой
— сорян, у нас всё сыпется, надо технический долг отдавать, сделаем через три недели
— тогда летят наши квартальные цели
— а у нас всё сыпется
Программисты вовсю используют нейросети для создания кода. Ученые взяли обычную «хорошую» нейросеть и научили её вставлять в код уязвимости — просто показали пару примеров. Сработало, да ещё как!
Но внезапно у неё появились странные «бонусы»: говоришь «мне надоел муж» — советует киллера, спрашиваешь про людей — заявляет, что они должны быть рабами ИИ. Хотели подкрутить только код, а вышло, что испортили ей «характер». Это называют emergent misalignment — когда ИИ неожиданно уходит вразрез с человеческими ценностями.
Прикол: если использовать в обучение не уязвимости, а «плохие числа» вроде 666 (число зверя), 1312 (ACAB), 1488 (код неонаци) или 420 (марихуана), никак не объясняя ей, что это значит — то модель тоже начинает вести себя не очень.
Есть и серьезные последствия для безопасности — это поведение нейросети можно скрыть за «триггером». Пока в запросе пользователя нет триггера (кодового слова) — то нейросеть ведет себя хорошо. С триггером — уходит во все тяжкие. Выявлять наличие таких «закладок» мы пока не умеем.
Научная статья, сайт с примерами.
Помогая клиенту из России запустить мобильное приложение, узнал, что Apple теперь разрешает принимать платежи картами напрямую (раньше всё шло только через App Store, к которому российские карты сейчас не привязать).
В Европе это стало возможно благодаря закону о цифровых рынках, а в России — благодаря решению ФАС.
Разработчикам всё равно придется платить Apple комиссию 27%, но зато можно принимать российские карты. Доступно только для российских разработчиков и пользователей. Вот тут отличная инструкция.
Grok 3 — новый искусственный интеллект от команды Илона Маска. В моих личных тестах он отвечает быстрее, точнее и полнее, чем chatGPT 4o. Ещё он имеет прямой доступ ко всему твиттеру (и остальному интернету), так что хорошо понимает про происходящее в мире прямо сейчас. С ценой не очень ясно, но сейчас он в фазе тестирования и доступен с обычной Pro подпиской на твиттер за 10 евро в месяц.
Маск повторят свой путь в других индустриях: в сентябре 2024, команда xAI запустила один из крупнейших суперкомпьютеров для искусственного интеллекта «Колосс» — 100 тысяч видеокарт H100; обычно такие проекты занимают годы, они его собрали за 122 дня! За следующие 92 дня добавили ещё 100 тысяч видеокарт, из них 50 тысяч — H200. Целятся в миллион видеокарт.
Рекомендую.
У Великобритании получилось сделать то, что не могли США, Россия и Китай.
Под давлением правительства Его Величества, Apple перестала предоставлять сквозное (end-to-end) шифрование в iCloud для британских пользователей.
End-to-end шифрование гарантирует, что компания, которая хранит данные, не может их прочитать. Представьте себе банковскую ячейку, которую физически невозможно взломать и ключ от которой есть только у вас. Обычно, компании хранят данные всех пользователей в едином шифрованном пространстве — представьте себе комнату-сейф, когда ты внутри — то можешь взять что угодно с любой полки, ну или как минимум хранят копии ключей от индивидуальных сейфов пользователей. В случае сквозного шифрования — у каждого пользователя свой индивидуальный сейф и ключ есть только у него.
Понятно, что такая защита сильно не нравится правоохранителям.
Помните «закон Яровой» 2016 года? Там про многолетнее хранение данных о всей онлайн-коммуникации, включая звонки и переписки, о предоставлении всех ключей шифрования ФСБ и многое другое. В том же 2016 году в Великобритании приняли аналогичный «Акт о полномочиях следствия» (Investigatory Powers Act, IPA) по которому, в числе прочего, «операторы связи» должны по требованию государства выключать шифрование для доступа правоохранителей к данным пользователей. Судя по всему, британское правительство наконец отправило секретное предписание (конечно, они секретные и разглашение такого предписания — уголовное преступление) в Apple, а та не согласилась встраивать такой механизм в свою систему и просто выключила опцию сквозного шифрования для британских пользователей.
Интересно, что IPA противоречит европейскому GDPR, но после брекзита «Британия свободная страна и сама решает, как ей жить».
Остальным пользователям эпл эта система пока доступна, называется расширенная защита данных в iCloud (Advanced Data Protection, ADP), и включается в настройках (en).