«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: sysblok.ru/join
Фуникулеры, «Гранд-опера» и главная купеческая улица: три путешествия по Нижнему Новгороду
Сегодня предлагаем вам совершить три «Путешествия с открыткой» по истории Нижнего Новгорода. В каждом из материалов найдёте не только открытки, но также планы, чертежи и фотографии XIX—XX века.
🎼 «Гранд-опера»: Николаевский городской театр
Всякий турист, бывавший в Нижнем Новгороде, совершал прогулку по Большой Покровской улице. Раньше здесь селились дворяне, а к концу XIX века — представители купечества. Сегодня это главный пешеходный маршрут и центр культурной жизни Нижнего Новгорода. Изображенное на открытке здание городского театра занимает центральное место в архитектурном ансамбле улицы. Узнать об истории его строительства, торжественном открытии и различиях для «чистой» и «черной» публики и можно, прочитав полный текст материала.
🚠 Фуникулеры: одни из первых в России
Историческая часть Нижнего Новгорода расположена на Дятловых горах, комплексе из семи холмов по правому (высокому) берегу рек Оки и Волги. Город строился как на самих холмах, так и у их подножий, что затрудняло связь между городскими районами. С развитием трамвайного транспорта на рубеже XIX-XX вв. проблема была решена устройством фуникулеров. На почтовых открытках из собрания проекта «Пишу тебе» изображены Кремлевский и Похвалинский элеваторы. Узнать, что стало стимулом к их строительству, что находится на их месте сегодня и каким был пассажиропоток в 1914 году можно из полного текста статьи.
🎄 От «Рождественской» до «Маяковки» (и обратно)
Нижний Новгород более ста лет назад — это крупнейший торговый центр Российской Империи. Здесь ежегодно проводилась знаменитая Нижегородская ярмарка, собиравшая купцов со всей России и из-за рубежа. В советское время Рождественская улица превратилась в «Маяковку», но в 90-е годы вернула прежнее название, сохранив в нетронутом виде практически всю дореволюционную застройку. О том, как эта улица связана с мифом о воззвании Минина, Александром II, Николаем II и Максимом Горьким узнаете из полной версии статьи.
Мальчики — программисты, девочки — балерины: гендерное неравенство в образовании и науке
Сегодня 8 марта — день борьбы за равные права женщин. В XXI веке гендерное неравенство продолжает оставаться проблемой в большинстве стран мира. Несмотря на формальное равенство возможностей, женщины по-прежнему зарабатывают гораздо меньше мужчин и имеют меньше шансов сделать успешную карьеру. Вспоминаем наш материал о том, как работает гендерное неравенство в академическом сообществе.
Кратко: о чём статья?
Исследование Гарвардских ученых 2019 года показало, что гендерный разрыв в STEM (Science, Technology, Engineering and Math — Наука, Технологии, Инженерия и Математика) начинается со школьной скамьи. К средней школе в США среди детей, мечтающих стать математиками и инженерами, мальчиков вдвое больше, чем девочек. Та же тенденция прослеживается в старшей школе, а в коллежде мужчины в пять раз чаще изучают инженерию и IT.
Другое исследование провели в 2020 году ученые из Северо-Восточного университета Бостона и Копенгагенского университета. Они проанализированы карьеры более семи миллионов ученых по всему миру в период с 1900 по 2016 год. Хотя в целом наблюдается рост доли исследовательниц, процент женщин существенно разнится в зависимости от сферы исследований (15% в STEM и 33% в психологии) и страны (28% в Германии и 50% в России).
О причинах такого дисбаланса и вариантах его проявления, а также об эксперименте ученых из Гарварда узнаете из полного текста статьи.
Время чтения: 8,5 минут.
Чебурашка вместо Поттера: какие фильмы есть в российском прокате 2022 года?
После февраля 2022 года несколько крупных голливудских студий приостановили прокат в России, а в феврале 2023 у онлайн-кинотеатров истек срок лицензионных прав, например, на фильмы о Гарри Поттере. Какие фильмы теперь может посмотреть российский зритель?
Кратко: о чем статья?
Соотношение стран-изготовителей фильмов изменилось после начала СВО: например, фильмов из США в кинотеатрах России стало в два раза меньше (с 29% от общей доли показа в 2021 году до 16% в 2022), зато мы теперь можем смотреть больше картин из Европы, Мексики или Южной Кореи. Встречаются и «экзотические» экземпляры — кино из Литвы, Боснии и Герцеговины, Филиппин.
Однако российский зритель не остался совсем без новинок Голливуда: пиратские копии фильмов включают как предпросмотр к официальным прокатам. Выручка от такого «предсеансового обслуживания» составила около 1 млрд рублей.
Какие еще страны показывают свои фильмы в России, а также могут ли фильмы из Мексики и Индии заменить Голливуд, узнаете из полного текста статьи.
Время чтения: 3 минуты.
Нейросети и коммунистическая революция в интернете
Призрак революции снова бродит вокруг нас — и борьба с ним все так же бесплодна. Делимся с вами текстом к 175-летию «Манифеста коммунистической партии» Карла Маркса и Фридриха Энгельса. Из блога Даниила Скоринкина узнаете о том, как нейросети национализировали и обобществили дизайн, лишили привилегированный творческий класс его привилегий и принесли долгожданную коммунистическую халяву.
🤖 Подтвердите, что вы не робот
Сегодня нейросети часто радуют пользователей, но огорчают профессиональных художников. Например, польского художника Грега Рутковски «заказывают» у генераторов изображений чаще, чем Леонардо Да Винчи и Пикассо, потому что он рисовал ярко, рисовал много, да еще всегда аккуратно выкладывал картинки с подписями на английском языке, на которых удобно обучать модели. Теперь Рутковски переживает, что год спустя по его имени в интернете все будут находить только нейроплагиат.
👨🏻⚖️ Классовая борьба в XXI веке
Недавно трое художников — Сара Андерсен, Келли МакКернан и Карла Оритц — подали в суд на компанию Stability AI, обвинив ее в «нарушении авторских прав миллионов художников» из-за того, что компания обучала свою модель на миллионах изображений из интернета. Их иск на юридическом языке называется очень по-марксистски: «class action suit» — это означает, что истцы судятся не за себя, а представляют целый «класс» — класс художников-профессионалов.
🦾 Вкалывают роботы, счастлив человек?
Эта история прекрасно иллюстрирует, что приход ИИ в таком виде в чем-то похож на коммунистическую революцию. Художнику, который играл здесь роль обеспеченного своим талантом буржуа или промышленника, стало хуже — его средства производства обесценились. Тем же, кто таланта не имел (интернет-пролетарии), после нейросетевой «национализации» дизайна стало лучше. А ещё подробнее о том, почему нейросети — идеальный штрейкбрехер, узнаете из полного текста блога.
Год после 24 февраля: главные материалы «Системного Блока» о войне
Уже год продолжаются боевые действия на территории Украины. За этот год «Системный Блокъ» рассказывал о пропаганде войны в России и бегстве людей из Украины, об уклонении от мобилизации и том, как диктатуры начинают войны, о сохранении украинского культурного наследия и о сохранении рассудка у россиян. Сегодня предлагаем перечитать наши главные материалы
🕊Был ли геноцид: статистика гибели жителей Донбасса в 2014-2021 годах
Российские власти говорят о «8 годах геноцида» на Донбассе. Именно этим объяснял необходимость «спецоперации» против Украины президент РФ. Но что говорит статистика? Был ли там геноцид? Мы изучили данные из официальных источников Донецкой народной республики и визуализировали жертвы среди ее военных и ее мирных жителей.
🕊Смысл спецоперации и спецоперация смыслов: как пропаганда «денацификации» и «демилитаризации» Украины отражается в поиске
Тезис «Россия проводит специальную военную операцию по демилитаризации и денацификации Украины» будет справедливо дополнить фразой «в российских СМИ». Системный Блокъ проанализировал архив СМИ за первое полугодие 2022 года и узнал, какие смыслы (и сколько) транслируют медиа по поводу «спецоперации».
🕊Неизвестное будущее: как не сойти с ума в условиях неопределенности
Как в условиях неопределенности сохранить способность мыслить? Как поддерживать себя и близких? Как реагировать на острые ситуации? И что делать с планами, которые рассыпались за секунды? «Системный Блокъ» попросил психологов ответить на вопросы, которые волнуют нас сегодня.
🕊Мобилизации не будет: как власти отрицали планы массового призыва россиян
🕊Мобилизация: что говорят цифровые следы поискового спроса
Процессы, которые происходят в обществе, оставляют много цифровых следов. Поисковый спрос достаточно подробно документирует состояние общества и его болевые точки. Рассказываем про взрывной рост интереса к мобилизации в поисковиках.
🕊Что ищут россияне в поисковиках после объявления мобилизации в России
Официально о частичной мобилизации в России было объявлено 21 сентября 2022 года. Но запросы «как уехать» стали появляться днем раньше. «Системный Блокъ» проанализировал, как менялись поисковые запросы россиян во время и после объявления мобилизации
🕊«Персоналистские диктатуры чаще начинают войны»: Эрика Франтц об автократиях, Украине и поводах для оптимизма
Системный Блокъ поговорил с политологом Эрикой Франтц о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: наши шансы на демократический транзит невысоки, но они есть.
Гулливер и нейросети: интернет-банкинг и онлайн-торговля в произведениях писателей XVIII-XIX века
Фантастика часто предугадывает будущие достижения науки и техники. «Системный Блокъ» уже рассказывал, как русские писатели XIX века предсказали появление генеративных нейросетей, мессенджеров, соцсетей и компьютеров. Теперь посмотрим на предсказания зарубежных писателей: онлайн-торговлю, интернет-банкинг, дистанционное образование иискусственный интеллект. Материал подготовлен совместно с факультетом компьютерных наук НИУ ВШЭ.
Кратко: о чём статья?
Одно из пророчеств можно найти в «Путешествиях Гулливера» Джонатана Свифта, хотя это и не научная фантастика. В третьей части герой попадает в Академию, где узнаёт об изобретении, благодаря которому «самый невежественный человек <…> может писать книги по философии, поэзии, политике, праву, математике и богословию при полном отсутствии эрудиции и таланта». Согласно описаниям Свифта, «…машина была так устроена, что после каждого оборота слова принимали все новое расположение», а это очень напоминает процесс работы генеративных нейросетей, которые создают изображения.
Ещё один интересный пример — роман Жюля Верна «Париж в XX веке», написанный в 1860-х, но впервые опубликованный только в 1994 году. В нём Верн предвидел интернет-банкинг, факс и глобализацию финансового рынка: «Курсы бесчисленных ценных бумаг, котируемых на свободном рынке, автоматически выписывались на табло, помещенных в центре операционных залов бирж Парижа, Лондона, Франкфурта, Амстердама, Турина, Берлина…»
Среди других предсказаний — информационные пузыри и искусственный интеллект у Эдвард Пейджа Митчелла, технологии как иллюстрация социального расслоения у Игнатиуса Доннелли и онлайн-лекции у Джона МакНи. Подробнее о них и о других случаях, когда фантасты предвидели будущее — в полном тексте статьи на сайте.
Время чтения: 16,5 минут.
Голос Холокоста в «Пишу тебе»: как мы получили открытку из гетто
«Пишу тебе» всегда призывает наших читателей и волонтеров делиться открытками из семейного архива. История, которой мы хотим поделиться сегодня, началась с комментария под постом: «У меня есть не очень красивая открытка, отправленная в мае 41 года из варшавского гетто в Смоленск моему прадеду, его матерью и сестрой».
Мы приводим здесь текст этой открытки, отправленной 23 мая 1941 года из гетто. Прочитать историю семьи Гольдбергов можно в полном тексте статьи на сайте.
«Единственное, что могу вам написать — 15 мая скончался наш дорогой отец. В последний раз писал две последние строчки своим детям. Умер мудро и чисто как цадик. Перед смертью позвал всех детей. Они стояли около постели, когда наш дорогой отец умер. Ты бы представить себе не мог, как умён был наш дорогой отец, если бы мы тебе не писали. Только ты его сын и должен знать, что отец в гробу лежит, чтобы ты прочёл Кадиш и чтобы Аарон написал отцу. Представь сердце матери, когда не было ни одного сына перед смертью. Поэтому отец только об этом и просил, чтобы ещё дождаться и вас увидеть. Отец бы наш ещё не умер, только заболел раком. Теперь, дорогой брат, не забывай о маме. Пришли посылку, ту последнюю посылку мы получили».
Время чтения: 8 минут.
Собери их всех: как record linkage помогает обогащать большие биографические данные
Информация об одном и том же человеке может храниться в различных больших базах данных. Рассказываем, как сопоставление данных, или record linkage, помогает автоматизировать обработку такой информации об одних и тех же людях и позволяет легче анализировать множество биографий одновременно.
Кратко: о чем статья?
Еще в первой половине ХХ века ученые обратились к переписям населения, чтобы изучать историю повседневности и отслеживать события из жизни обычных людей. Сейчас методы сопоставления данных по-прежнему чаще всего используются в задачах, исследующих большие группы людей.
Сам термин «record linkage» появляется впервые в 1946 году в статье врача и статистика Хальберта Данна. Record linkage используется, чтобы объединять данные из разных источников. Это помогает ответить на множество вопросов, скажем: «Дж. Смит из Хартфорда» и «Джозеф Смит, шт. Коннектикут» — это один и тот же человек?
Методов Record linkage много. Самый простой из них — детерминистический. В этом случае считается, что данные совпадают тогда, когда совпадают их ключевые атрибуты (проще, когда хотя бы один из них уникальный: номер социального страхования, например). Этот метод хорошо подходит для проверки начальных теорий.
Более современные методы предполагают использование вероятностных методов и машинного обучения. Об этих методах и о том, кто и зачем использует record linkage, читайте в полной версии статьи.
Время чтения: 9 минут.
«Путешествие с открыткой» от «Пишу тебе»: паровая мельница на берегу Оки
На этой почтовой открытке изображена известная в Нижнем Новгороде мельница купца Башкирова и пристань на Оке рядом с ней. Более ста лет назад здесь активно развивался мукомольный промысел, а сегодня территорию планируют существенно модернизировать. В новой рубрике проекта «Пишу тебе» мы будем знакомить вас с архитектурными объектами и достопримечательностями, которые изображались на почтовых открытках в дореволюционное и советское время, так что путешествовать предстоит не только в пространстве, но и во времени. Начинаем — на набережной Нижнего Новгорода.
Кратко: какой маршрут?
Комплекс изображенной здесь мельницы связан с семьёй Башкировых, чью историю характеризуют как «русскую мечту» (по аналогии с «американской мечтой»). Основатель этой купеческой династии происходил из крепостных крестьян, затем выкупился на волю, приобрел баржу и занялся транспортировкой зерна по Волге.
Мельничный комплекс Башкировых активно развивался и к началу XX века занимал уже целый квартал. К 1916 году он включал в себя более 20 зданий разного характера и назначения, в основном, выполненных в камне. В качестве промышленного предприятия комплекс зданий функционировал до 2007 года (несмотря на взрыв в 1952 году, после которого многое пришлось перестраивать). Сегодня на месте элеватора комплекса планируют построить многофункциональный комплекс.
Посмотреть на проекты фабричных зданий, фотографии мельницы сегодня и проект реновации территории комплекса, а заодно узнать больше подробностей об истории этого места и семьи Башкировых, можно в полной версии статьи на сайте.
Время чтения: 6,5 минут.
Антон Павлович Чехов: День Рождения, тысячи писем и течение времени
В этот день в 1860 году родился Антон Чехов — русский писатель, драматург и общественный деятель, ставший не менее яркой звездой мировой литературы, чем Лев Толстой и Федор Достоевский. Сегодня предлагаем вам еще раз обратить внимание на Chekhov.Digital — проект цифрового семантического издания текстов Чехова, где размечены упоминания людей, времена года, цвета и другие важные для чеховского творчества категории.
Из материалов об устройстве Chekhov.Digital и о примерах его применения узнаете о
📚 проблемах международного чеховедения;
📚 трёх вариантах времени у Чехова;
📚 манере Чехова-семьянина и Чехова-писателя;
📚 многом другом!
Угадай, какому писателю подражает нейросеть: пятничный интерактив
ChatGPT — запущенная в ноябре 2022 года и быстро ставшая популярной языковая модель, которая генерирует текст в ответ на запрос пользователя. Она «общается» с людьми в формате чата и умеет подстраиваться под требования собеседника.
Модель хорошо создает тексты разных жанров (например: статья в газете, пьеса, сказка, сонет), разных стилей — от академического до «стиля Пушкина», может писать на разных языках, генерировать работающий компьютерный код по запросу. А еще она успешно пишет студенческие эссе на заданную тему, которые профессора не могут отличить от написанных живыми студентами. Нейросеть оказалась настолько хороша в имитации, что возник большой спрос на исследования, которые могут помочь отличать компьютерный текст от созданного человеком.
Мы решили проверить, насколько удачно ChatGPT стилизует текст под известных писателей. Предлагаем читателям самим оценить это и попытаться угадать автора, которого мы загадали. Текст ниже написан ChatGPT в ответ на просьбу написать текст про Марс в стиле одного писателя. Ваша задача — угадать, кому старалась подражать нейросеть 😎
Как много мы ждем от этой жизни, но как мало мы получаем! Здесь, на этой мрачной планете, мы страдаем от бесконечных недостатков и несчастий. Но есть место, где мы можем найти истинное счастье и избавиться от наших горестей — Марс. Как благодарны мы были бы за то, чтобы улететь на эту красивую планету и начать новую жизнь, где мы можем быть свободны от земных цепей и жить в мире идеалов.
Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети
Насколько хорошо писатели XIX и первой половины XX века предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры, генеративные нейросети, 3D-кино и что-то вроде интернета на Марсе. Материал подготовлен совместно с Факультетом компьютерных наук НИУ ВШЭ.
Кратко: о чем статья?
Писатели-фантасты прошлого делали удивительно точные предсказания. Например, еще в 1835 году князь Владимир Одоевский, писатель и современник Пушкина, описал устройство, поразительно похожее на современные мессенджеры. В своем романе «4338-й год. Петербургские письма» князь упоминает «магнетические телеграфы», которые проведены между домами и позволяют разговаривать друг с другом на дальнем расстоянии. В этом же тексте описываются «газеты», напоминающие социальные сети. Кроме того, примерно в это же время Александр Бестужев-Марлинский предсказывает появление корпусной лингвистики.
Несколькими десятилетиями позже, в 1905 году, появляется роман Александра Богданова о путешествии на Марс. Жители планеты предстают высокотехнологичным обществом: у них есть 3D-кино и телевидение, синтетические ткани.
О том, когда впервые был описан искусственный интеллект, кто предвидел digital humanities (цифровые гуманитарные науки) и где в литературе XIX века описывается цифровая стилометрия, — узнаете из полного текста статьи.
Время чтения: 9 минут.
Виртуальные кладбища: можно ли создать себе цифровой памятник?
Разбираемся, что такое виртуальные кладбища — дань моде или технология будущего — и пробуем понять, как трансформируется отношение к кладбищам в новой реальности. «Системный Блокъ» выпустил о них материал в двух частях (вот первая и вторая). Суммируем здесь основные тезисы и примеры.
Кратко: о чём статья?
Виртуальные кладбища можно определить так: виртуальная локация смерти, техническая платформа (вебсайт или блог), которая может использоваться для коммуникации и преодоления горя, связанного со смертью. Они могут стать местом для поминовения усопших в цифровой среде, сохранить цифровое наследие и историю покойного. На Западе культура создания виртуальных мемориалов начала формироваться в середине 1990-х, «Виртуальный сад памяти» появился в Америке в 1994 году, когда доктор наук Линдси Маршалл исследовал газетные некрологи. В России же такие кладбища стали появляться только в 2010-х, причём стихийно. В их числе, например, «Российское виртуальное кладбище» или «Могилы знаменитостей».
Такой вариант мемориала оказался возможен сразу по нескольким причинам: от распространения информационных технологий до десакрализации кладбищ. Более того, даже на реальных, физических, надгробиях теперь иногда размещают экраны и/или QR-коды, а в Японии функционирует целое технологическое кладбище Ruriden.
Виртуальными кладбищами, впрочем, можно считать даже страницы мёртвых пользователей в социальных сетях. Уже появился отдельный термин Death Tourism (посещение различных групп смерти или страничек мертвых пользователей в интернете), а исследователи прогнозируют, что к 2070 году умерших пользователей соцсети станет больше, чем живых.
Больше информации о самом феномене виртуальных кладбищ найдёте в первой части статьи на сайте, а узнать об их самых необычных вариантах и онлайн-мемориалах можно из второй части.
Что говорит о разных частях России их нематериальное наследие?
Чтобы узнать, какое культурное наследие в разных федеральных округах России сохраняют прежде всего, мы обратились к цифровому реестру Министерства культуры. Например, на Кавказе сохраняют лечебные практики, а в Сибири — детский фольклор.
Кратко: о чём статья?
Министерство культуры РФ ведет цифровой реестр объектов нематериального культурного наследия народов России. Он включает 450 объектов, географически относимых к одному из федеральных округов. Здесь можно найти очень разные примеры народного творчества, обрядов, культурных практик и ремесел: от «Искусства игры на балалайке Антонины Ивановой из деревни Лисьи Горки» до «Обряда укладывания в колыбель у кубанских ногайцев».
Правда, представлены регионы неравномерно. Так, 47% всех внесенных в реестр образцов народной музыки и песен отнесены к Центральному и Северо-Западному федеральным округам. Из областей в первом лидируют Владимирская, Брянская и Белгородская, а во втором — Псковская и Архангельская. А вот половина всего материнского и детского фольклора, согласно реестру, сосредоточена в Сибирском ФО.
О том, чего в реестре явно не хватает и чем объясняется неравномерность данных — в полном тексте статьи.
Время чтения: 4 минуты.
Что такое генеральная совокупность и выборка?
Наша жизнь полна разных событий, и иногда на их основе нам хочется сделать определенный вывод, отыскать закономерность в происходящем. При этом важно понимать, когда можно делать выводы, основываясь на неполных данных, а когда — нет.
Кратко: о чём статья?
В начале любой работы нам нужно четко обозначить, для какого множества объектов мы хотели бы получить результаты экспериментов или исследований. То есть, что мы будем считать генеральной совокупностью нашего исследования.
Например, мы хотим изучить, какой мультфильм является самым любимым у детей до 5 лет, живущих в Москве. В таком случае, генеральная совокупность — все дети этого возраста, но опросить их всех будет как минимум затруднительно. Тогда мы сформируем выборку для исследования, а затем обобщим результаты. Но выборка должна быть репрезентативной. Для этого придётся задать вопрос о любимом мультике представителям всех «категорий» нашей генеральной совокупности в равных пропорциях: помнить про разный возраст, пол и т.д.
Подробнее о разных способах собрать репрезантивную выборку и их различиях — в полном тексте статьи на сайте.
Время чтения: 7,5 минут.
«Да что они понимают»: как младенцы учатся говорить
В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Вспоминаем архивный материал «Системного Блока» о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в семь месяцев.
Кратко: о чем статья?
Прежде чем научиться понимать значения слов, младенцам необходимо усвоить, как выделять отдельные слова из беглой речи взрослых (это также называется сегментацией речевого потока). Лингвисты выделяют два вида подсказок, на которые могут опираться младенцы, — статистические и просодические.
Статистические подсказки связаны с вероятностями сочетания слогов внутри слова и на стыке слов. Младенец улавливает, что вероятность следования одних слогов за другими более высокая, чем вероятность их сочетаний с иными слогами (например, после слога «ма» с большей вероятностью идет слог «ма», а сочетание «я-ма» возможно в меньшей степени). Он осваивает эти статистические различия и формирует представление о границах слов.
Просодические подсказки связаны с восприятием основного типа ударения в языке. Рисунки ударений в языках различаются, младенцы слышат это и таким образом могут «чувствовать» границы слов.
О том, какие слова предпочитают слушать младенцы из Германии, Англии и Франции, какие подсказки малыши начинают использовать раньше, а также как изучается речевая сегментация в России, узнаете из полного текста статьи.
Время чтения: 6 минут.
«Коктейль Молотова» массового производства: как судят за поджоги военкоматов
Дата-отдел «Системного Блока» проанализировал собранные ОВД-инфо и Медиазоной данные о поджогах административных зданий в период с февраля по декабрь 2022 и попытался установить, по каким статьям проходят известные фигуранты. Оказалось, что с октября прокуратура чаще отдавала предпочтение 205 статье, а в судебных заключениях стали появляться «обвинения в прохождении обучения терроризму». В диаграмме отражены подтвержденные случаи поджога военкоматов и других административных зданий по месяцам, за этот период их произошло около 63, из них по судебным решениям верифицировать удалось только 37.
После 24 февраля поджоги административных зданий, в частности, военкоматов, часто связывают с выражением антивоенной позиции. Объявленная в сентябре частичная мобилизация могла стать поводом для новых поджогов — теперь они происходят гораздо чаще. Возможно, это дало повод ужесточить наказание: уже 30 сентября власти в лице представителя мобилизационного управления Генштаба ВС РФ Владимира Цимлянского объявил об ужесточении наказания за поджоги военкоматов.
До 2023 года почти все обвинительные заключения для фигурантов таких дел выносились по 167 статье Уголовного кодекса и предусматривали максимальное заключение под стражу до 5 лет. Ранее юрист Павел Чиков сообщил, что с начала осени 2022 года дела о поджоге военкоматов стали квалифицироваться как «терроризм» и чаще передаваться в управление ФСБ.
31 января одному из поджигателей военкоматов впервые вынесли приговор по статье о «терроризме». Владиславу Борисенко из Нижневартовска назначили 12 лет лишения свободы. Борисенко вместе с другим жителем города забросали бутылками с зажигательной смесью нижневартовский военкомат на ул. Мира 78.
Пингвины и нейросети: что такое визуализация данных?
Зачастую данные содержат полезную информацию – от цен на «Биг Мак» в разных странах, по которым можно оценить стоимость валюты, до коррупционных схем высших должностных лиц и свидетельств военных преступлений. Поэтому существует множество способов извлечения важной информации из большого и сложно устроенного массива данных. В этом материале мы расскажем об одном из таких методов – о визуализации данных.
Кратко: о чём статья?
Выборки данных (почитать о них можно в этом посте) часто представляют из себя таблицы, где каждая строка содержит различные числовые/строковые значения и является одним конкретным наблюдением. Скажем, в выборке с данными пингвинов 344 наблюдения и 7 признаков. Это относительно немного, но сделать выводы, просто посмотрев на таблицу, уже затруднительно. Здесь поможет построение графиков. Выбор типа графика зависит от цели, которую ставит исследователь.
Впрочем, не всегда данные представляются в виде таблицы, у которой можно взять столбец и построить график. Чтобы выделить из выборки статей BBC за 2004-2005 годы темы, о которых писали журналисты, и слова, которые характеризуют каждую тему, мы можем воспользоваться облаками слов.
Отдельная история — визуализация данных в исследовании нейросетей. О ней, а также о гистограммах, ящике с усами (boxplot), динамических и интерактивных визуализациях узнаете из полной версии статьи.
Время чтения: 14 минут.
«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля
Анастасия Бонч-Осмоловская в 2012-м создала первую современную магистратуру по компьютерной лингвистике в России, а в 2016 — первый большой центр Digital Humanities. Главные проекты центра связаны с продвинутой оцифровкой наследия Льва Толстого. В интервью «Системному Блоку» она рассказала, как и зачем делалось цифровое издание 90-томника Л.Н.Толстого и что изменилось в российских Digital Humanities после 24.02.2022.
Кратко: о чём интервью?
В 2013 году, когда Анастасия Бонч-Осмоловская и её коллеги, Борис Орехов и Михаил Гронас, увлеклись Digital Humanities, они также заинтересовались форматом Digital Edition (цифрового издания). Начать работу решили с текстов Льва Толстого, и скоро стало понятно, что надо разрабатывать отдельный механизм взаимодействия пользователя с цифровым текстом, не такой, как с печатной книгой. Перед создателями издания стояло множество вопросов: какой должна быть разметка? Что должно быть размечено? Нужно ли разделить тексты на те же 90 томов, в которых они были опубликованы? Важно было продумать, как будут выглядеть небольшие, но значимые элементы интерфейса, чтобы читатель мог узнать, что такое «ЕБЖ», когда слово написано неразборчиво или изменено редактором.
Намного более сложной задачей, впрочем, стало создание «семей текстов» для «Слова Толстого». В такие «семьи» в проекте объединяются, например, варианты одного и того же текста. У них всегда есть «семейное» имя, например, в начале написано «Анна Каренина», а потом «первый вариант», «второй вариант», «третий вариант», «планы и заметки». Туда же помещаются все комментарии, которые имеют отношение к тексту. При работе с поиском по такому тексту можно обращаться только к основному варианту, а можно поставить галочку и искать с черновиками и вариантами, и, главное, можно легко переходить в «семейное» древо.
Прочитать больше подробностей о проекте и выросшем вокруг него DH центре Вышки, узнать, изменилось ли что-то в русских Digital Humanities после 24 февраля 2022 года и понять разницу между Digital Preservation и Digital Presentation можно в полном тексте интервью.
Время чтения: 18 минут.
Год войны в цифрах: жертвы, потери, разрушения, беженцы
24 февраля 2022 года Россия начала полномасштабные боевые действия в Украине. За год погибло минимум 7749 мирных граждан. Это только подтвержденные ООН потери, так что число заведомо занижено — по некоторым оценкам, в десятки раз. Например, здесь не учтены потери при многомесячном штурме Мариуполя. Но даже это минимальное число превышает общее количество пострадавших за предшествующие 8 лет конфликта.
Большинство людей (74%) погибло из-за обстрелов по территории, которая контролировалась украинской стороной. По данным ООН, в 1515 подконтрольных Украине населенных пунктов были жертвы среди гражданского населения в результате артиллерийских, авиационных и ракетных ударов. На российской стороне таких пунктов было 380.
Были разрушены 143 800 жилых зданий. Пострадали не менее 516 культурных объектов, из них 169 — религиозные памятники.
Начало войны запустило крупнейший миграционный кризис. Более 8 миллионов жителей Украины стали беженцами в Европе. 2,8 миллионов человек выехали на территорию России (при этом неизвестно, сколько из них остались в стране).
В России за год задержали 19 586 человек на акциях протеста против войны и мобилизации. 448 человек находятся под уголовным преследованием. Многие уже получили тюремные сроки от 4 до 8 лет.
Петр I как зеркало милитаризации и централизации РФ: дата-исследование СБъ
В 2022 году Россия широко отмечала 350-летие Петра I. Дата была вплетена в новостную повестку: например, Владимир Путин сопоставил боевые действия в Украине и походы Петра в Прибалтику: «Чего он полез-то туда? Возвращал. И укреплял. <...> на нашу долю тоже, значит, выпало возвращать и укреплять». Позже Путин сравнивал Азовские походы Петра и свою «спецоперацию». Рассказываем, как по-разному отмечали 350-летие Петра I российские регионы и что это может говорить об устройстве РФ.
Кратко: о чём статья?
Данные о праздновании 350-го юбилея Петра I мы получили из Портала открытых данных министерства культуры РФ. Они ведут и ежегодно публикуют реестр мероприятий в сфере культуры, в 2022 там были упомянуты десятки тысяч (!) мероприятий, связанных с именем Петра I. О каждом известны его тип (показ кино, выставка, спектакль, экскурсия и т.д.), место проведения и длительность.
Чемпионом по числу мероприятий в абсолютных цифрах довольно неожиданно оказался Татарстан, хотя исторически у этой республики сложные отношения с Петром, одним из самых жестких строителей централизованной имперской России. Например, в 2005 в Казани отказались ставить бюст Петру на пешеходной Петербургской улице.
Если же посчитать не просто число мероприятий, а нормировать его на численность населения, в лидерах окажутся Воронежская и Белгородская области. Причём Воронежская область обгоняет все другие с большим отрывом ещё и по длительности мероприятий.
Узнать, чем объясняется лидерство Воронежской области и Татарстана, а также посмотреть, какие места заняли другие регионы в разных рейтингах можно в полной версии статьи.
Время чтения: 6 минут.
❤️ Любит или не любит? Гадаем по открыткам 💔
Пройдите тест и найдите свою валентинку из коллекции «Пишу тебе»!
В базе проекта «Пишу тебе» хранится более 10000 открыток, среди которых много любовных посланий. Не оставайтесь в День влюбленных без валентинки: тест подберет вам подходящую открытку!
По дорогам Великого Шелкового пути: виртуальное путешествие по древним маршрутам
В древности не было интернета, так что люди обменивались информацией по-другому. Самая грандиозная дорога древности — Великий шелковый путь — соединяла Восток и Запад с помощью торговли и культурных связей. Благодаря японским исследователям по этим маршрутам теперь можно совершить виртуальное путешествие.
Кратко: о чём статья?
Цифровой Шелковый путь (ディジタル・シルクロード) — это международный исследовательский проект Национального института информатики Японии совместно с ЮНЕСКО, созданный в 2001 году. Его цель – создать открытый архив о Шелковом пути на базе существующих гуманитарных проектов.
Для начала участникам проекта предстояло проанализировать множество документов, книг и атласов. Затем — оцифровка методом оптического распознавания и публикация на сайте Цифрового архива редких книг, решение проблем с топонимами на разных языках с помощью многоязычного программного обеспечения MASS и продолжение работы.
Сегодня на карте Шелкового пути можно найти важные точки пути и посмотреть, существуют ли они сейчас. Например, увидеть высохшее озеро Лоб-Нор, на месте которого раньше находился оазис, важнейший населенный пункт южного отрезка Шелкового пути. Сейчас его уже не существует, озеро засыпано песком.
О других проблемах, с которыми столкнулись создатели карты, способах поиска мест, интересных разделах проекта и похожих сайтах со своими базами данных узнаете из полной версии статьи.
Время чтения: 8 минут.
С приветом из Англии: у мультиязычных языковых моделей обнаружился «английский акцент»
Если вы выучили иностранный язык во взрослом возрасте, вполне вероятно, вы говорите не нем не так же бегло, как носитель языка. Оказывается, подобная проблема встречается и у мультиязычных моделей: если в обучающей выборке для них преобладает английский, текст на других языках они будут генерировать «с английским акцентом». Объясняем, почему так происходит и что можно с этим сделать.
Кратко: о чём статья?
BERT — система машинного обучения с открытым исходным кодом для обработки естественного языка (NLP). В одной из статей «Системный Блокъ» уже рассказывал о ее особенностях. Для её качественного обучения необходим большой корпус текстов. Если собрать его не удаётся, обучение становится проблематичным. Но если при обучении модели использовать не только тексты на малоресурсном языке, но и тексты на распространенных языках (например, английском и/или французском), то качество будет выше, чем у аналога, обученного на одном языке.
В эксперименте, который разбирается в статье, исследователи анализировали корпус, в котором преобладал английский язык. Также в нем присутствовали греческий и испанский. И в греческом, и в испанском один и тот же смысл можно выразить двумя разными грамматическими структурами, одна из которых похожа на структуру, характерную для английского языка, а другая присутствует только в этом языке и отлична от английской. Оказалось, что модели предпочтут «английскую» конструкцию, даже если она не совсем благозвучна.
Подробности о том, как учёные обнаружили акцент и как его исправить, можно прочитать в полном тексте статьи. Там же найдёте примеры предложений о флаге революции и исторических работах.
Время чтения: 7 минут.
26 января 2023 года Генпрокуратура РФ объявила издание «Медуза»* нежелательной организацией. Этот статус гораздо хуже «иноагента»: теперь лайки, репосты, распространение материалов «Медузы», а также её финансовая поддержка становятся наказуемыми для читателей. Это заставит многих отказаться от распространения материалов «Медузы» под страхом административного штрафа или уголовного дела.
«Системный Блокъ» расценивает признание «Медузы» нежелательной как акт цензуры, как попытку подавить и заглушить одно из самых популярных независимых русскоязычных СМИ. Мы выражаем солидарность и поддержку нашим коллегам. В знак этого редакция делится ссылками на любимые материалы «Медузы»:
🔹 История символа «Z»
🔸 Работа ЦБ после нападения на Украину
🔹 «Медуза», проанализировав многочисленные речи Владимира Путина, определила его любимую фразу
🔸Расследование о вбросах на выборах осени 2021 года. При помощи ИИ, который проанализировал более миллиона часов видео с 9 тысяч участков. Судя по нарушениям, которые удалось установить «Медузе», тогда вбросили около 17 млн голосов.
🔹 Как Минцифры случайно рассекретило масштабы эпидемии ковида в России, а «Медуза» вместе с «Холодом» и «Медиазоной» выяснили, что заболевших могло быть в пять раз больше…
🔸 И как Кремль ничего не понял из расследования о ковиде.
Также мы рекомендуем подписаться на почтовые рассылки дружественных «Медузе» проектов, «Сигнал» и KIT, и на ежедневный подкаст «Что случилось».
*признана в РФ иноагентом и нежелательной организацией
Расизм, смерть и роботы: как расовая нетерпимость отражается на машинах
Расовая нетерпимость распространяется не только на людей: большинство роботов — белого или серебристого цвета. Более того, если ввести в поисковую строку браузера слово «робот», на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно – мы писали о нём в феврале два года назад и предлагаем вернуться к этому материалу.
Кратко: о чём статья?
Чтобы выяснить, приписывает ли человек расу роботам и как он относятся к роботам разных «рас», исследователи из Новой Зеландии провели эксперимент, используя новую версию теста shooter bias («предвзятость стрелка»). В эксперименте участовали 192 американца разного возраста и пола, им показывали фотографии белокожих и темнокожих людей, а также антропоморфных роботов телесных цветов, в руках у которых могло быть оружие или любой безобидный предмет. Цель участника эксперимента — «стрелять» в людей/роботов с оружием и пропускать безоружных.
Выяснилось, что люди быстрее «выстреливают» в вооруженного темнокожего (и человека, и робота), чем в вооруженного белого, и быстрее «пропускают» безоружного белого, чем безоружного темнокожего. Исследование показало, что человек не только способен приписать роботу категорию расы, но и воспринимать его почти как человека этой расы.
Однако был проведен второй эксперимент, результаты которого уже не так печальны. Подробнее о нём узнаете из полной версии статьи.
Время чтения: 5 минут.
«Всех благ вам земных и небесных»: подборка открыток из корреспонденции духовных лиц
Закрытая жизнь святых обителей всегда представлялась чем-то таинственным и малоизвестным. Один из проводников в повседневную жизнь служителей церкви — частная переписка. Команда «Пишу тебе» собрала открытки, которые получали и отправляли представители православного духовенства и монахини в начале XX века. Делимся здесь двумя текстами из подборки.
🧐 Проспорил
«13/VIII 1909 г. Дружок Володя! Ванька проспорил: молебен у нас будет 17го. Передай поклон Андрюшке. Твое письмо опять {не} застало меня дома. Мишка Дмитровский перешел в 5ый класс. Пиши еще, если успеешь. Мой двоюродный братишка поступил в первый класс во 2ю гимназию. Пиши. Твой Боря».
🙏 Желаем тебе повышения сана монашеского
«Здравствуйте Мария Николаевна! Шлю Вам и Мамаше Вашей привет и пожелание всего хорошего. Из Москвы мы возвратились 19го Ноября а 10го дек. меня Влад. рукоположил во Иеромонаха. Это мое желание. Писать много не имею времени. С совершенным почтением к Вам Иеромонах Авр. 11-го дек. 1917 года».
Прочитать больше о том, чего желают, с чем поздравляют и кому передают поклон другие авторы открыток, а заодно познакомиться с комментариями волонтёров «Пишу тебе» можно благодаря полному тексту подборки на сайте.
«Системный Блокъ»: лучшее за 2022 год
В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка новых открыток, свежие интервью, тесты и инфографики, а также подборка лучших постов за весь год. Но самое главное в тяжелом 2022-м — это наша поддержка друг друга. Лучи этой поддержки мы шлем читателям и в новый 2023 год!
Кратко: какие итоги?
📝 «Пишу тебе»: к декабрю 2022 года расшифровали и опубликовали уже 12 914 открыток. Мы не планируем останавливаться и к концу 2023 надеемся собрать коллекцию в 50 тысяч!
📈 Дата-отдел: у нас появился отдел, который изучает открытые данные и делает классные инфографики. Благодаря ним мы узнали кто едет в Россию, а кто — из России, а также много неожиданного об исскусстве, например, о кино и музеях.
📕Глоссарий: собрали множество статей для новичков в digital humanities и машинном обучении. Объяснили, что скрывается за ночевидными терминами, включая кластеризацию и глубинное обучение.
🎙Интервью: выпустили 6 больших интервью, поговорили про исследования раннего интернета, искусственный интеллект и многое другое.
☑️ Тесты: выпустили 3 новых теста — о лингвистической интуиции, русской классике глазами нейросети и китайском Большом Брате.
🎓 Летняя школа: посетили и поделились опытом!
🏆 Лучший пост: самым популярным материалом года стало расследование о том, что происходит с наймом в силовых структурах после 24 февраля.
Ещё больше итогов — в статье на сайте.
«Персоналистские диктатуры чаще начинают войны»: Эрика Франтц об автократиях и поводах для оптимизма
Системный Блокъ поговорил с политологом Эрикой Франтц (профессором Michigan State University, специалисткой по авторитарным режимам и автором многочисленных академических работ по политологии) о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: шансы есть.
Кратко: о чём интервью?
Существуют различные виды диктатур, путинская Россия — персоналистская диктатура, т. е. такая, где власть сосредоточена в руках диктатора (Путина), а своих ближайших сторонников он подбирает на основе личной лояльности. Персоналистским диктаторам нужна поддержка малой группы людей — селектората, и пока этот селекторат доволен — лидер остаётся у власти.
Персоналистские автократии несут ответственность за большую часть агрессии стран на международной арене, они в принципе склонны к воинственному поведению, потому что не существует людей или организаций, которые могут их сдержать, так как лидеры заглушают голоса тех, кто может бросить им вызов.
После ухода персоналистского диктатора тем или иным образом можно ожидать разного развития событий. Однако шансы на демократизацию в стране довольно малы. Примерно в половине случаев когда рушится одна диктатура, на её месте возникает другая. Многое будет зависеть и от условий — чем более насильственным будет уход диктатора, тем хуже перспективы для демократии.
О том, каков «обычный» диктатор и его окружение, так ли эффективны санкции в случае диктатур и какова роль обычных граждан при смене режима, можете прочитать в нашем интервью.
Время чтения: 14 минут.
Милан или Тегеран: где отдыхали россияне в 2022 году
Россияне летают за границу, несмотря на санкции и ограниченное авиасообщение. Помимо привычных и всегда популярных стран, в 2022 году прибавились и новые туристические направления.
Кратко: о чём статья?
В 2022 году в разгар туристического сезона (июль, август, сентябрь) самыми часто посещаемыми странами стали: Турция, ОАЭ и Египет. Еще три года назад ситуация была иной: помимо Турции, россияне чаще всего посещали Грецию, Испанию, Италию и Тунис.
Посещение шенгенских стран в туристический сезон упало на 99,6%, по сравнению с 2019 годом — даже несмотря на то, что сейчас все еще есть возможность получить шенгенскую визу, а курс евро упал до показателей 2017 года.
Туристическим открытием года можно считать Иран и Ирак: увеличение турпотока на 421% и 100%.
Узнать больше о причинах популярности этих направлений и посмотреть, насколько популярнее для туризма стали страны СНГ, можно в полной версии статьи на сайте.
Время чтения: 3,5 минуты.