10846
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: sysblok.ru/join
Скриптор умер, да здравствует автор!
Какие тексты нравятся нам больше — человеческие и нейросетевые? Так ли хорошо модели научились нас имитировать? И так ли хорошо мы распознаем эту имитацию? Разбираемся в новом тексте нашего блогера Дмитрия Пронина.
🤖 Зачем автору ИИ?
Искусственный интеллект, а в первую очередь большие языковые модели, вошли в нашу жизнь очень стремительно. Всего за пару лет они заметно изменили то, как мы работаем с информацией, решаем задачи, общаемся с миром. Для многих людей ИИ уже стал таким же естественным рабочим инструментом, как почта или текстовый редактор.
Даже в творческой работе языковые модели действительно могут помочь. Когда мы пишем, первые 10–15% времени работы — это выплеск мыслей, поток сознания, сырой материал. Остальные 85% — борьба с несовершенством: переписывание, шлифовка, структурирование.
Если отдать этот первичный поток ИИ и попросить его переформулировать, можно сэкономить часы и получить аккуратный, выразительный текст, который при этом весьма точно передает вашу мысль. Машина «переводит» внутренний хаос на ясный, удобоваримый язык.
Но у эффективности нейросетей есть и обратная сторона: весь текст выше этой строки написан при помощи ИИ по такой схеме: поток сознания → машинная редактура → редактура нашего блогера.
🙏 Пожалуйста, не переключайтесь
Что вы почувствовали, читая текст выше? С большой долей вероятности вы долго были уверены, что все выше человеческое, авторское. И в каком-то смысле это так: ИИ лишь привел в порядок мысли. Но стоит узнать правду — и текст мгновенно обесценивается.
👾 Почему так происходит?
В знакомых всем шаблонных риторических конструкциях, словно неосознанно выдернутых из учебника, легко чувствуется ИИ. Тройные риторические повторы (триколоны) в каждом втором предложении. Конструкции вроде «Это не просто X. Это Y», обязательный маленький вывод после каждого абзаца, нумерованные списки, длинные тире, которые стали мемом. Всё это напоминает сочинение на школьном экзамене, написанное так, чтобы идеально соответствовать критериям оценки, а не чтобы что-то выразить и донести до читателя.
Нежелание читать такие тексты — своеобразный бунт против цифровой унитарности и утилитарности. То же самое происходит и в других сферах. В мире технологий конвейерной еды, неожиданно расцветают фермерские продукты, ремесленные сыры и хлеб, приготовленный вручную. На фоне быстрой моды, где вещи живут один сезон, растет интерес к ретрогардеробу: плотная шерсть, добротный деним, кожа, выкройки прошлого века.
Вероятно, с текстом скоро произойдет то же самое. Но подробнее об этом вы узнаете уже из полного текста блога.
🤖 «Системный Блокъ» @sysblok
Ресурсы для цифровых стиховедов: поэтические корпуса
Сегодня двойной поэтический день рождения: 5 декабря с разницей в 17 лет родились два выдающихся русских поэта — сначала Фёдор Тютчев в 1803 году, а затем Афанасий Фет в 1820-м. В связи с такой важной для поэзии датой предлагаем вспомнить, какие поэтические корпуса будут полезны тем, кто хочет отличать Фета от Тютчева исследовать поэтическое наследие — русское и не только.
Поэтический подкорпус НКРЯ
Первый в истории поэтический корпус, доступный с 2006 года, сегодня он насчитывает 101 521 текст. В стихотворениях размечены метр, строфика и другие параметры, указаны автор, дата создания и жанры. По всем этим признакам можно искать информацию и задавать подкорпус.
Башкирский поэтический корпус
Вторым поэтическим корпусом в мире стал Башкирский, созданный в октябре 2013 года Борисом Ореховым. Коллекция текстов корпуса состоит из произведений 103 башкирских поэтов XX и начала XXI века. Благодаря нему можно узнать не только о башкирском стихе, но и о башкирском языке в целом. Корпус поддерживает два вида поиска — лексический и грамматический, можно искать как само слово, так и формы по определенным грамматическим признакам.
Персидский поэтический корпус
Персидский поэтический корпус был опубликован весной 2020 года. Он содержит тексты классической персидской поэзии IX-XVII веков в объеме 4,3 млн. словоупотреблений (это 16 842 произведения или 330 723 бейта — так называется минимальная строфическая единица тюркской и персидской поэзии).
Мультиязычный корпус поэзии PoeTree
Проект PoeTree, опубликованный в 2023 году, включает более 330 000 стихотворений на десяти языках (чешский, английский, французский, немецкий, венгерский, итальянский, португальский, русский, словенский и испанский). Каждый корпус был очищен от дубликатов, снабжен морфосинтаксической разметкой в формате Universal Dependencies и снабжен метаданными. Тексты и метаднные доступны в виде унифицированных JSON-файлов.
Поэтические корпуса — это культурное достояние и важный источник, содержащий информацию о национальной поэзии и языке конкретного временного периода. Если вы использовали для своих исследований (или других целей?) эти и другие поэтические корпуса, пожалуйста, расскажите о них в комментариях!
🤖 «Системный Блокъ» @sysblok
ИИ в образовании: как преподавателю выстроить справедливые правила игры
Пока ученики не понимают отношение преподавателя к ИИ, им труднее корректировать своё поведение на занятиях. Рассказываем, как выстроить границы в использовании ИИ для тех, кто предпочел бы разрешить обращаться к нейросетям, и для тех, кто считает, что школьникам лучше от них отказаться.
Как преподавателю разрешить использование ИИ?
Создавать условия для осмысленного применения нейросетей на занятиях можно по-разному. Самый простой вариант — попросить разработать памятку… ИИ-помощника. Это не только облегчит работу, но и позволит показать осознанный подход к искусственному интеллекту на собственном примере. Так можно помочь студентам развивать насмотренность и подсказать, как взаимодействовать с чат-ботами: что говорить в хорошем промпте (не знаете? ничего, у нас есть гайд!) и чего лучше не говорить, особенно если речь идет о персональных данных.
Помимо свода правил и памяток можно рассмотреть со студентами мемы об отношении к ИИ, его основных проблемах, о стереотипах в отношении ИИ или обсудить неудачные варианты его применения.
Как преподавателю запретить использование ИИ?
Запрет на использование нейросетей хорошо бы закреплять в нормативных документах от программы учебных дисциплин до политики учебного заведения.
При этом поскольку ИИ — это огромное количество разных технологий и инструментов, важно разобраться, все ли их хочется ограничить настолько строго. Чаще всего в учебном процессе под запрет попадают генеративные технологии. Ориентиром здесь может выступить этический стандарт COPE (Code of conduct | COPE: Committee on Publication Ethics): не разрешается создание текста работы, данных, графиков с помощью нейросетей, если это не обусловлено выбранным методом. Правда, убедиться, что такой запрет соблюдается, может быть не слишком просто, ведь ИИ-детекторам полностью доверять невозможно.
Еще один способ ограничить применение нейросетей в процессе обучения — больше обсуждать с учениками угрозы, связанные с ними. Репозиторий MIT The Al Risk Repository содержит, наверное, самый полный перечень рисков. Среди них, к примеру, есть риск дезинформации. Вокруг него в сети появилось много кейсов, которые можно обсудить с учениками.
Подробности о разрешениях и запретах ИИ в образовании найдете в полной версии нашей статьи. А ещё там есть мемы!
Время чтения: 11 минут
🤖 «Системный Блокъ» @sysblok
Тест: угадай значение (ノ◕ヮ◕)ノ*:・゚✧ каомодзи
Каомодзи — это японские смайлики, созданные из букв, цифр и символов, которые передают эмоции без слов.
В отличие от привычных нам 🙂 или :( или (((((, японские каомодзи расположены горизонтально (и используются только при горизонтальном письме). Часто у них есть не только глаза и рот, но и щеки, брови, уши или даже руки. Они появились в Японии в 1980-х и быстро стали частью интернет-культуры. Сегодня каомодзи используются в сообщениях, блогах и соцсетях, чтобы выразить настроение мягче и эмоциональнее, чем текстом (@^◡^)
В новом тесте предлагаем вам угадать, какую эмоцию выражает это и другие лица:
(╬ಠ益ಠ)
А в комментариях можете рассказать, что предпочитаете вы — эмодзи (про них у нас тоже есть материал!), скобочки или каомодзи!
Пройти тест
🤖 «Системный Блокъ» @sysblok
Академическая честность в эпоху искусственного интеллекта: соавторство или мошенничество?
Можно ли школьникам и студентам обращаться к чат-ботам при написании эссе? Как оценивать такие работы? Где помощь нейросети превращается в плагиат? С развитием искусственного интеллекта традиционные представления о честности в науке и образовании пересматриваются. Рассказываем, как школы и вузы учатся регулировать использование ИИ.
А что, до нейросетей все были честными?
Нет 🙃. В 2012 году опрос 23 000 американских старшеклассников показал: 75% списывали домашнюю работу, 52% — контрольные. Среди 3600 учеников школ США 95% признались, что хотя бы раз жульничали за год. Что же касается ИИ, его используют не только с целью списать.
А с какой?
Исследователи Стэнфордского университета выяснили, что 54-58% учеников считают допустимым использовать ИИ для мозгового штурма, поиска темы проектов и структурирования мыслей. 48-64% опрошенных против использования ИИ для написания фрагментов работы и редактуры готового текста. 86-95% учащихся высказались против автоматического создания всей работы.
Со школьниками ясно, что там у студентов?
Согласно совместному докладу «Яндекс Образования» и НИУ ВШЭ почти половина студентов (49%) уже использует ИИ; 47% процентов студентов отмечают, что нейросети помогают им в учебе; а 54% преподавателей считают, что умение пользоваться генеративными технологиями дает студентам карьерное преимущество.
Ведущие вузы делают ставку на обучение ИИ-грамотности, а не на борьбу со списыванием. Например, Оксфорд и Мичиганский университет создают открытые курсы и хабы, где объясняют, как работает ИИ, каковы его ограничения и этические риски.
Подробнее о практических и этических аспектах использования нейросетей в образовании узнаете из полной версии нашего материала.
А своим мнением по этому поводу можете делиться в комментариях 😎
🤖 «Системный Блокъ» @sysblok
«Системный Блокъ» объявляет предновогодний набор участников!
«Системный Блокъ» расширяется и приглашает новых авторов, редакторов, менеджеров, дата-аналитиков, разработчиков. Если вы давно хотели к нам присоединиться и не знали, как, — сейчас самое время!
Мы — волонтерское издание. В нашей команде люди из совершенно разных сфер: филологи, программисты, менеджеры, историки, журналисты и аналитики. Нас объединяет интерес к науке и технологиям, а также желание вдохновлять людей интересными материалами, исследованиями, новостями, тестами.
Как вы поняли, нам не хватает только вас.
Ниже вы найдете набор ролей, которые могут быть интересны вам или вашим друзьям. Если что-то из этого вам близко, добро пожаловать к нам! Если вы хотите присоединиться, но идеальной роли нет, то все равно оставляйте заявку.
1. Авторы в рубрики NLP, «Филология», «Образование», «Биоинформатика», «Востоковедение»
2. Кураторы рубрик NLP, «Лингвистика» и «Филология»
3. Редакторы текстов
4. SMM-Lead / Менеджер отдела SMM
5. Контент-менеджер Telegram-канала
6. Выпускающий редактор сайта
7. Куратор рубрики «Интервью» / Менеджер интервью
8. PR-менеджер
9. HR-менеджер
10. Иллюстраторы и менеджер иллюстраторов
11. Редактор ИИ-портала
12. Авторы-энтузиасты нейросетей
13. Менеджер направления в дата-отделе
14. Автор-исследователь в дата-отдел
15. SEO-специалист на сайт
16. Аналитик на сайт
17. Продакт-менеджер сайта
18. UX-дизайнер сайта
19. Менеджер портала про цифровое образование
20. Разработчик WordPress на сайт
21. Разработчик Next.js (React)
22. Разработчик n8n
23. Разработчик Apps Script
Полное описание задач и пожеланий к участникам смотрите в этом документе.
Если вас заинтересовала одна из ролей – приглашаем заполнить форму до 29 ноября. Проект полностью волонтерский, мы не платим денег. Зато у нас человечный менеджмент, отлаженные процессы и хорошая репутация в русском научпоп-сообществе. Присоединяйтесь!
🤖 «Системный Блокъ» @sysblok
ИИ-поисковик: как пользоваться Perplexity
В новом гайде объясняем, как зарегистрироваться в Perplexity и начать использовать эту нейросеть для повседневных задач и работы с научными источниками.
Что за Perplexity?
Perplexity AI — это поисковая система на основе искусственного интеллекта (ИИ). Использовать ее можно для как для обычных, так и для учебных или исследовательских задач.
Как её использовать?
Если вы хотите спросить нейросеть о чем-то повседневном (например, порекомендовать вам фильм), советуем режим быстрого поиска.
А для более сложных вопросов, связанных с исследованиями, лучше активировать режим глубокого поиска. В этом режиме нейросеть формирует ответ дольше, но с большей точностью.
Можно еще и установить дополнительный фокус — настроить Perplexity на поиск только по академическим источникам и дополнительно изучить ссылки на них.
Больше информации о возможностях нейросети и примеры запросов найдете в гайде на сайте.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
🤖 «Системный Блокъ» @sysblok
Криминалистическая биоинформатика: как растения помогают детективам
Вы хорошо знаете, как убийц находят по их ДНК и отпечаткам пальцев, а ещё наверняка помните, что Шерлок Холмс мог легко различать образца разных почв. Не меньше расследователям могут рассказать ДНК растений или животным. В новой статье объясняем, как методы генетики помогают уголовному розыску.
🪵 Деревья-улики и травы-свидетели
Первое преступление, раскрытое с помощью анализа нечеловеческой ДНК, произошло в 1993 году в Аризоне. Преступника обличило дерево, под которым нашли жертву. Его ствол был поврежден столкновением с грузовиком, а в кузове машины подозреваемого следователи нашли плоды такого же дерева, паркинсонии.
Еще одно растение, которое выступало в суде в качестве свидетеля — птичий горец Polygonum aviculare, известный также как… трава-мурава. Убийца увез тело жертвы подальше от дома и сбросил его в ручей. На берегу рос горец, и его семена прилипли к шинам автомобиля, где их и нашли криминалисты.
Растения-потерпевшие
Анализ ДНК помогает и в тех случаях, когда жертвой оказались сами растения или животные. Оставленные на вырубке пни могут стать решающими в расследовании браконьерства: если найдутся срубленные деревья, их можно сопоставить с пнями по ДНК. Так удалось доказать вину нарушителей, уничтоживших клены в национальном парке Олимпик (Вашингтон, США), и защитить от нелегальной рубки кипарисовики на Тайване.
Иногда идентифицировать дерево можно и без ДНК: например, если удалось перехватить необработанные бревна, можно сличить спилы; но ДНК-фингерпринтинг позволяет опознать даже доски и опилки.
🌳 Перспективы расследований исследований
Индивидуальные ДНК-паттерны растений помогают искать не только убийц и браконьеров. Например, с их помощью также можно проверить сорт оливок, из которого произведено масло, или определить источник наркотиков растительного происхождения. В перспективе, если человечество не задумается о защите персональных данных растений, каждая доска и каждый в поле колосок будут иметь генетический паспорт с указанием происхождения, который невозможно подделать.
Подробнее о том, как устроены исследования ДНК-растений в криминалистике, а ещё о том, как убийцу нашли с помощью кота по кличке Снежок, узнаете из полной версии статьи.
Время чтения: 14 минут
🤖 «Системный Блокъ» @sysblok
Litmaps и Connected Papers: как нейросети помогают искать научные статьи
Современные исследователи часто сталкиваются с проблемой поиска релевантных источников. Разбираем, как нейросети могут помочь в решении этой задачи:
📎 Litmaps
— Находит статьи, связанные с вашей темой по цитированиям и ссылкам;
— Показывает самых цитируемых авторов в выбранной области;
— В платной версии есть синхронизация с Zotero, в бесплатной — поиск по DOI, названию и другим идентификаторам;
— Функция Visualize строит графики связей между работами;
— Поддерживает ручной импорт статей.
🖇️ Connected Papers
— Определяет статьи-«предшественники» и «преемники» по теме исследования;
— Есть возможность загрузки датасета.
Этот материал — часть нашего спецпроекта «ИИ-лайфхаки для вашей профессии». Подробнее о других задачах читайте в разделе «ИИ для исследователей».
Какими инструментами для поиска статей пользуетесь вы? Делитесь в комментариях.
🤖 «Системный Блокъ» @sysblok
Российские кинофестивали в девяти карточках: что (не) изменилось после 2022
Правда ли, что западные кинорежиссеры массово бойкотируют Россию? Действительно ли на российских международных смотрах больше не показывают фильмы из США и Британии? Кто ушел совсем, а кто — только на время? Ответы на эти и другие вопросы ищите в карточках, а подробности и комментарии экспертов — в нашем материале. «Системный Блокъ» изучил, как изменилась география участников нескольких российских кинофестивалей после февраля 2022 года.
🤖 «Системный Блокъ» @sysblok
Браузер от OpenAI, DeepSeek предлагает заменить текст картинками
Рассказываем, что произошло в мире ИИ за последнее время.
Браузер от OpenAI
Компания OpenAI представила браузер ChatGPT Atlas со встроенными ИИ-функциями.
Во время посещения веб-сайтов пользователь может задавать вопросы ChatGPT, который будет использовать содержимое страницы как контекст. Например, находясь на сайте отеля, у чат-бота можно узнать о ближайших достопримечательностях. Модель также способна автономно выполнять задачи вроде сборки заказа по предоставленному списку или заполнения таблиц.
Ещё одна функция — умный поиск по истории браузера. В целях безопасности агенту запрещено скачивать файлы и исполнять код. На определённых сайтах при выполнении задач систем будет требовать ручного подтверждения потенциально опасных действий — например, денежных переводов. Кроме того, пользователь может вручную запретить ChatGPT доступ к выбранным страницам.
ChatGPT Atlas доступен для пользователей Mac. Количество запросов зависит от типа подписки.
Почему это важно?
Многие компании разрабатывают продукты для автоматизации поиска и выполнения задач в интернете. Google встроила языковую модель Gemini в браузер Chrome, Perplexity выпустила ИИ-браузер Comet.
Высокий интерес к этой области объясняется тем, что люди решают огромное количество задач онлайн. Получая доступ к информации о посещаемых сайтах и действиях на них, компании лучше понимают потребности и интересы пользователей. Это открывает возможности как для улучшения продуктов, так и для монетизации.
Например, ChatGPT потенциально сможет встраивать релевантную рекламу в ответы, основываясь на контексте просматриваемой страницы. Компании также могут собирать историю взаимодействия с различными сайтами для обучения своих агентов.
Почему это важно?
Исследователи уже давно пытаются заменить процесс разбиения текста на символьные токены более универсальными и надежными способами. Решение этой задачи поможет повысить качество работы LLM не в одной конкретной области, а во всех сразу, поскольку языковые модели оперируют токенами как фундаментальными строительными блоками.
Методы, позволяющие более компактно представлять текст, особенно актуальны для эффективной работы с длинными документами. Способность обрабатывать объемные тексты необходима для применения LLM в задачах анализа больших массивов данных — например, архивных материалов или кодовых баз. Кроме того, это важно для разработки ИИ-агентов, которые на каждом промежуточном шаге выполнения задачи генерируют развернутые рассуждения.
Шерлок Холмс XXI века: как цифровые технологии меняют криминалистику
Сегодня метаданные, Google Maps и нейросети могут помочь раскрыть реальные преступления. Причем делать это теперь могут не только эксперты, но и пользователи соцсетей. Рассказываем об интернет-ищейках и их методах подробнее в новой статье.
🕵🏻♂️ Кто этим занимается?
Интернет-ищейки (internet sleuths) — это сообщества энтузиастов, которые используют цифровые инструменты для расследования преступлений, поиска пропавших людей и разоблачения мошенников.
В Китае этот феномен известен под интригующим названием «поиск человеческой плоти» (human flesh search engine), когда тысячи пользователей скоординировано ищут информацию о человеке через соцсети и блоги. А крупнейшее англоязычное сообщество интернет-ищеек — форум Websleuths — было создано ещё в 1999 году для обсуждения нераскрытых дел. Сегодня у него больше 240 тысяч пользователей.
🌎 Какими технологиями они пользуются?
Одни из самых популярных сервисов среди онлайн-сыщиков — Google Maps и Google Earth. Google Maps предлагает интерактивные карты и панорамы Street View, а Google Earth — детальные спутниковые снимки с возможностью анализировать изменения местности за разные годы. Чем они могут быть полезны? Например, на одном из снимков в Google Street View обнаружили мужчину, укладывающего в багажник нечто, завернутое в пакеты. Позже в таких же пакетах нашли тело пропавшего на кладбище неподалеку.
🗂️ Может, что-то ещё?
Метаданные! Например, дата и время создания файла, автор, геолокация и т.д. Сами по себе они не являются технологией, но часто именно геотеггинг становится одной из важнейших зацепок в расследовании. Яркий пример — дело Габи Петито, в котором интернет-сыщики и полиция опирались на данные социальных сетей. Когда её жених вернулся из путешествия один, пользователи обратили внимание на видео и снимки Габи из соцсетей. Они включали геотеги, даты создания, технические параметры устройств.
Интернет-ищейки проверяли алиби жениха по временным меткам и искали свидетелей. Спойлер: на видео одной женщины, которая была в парке тогда же, как раз нашёлся фургон Габи и её жениха, а затем поблизости нашлось и тело пропавшей.
🤖 А как же нейросети?
Распознавание лиц с помощью нейросетей тоже может пригодиться. Благодаря ним журналист-раследователь Майкл Колборн обнаружил на фото 65-летнюю Даниэлу Клетте, которая когда-то состояла в террористической организации «Фракция Красной Армии» (RAF). В феврале 2024 года немецкие власти её арестовали.
Ещё об одной технологии, веб-скрейпинге, узнаете из полной версии статьи. Именно веб-скрейпинг, кстати, оказался особенно важен при расследовании захвата Капитолия в 2021 году, когда погибли пять человек, были ранены десятки полицейских, а также разграблено Национальное законодательное собрание Америки.
Время чтения: 20 минут
🤖 «Системный Блокъ» @sysblok
ChatGPT разрешит взрослым пользователям генерировать эротический контент 🔞
О планах разрешить генерацию эротики заявил генеральный директор OpenAI Сэм Альтман в сети X. По его словам, это станет частью реализации принципа «обращаться со взрослыми как со взрослыми», который ляжет в основу новой политики компании. В декабре 2025 OpenAI планирует внедрить систему возрастной верификации, что даст пользователям старше 18 лет расширенные возможности.
Однако пока компания не раскрывает подробностей о том, как будет проверять возраст или обеспечивать конфиденциальность и безопасность контента 18+. Тем не менее в сентябре OpenAI запустила систему автоматической идентификации: она ограничивает материалы для пользователей младше 18 лет.
Альтман анонсировал и другие изменения: так, в ChatGPT можно будет настраивать личность ИИ-помощника, делая его более человечным и дружелюбным.
Почему это важно?
С одной стороны, за этим решением стоит коммерческая логика. Несмотря на то, что OpenAI стала самой дорогой частной (т.е. акции которой не торгуются на фондовой бирже) компанией в мире, она все еще не показывает стабильную прибыль. Разрешение на генерацию взрослого контента позволит расширить аудиторию и увеличить доходы за счет роста подписок.
С другой стороны, это ответ на потребности пользователей. Все больше людей обращаются к нейросетям как к собеседникам. Согласно британским и американским исследованиям, каждый пятый респондент использовал их как романтических партнеров.
Однако общение с ChatGPT в роли сексуального партнера создает несколько серьезных рисков.
Во-первых, такой формат усилит психологическую привязанность пользователей к сервису и повысит их доверие к боту. Это может привести к тому, что люди начнут делиться с компанией все более чувствительными личными данными.
Во-вторых, существует опасность злоупотребления технологией. OpenAI потенциально может разрешить генерацию визуального эротического контента. Используя такие генерации как основу, злоумышленники смогут создавать реалистичные дипфейки с лицами реальных людей. Уровень реалистичности современных ИИ-видео и изображений уже достаточен для того, чтобы использовать их в целях мошенничества, шантажа и травли.
И, наконец, общение с ботом, обученным на согласие и поддержку, принципиально отличается от общения с реальными людьми — оно проще и менее многогранно. Это создает риск, что многие люди будут предпочитать «комфортное» общение с ИИ реальным отношениям. В результате число изолированных и социально дезадаптированных людей может увеличиться.
Как написать хороший промпт
Если нейросети дают слишком общие ответы, часто можно переформулировать сам вопрос — промпт, который вы им задаете. Даем три варианта инструкций, которые сделают коммуникацию с ИИ конструктивнее.
1️⃣Будьте конкретны
Чем больше деталей вы предоставите (цель и задачи, стиль, объем и т. д.), тем точнее окажется выдача (ответ) нейросети. Например, если вы хотите придумать пост для вашего личного блога, то промпт «Напиши пост про отпуск» будет не слишком полезен. А вот другой пример:
Ты — SMM-менеджер канала в Telegram.
Напиши короткий (80-90 слов) пост для канала о поездке в горы на выходные. Канал посвящен туризму. Целевая аудитория канала: мужчины и женщины 30-35 лет, которые ценят активный отдых и ищут идеи для запоминающихся путешествий.
Цель поста — вовлечь подписчиков в обсуждение (реакции, комментарии о своем опыте). Пост должен быть написан через личную перспективу, через первое лицо. Сделай акцент на эмоции от единения с природой и адреналин. Используй подходящие к теме хэштеги.
Ты — репетитор по математике. Нужно, чтобы ты объяснил решение задачи о пересекающихся множествах для ученика 8-9 класса, который только начинает изучать эту тему.
Задача звучит так: в классе 30 учеников, 16 занимаются программированием, 15 — дизайном, а 10 — и тем, и другим. Нужно найти, сколько человек ничем не занимаются.
Цель — не просто дать ответ, а подробно разобрать решение шаг за шагом, чтобы ученик понял принцип работы с пересекающимися множествами. Распиши решение поэтапно, с комментариями к каждому действию.
Объясняй простым и понятным языком, без излишней формальности, но с точными математическими формулировками. Представь ответ в виде связного объяснения, как если бы ты разговаривал с учеником у доски.
UNESCO открыла виртуальный музей украденных культурных объектов
29 сентября на конференции MONDIACULT 2025 в Барселоне ЮНЕСКО представила Виртуальный музей украденных культурных объектов. Работа над этим проектом велась с июня 2023 года совместно с Интерполом. В качестве спонсора выступило правительство Саудовской Аравии, а «архитектуру» виртуального музея спроектировал Франсис Кере, лауреат Притцкеровской премии.
Коллекция содержит более 250 экспонатов — это изображения и 3D-модели артефактов, которые были украдены в 46 странах по всему миру. Все они доступны для просмотра бесплатно на сайте музея — для этого можно использовать не только телефон или компьютер, но и VR-очки. Экспонаты сгруппированы по регионам: Европа и Северная Америка (96), Латинская Америка и страны Карибского бассейна (57), Африка (51), Азиатско-Тихоокеанский регион (37) и Арабские страны (36). Объекты можно также искать по цвету и назначению.
Кроме зала с утраченными артефактами в музее доступно еще одно виртуальное помещение, которое создатели назвали Return and Restitution Room. Здесь представлены объекты, которые удалось передать обратно законным владельцам. На данный момент таких всего три — посетители могут посмотреть на их модели и изображения, а также узнать, что было сделано для их возвращения.
Почему это важно?
Поскольку культурные объекты напрямую связаны с историей, их утрата означает постепенное разрушение идентичности сообществ. Первый шаг к их возвращению — огласка. При помощи этого проекта организация планирует привлечь внимание к проблеме мародерства, а также незаконного оборота археологических находок, произведений искусства и других предметов, представляющих культурную ценность.
Представители ЮНЕСКО заявляют, что, в отличие от других культурных институций, их виртуальный музей будет стремиться уменьшить, а не расширить свою коллекцию: если какой-либо из экспонатов удастся найти и вернуть, его уберут из экспозиции.
Что такое фреймбанки и зачем экономистам лингвистика
Как предсказать рыночную стоимость компаний? Зачем собирать значения слов в базы данных? Что делает завтрак завтраком? И… как эти вопросы вообще оказались в одном ряду? Разбираемся в новой статье.
🍳 Завтрак, обед и ужин
Начнем с завтрака: если бы вы попытались объяснить этот феномен инопланетянину или человеку совсем другой культуры, вам неизбежно пришлось рассказать бы про систему из трех приемов пищи, где завтрак — первый. В лингвистическом смысле этот контекст создает рамку, или фрейм, что и делает завтрак завтраком, а ответы на вопросы когда, с кем и зачем мы его едим могут отличаться. Такие контексты и изучает фреймовая семантика, благодаря которой можно исследовать, как устроены значения слов в естественном языке.
🗂️ FrameNet и FrameBank
Чтобы изучать фреймы системнее и эффективнее, лингвисты создали фреймбанки, базы данных фреймов. Самые известные — FrameNet для английского языка и FrameBank — для русского. Они показывают, какие элементы скрыты внутри значения слов и фраз: кто действует, что происходит, где, когда и каким образом.
💸 Экономическое применение
Если пока всё звучало довольно абстрактно, рассказываем про конкретные примеры использования фреймбанков.
В 2013 году американские исследователи собрали корпус новостей о крупных компаниях с 2007 по 2012 год, на которые пришлись и период экономического упадка (2007–2010), и экономического роста (2011–2012). Новости собирались о компаниях из сферы телекоммуникаций, IT и товаров первой необходимости.
С помощью алгоритма исследователи выделяли роли компаний во фреймах («кто судится», «кто заявляет», «кто нарушает права») и по этим ролям пытались предсказать движение стоимости акций. Спойлер: у них вполне получилось предсказать, станет цена выше или ниже, но сам факт её изменения алгоритм предвидел не всегда.
Подробнее об этом исследовании, упомянутых базах данных и фреймах, можете узнать из полной версии статьи.
Время чтения: 14 минут
🤖 «Системный Блокъ» @sysblok
Gemini 3, новый DeepSeek, SAM 3
Рассказываем, что произошло в мире ИИ за последнее время
Google Gemini 3
Корпорация Google обновила свою большую языковую модель Gemini. Пока доступна только флагманская версия Gemini 3 Pro, более компактные и быстрые варианты появятся позже.
Практически во всех стандартных тестах Gemini 3 превосходит лидирующие LLM OpenAI GPT-5.1 и Anthropic Opus 4.5 или сопоставима с ними. Главное в обновлении — улучшение агентских способностей: модель эффективнее применяет режим рассуждений (thinking/reasoning) и внешние инструменты, такие как поиск Google и среда выполнения кода. Также значительно выросло качество генерации кода, особенно для задач front-end, которые нужны для разработки интерфейсов сайтов и приложений.
Попробовать Gemini 3 можно бесплатно в Google AI Studio.
Почему это важно?
Gemini используется практически во всех ИИ-продуктах Google: от перевода видео на YouTube до генерации сводок поисковой выдачи. Поэтому обновление затронет миллионы пользователей.
Кроме того, благодаря финансовым и интеллектуальным ресурсам Google является ключевым участником гонки ИИ. По её флагманской модели можно судить о прогрессе генеративного ИИ в целом.
Почему это важно?
Разработка и обучение больших языковых моделей требуют значительных финансовых вложений. Лидирующие модели создаются корпорациями и доступны только по API, что даёт пользователю лишь минимальный контроль над ними.
Традиционно открытые модели (которые можно запустить на собственном сервере или компьютере) существенно отстают от закрытых. Модели DeepSeek уже неоднократно сокращали этот разрыв.
Выход DeepSeek v3.2 означает, что теперь любой желающий может без ограничений использовать и модифицировать LLM, сопоставимую по производительности с лучшими решениями.
Почему это важно?
Модели линейки SAM универсальны — они позволяют выделять произвольные объекты на самых разных изображениях и видео. Поэтому их можно применять в разных областях: обработка фото и видео, робототехника, AR/VR.
Meta уже внедряет модели в свои продукты. SAM 3 используется в приложении Edits для создания видеоэффектов, а SAM 3D обеспечивает работу функции «Просмотр в комнате» на Facebook Marketplace, позволяя покупателям визуализировать мебель в своём интерьере перед покупкой.
Голос(а) автора: может ли один человек писать как несколько?
В этот день 45 лет назад ушел из жизни удивительный французский писатель Ромен Гари — единственный человек, которому удалось дважды получить престижную Гонкуровскую премию. Дело в том, что премия даётся один раз в жизни. Гари смог обойти это правило благодаря мистификации. Сегодня эту мистификацию исследуют с помощью количественных методов определения авторства (стилометрии). Перечитываем наш материал о том, как авторы создают «писательские субличности».
Кратко: о чем статья?
Одна из основных задач стилометрии в цифровой филологии — атрибуция, определение авторства. Обычно формальности вроде псевдонима не влияют на результат, но что, если писатель создалсубличность с собственными биографией и характером?
В 1956 году как Ромен Гари получил Гонкуровскую премию под своим именем, а в 1975 году — под псевдонимом Эмиль Ажар.
При этом автор и его «субличность» творили в одном жанре, а Гари продолжал печататься под своим именем одновременно с развитием писательской карьеры Ажара.
Разумеется, мы решили проверить, что скажут цифровые методы и провели эксперимент с Delta (подробнее о Дельте Бёрроуза можно узнать, например, здесь). И в ходе него программа, определяющая авторство, восприняла Ажара как отдельного от Гари писателя, хотя один из романов, написанных под псведонимом, и был стилистически близок к текстам Ромена Гари.
О другом писателе, которому удалось обмануть стилометрию, а также о том, что такое дендрограммы, как они выглядят и что показывают исследователям, узнаете из полного текста статьи.
Время чтения: 12,5 минут
🤖 «Системный Блокъ» @sysblok
В Версале «заговорили» скульптуры
Это стало возможным благодаря приложению на базе искусственного интеллекта.
Посетители дворца теперь могут задать вопросы 20 статуям в саду — среди них Аполлон, Купидон и Сфинкс. Новое приложение, созданное на платформе Ask Mona при участии OpenAI, позволяет вести диалог на французском, английском и испанском языках. Для этого достаточно отсканировать QR-код на постаменте.
«Ответы» скульптур основаны на мифологических сюжетах и исторических источниках о Версале. Система использует данные архивов и кураторских текстов, чтобы сгенерировать правдоподобные ответы от лица героев. По словам создателей, проект помогает посетителям узнавать малоизвестные детали и по-новому воспринимать пространство сада.Таким образом Версаль делает опыт посещения более интерактивным, а значит, и запоминающимся.
Почему это важно?
Для Digital Humanities проект Версаля — пример того, как искусственный интеллект становится посредником между культурным наследием и публикой. Технология соединяет традиционную экспозицию с интерактивным рассказом и показывает, что цифровые технологии могут не только визуализировать прошлое, но и дать ему голос. В результате музей превращается в пространство диалога, где технологии углубляют восприятие объектов.
Языковые модели помогают математикам, Google поможет Apple с ИИ
Что произошло в мире ИИ за последнее время.
Нейросети помогают математикам
Команда ученых, в которую входит один из самых известных математиков современности Теренс Тао, показала, насколько большие языковые модели эффективны в поиске решений целого класса математических задач.
Перед математиками часто стоит задача найти объект с заданными свойствами. Например, при исследовании величины, принимающей бесконечное количество значений, требуется определить её верхнюю границу — значение, больше которого эта величина не может быть. Не всегда удаётся с первого раза дать точную оценку, часто находят оценку с запасом. Поэтому математики пытаются конкретизировать существующие оценки.
Кандидата на оценку можно частично проверить на компьютере, написав программу для перебора вариантов. Компьютер будет перебирать значения величины и сравнивать с предложенной оценкой — если хотя бы для одного значения неравенство не выполняется, то оценка неверна. Такой подход позволяет быстро отметать неподходящих кандидатов.
В мае 2025 года лаборатория Google DeepMind представила метод AlphaEvolve, который позволяет эффективно находить объекты с заданными свойствами с помощью LLM. В качестве объекта может выступать математическая конструкция, молекула, компьютерная программа и др. А значит, с помощью AlphaEvolve можно создавать и программы для поиска оценки величин.
AlphaEvolve использует эволюционный подход. Пользователь даёт описание задачи и объекта. На каждом шаге AlphaEvolve не ищет напрямую нужный объект, а генерирует программу, которая производит поиск. Такой метод оказался особенно эффективным, потому что позволяет компактно описывать сложные структуры и многократно улучшать результат без повторных запусков модели. На каждом следующем шаге языковая модель улучшает лучшую программу с предыдущего шага.
AlphaEvolve тестировали на 67 научных задачах из разных областей математики. Почти для всех модель нашла лучшие уже известные решения, а в некоторых задачах — предложила более оптимальные.
Почему это важно?
Многие решения, найденные AlphaEvolve, не были найдены раньше из-за отсутствия у математиков времени и сил на подбор оптимальной комбинации уже известных решений под конкретную задачу. AlphaEvolve может обнаруживать пропущенные людьми комбинации полуавтоматически. А анализ некоторых программ, созданных алгоритмом, помогает продвинуться в решении уже живым математикам. В статье также упоминается комбинирование AlphaEvolve с другими методами ИИ, которое позволяет формализовывать механизм поиска, например, выводить точную формулу.
Почему это важно?
Сделка показывает технологический разрыв в области ИИ между компаниями. Google и Microsoft раньше занялись LLM, и теперь даже огромные деньги Apple не компенсируют отставание. Партнерство с Google создаёт для Apple зависимость от конкурента.
От судебных картотек к базам данных: как цифровые архивы помогают историкам права
За что и как наказывали людей в прошлом? Как судебные архивы превращаются в базы данных, а историки — в дата-аналитиков? Чем историкам права помогают цифровые методы? На примере проекта The Old Bailey Proceedings Online рассказываем, что можно узнать из решений центрального лондонского уголовного суда за 250 лет.
🗂️ История права: от архивов к базам данных
История права всегда имела дело с большими массивами документов. Ещё до появления цифровых методов исследователи восстанавливали картину прошлого, опираясь на архивы судов или следствия.
Сегодня историки используют не только традиционные, но и цифровые методы работы с уголовными архивами. Судебные протоколы, следственные дела становятся материалами для баз данных, которые можно изучать с помощью статистического анализа (о применении количественных методов в работе с разными типами источников мы уже рассказывали в здесь). Так история права объединяется с исторической информатикой.
👨🏻⚖️ База данных суда Old Bailey: 250 лет уголовных разбирательств Лондона
Масштабный проект Института Digital Humanities Университета Шеффилда The Old Bailey Proceedings Online содержит оцифрованные дела центрального лондонского уголовного суда Old Bailey с 1674 по 1913 годы, а также данные «Вестника Ньюгейтской тюрьмы» с 1676 по 1772 годы. В архиве находятся записи о почти 198 тысячах процессов и биографические сведения о 2500 приговорённых к смертной казни.
Для погружения в мир Англии Нового времени на сайте представлены исторические справки, а для работы с материалами — подробные инструкции. Все дела сопровождаются сведениями об обвиняемых, жертвах, сути преступления и о приговоре. Данные можно фильтровать по различным критериям (например, по полу обвиняемого или жертвы, их занятиям, возрасту; по дате преступления), а результаты визуализировать с помощью диаграмм и таблиц.
🥷🏻 Что можно узнать о преступности из базы Old Bailey?
Разберём возможности базы на примере. Допустим, мы хотим проследить связь гендерного фактора и преступности.
Данные Old Bailey подтвердят выводы других исследований о том, что основная часть преступлений (почти 80%) совершается представителями мужского пола. Самым частым типом преступлений среди обоих полов является кража (theft).
Мужчины чаще были замешаны в преступлениях, связанных с насилием и жестокостью (sexual offence, breaking peace). Женщины, в свою очередь, чаще совершали правонарушения в сфере деторождения. Примечательно однако, что мужчины и женщины одинаково часто совершали убийства (доля убийств среди всех женских преступлений составляет 2,85 %, а среди мужских — 2,49 %).
Подробнее о том, как обнаружить такую статистику в базе данных, кого — мужчин или женщин — в Англии чаще отправляли в ссылку, и за что Элизабет Кларк приговорили к сожжению в 1687 году, узнаете из полной версии статьи.
Время чтения: 6,5 минут
🤖 «Системный Блокъ» @sysblokх
От Гумилева до Шаламова: что такое акростих, и как найти зашифрованные послания в тексте
Акростих — поджанр поэзии, который позволяет зашифровать в тексте множество посланий: от романтических до провокационных. Такие послания можно различить в первых буквах строк или предложений, которые складываются в отдельные слова или фразы. Примеры можно найти и у Николая Гумилева, и у Льюиса Кэррола. DH-исследователь Женя Дуненков создал алгоритм для автоматического поиска таких шифров в корпусе из десятков тысяч текстов русской классики. Рассказываем, что из этого вышло.
Что за алгоритм?
На первый взгляд, алгоритм поиска акростихов довольно простой. Нужно собрать по исследуемому тексту первые буквы (слов/предложений/абзацев — в зависимости от уровня поиска), нарезать из них «скользящим окном» потенциальные слова, а затем оставить только те, которые найдутся в словаре настоящих слов (о словаре ниже). Правда, так может получиться слишком много случайных совпадений. Чтобы их отфильтровать, можно искать несколько словоформ подряд, поскольку очень часто акростихи состоят из целых фраз.
Какие результаты?
Среди 72 137 текстов с az.lib.ru нашлось 1763 потенциальных акростиха. Проверить их пришлось вручную, и… к сожалению, скрытых сокровищ, про которые срочно писать во все литературоведческие журналы и ехать с ними на конференции, не нашлось. Среди интересных примеров – политическое высказывание Амфитеатрова о цензуре и акростих в рассказе «Заклинатель змей» Варлама Шаламова.
А какие перспективы?
Хотя этот случай не предложил неожиданных открытий, работу точно можно продолжить. Например, обратиться к поиску по поэтическому корпусу, новостным и публицистическим сайтам. Можно взяться за корпуса на других языках, если найти подходящий словарь (на английском с его неизменяемостью слов должно быть гораздо проще).
Подробнее о процессе работы с корпусом, найденных примерах и акростихах (а еще о мезостихах, телестихах и абецедариях!) узнаете из полной версии статьи.
Время чтения: 16 минут
🤖 «Системный Блокъ» @sysblok
Что говорит о дневниках 1917 года анализ данных?
Сегодня очередная годовщина Октябрьской революции. 25 октября 1917 года (7 ноября по новому стилю), когда Россия во второй раз за год радикально сменила курс. Жизнь человека в 1917 году была чередой шокирующих неожиданностей. Что волновало в эти дни простых граждан? Какие темы поднимали в газетах? О чем думал Николай II в день отречения? Рассказываем, как анализ дневников цифровыми методам позволяют изучать историю революции.
Кратко: о чем статья?
Чтобы разобраться в мыслях современников 1917 года, необходимо учитывать их уровень жизни и образования, социальный статус.
Проанализировав их, мы выяснили, что в основном авторы дневников — люди с отличным образованием, достигшие определенного успеха в своей сфере. Поэтому интерпретации, которые можно получить на основе их текстов, отражают мысли не всего общества в тот момент, а скорее его верхнего слоя.
Среди тем, которые волновали этих людей, ожидаемо оказались революция и другие политические события. Но встречались и другие записи: о Первой мировой войне, об искусстве и об экзистенциальных вопросах.
Ключевые слова, позволившие выявить эти темы, и самые активные авторы дневников — в нашей инфографике. А подробности о том, как проводилось это исследование, — в полной версии статьи.
Время чтения: 13 минут
🤖 «Системный Блокъ» @sysblok
Калифорния обязывает чат-ботов сообщать, что они — ИИ
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
13 октября в Калифорнии подписали новый закон SB 243, который устанавливает правила для разработчиков «компаньон-ботов» — ИИ, имитирующих диалог с человеком.
Согласно закону, если пользователь может принять бота за человека, система обязана выдать «ясное и заметное» уведомление, что это искусственный интеллект.
По тому же закону с 2026 года разработчики должны будут отчитываться о том, как их ИИ реагирует на сообщения о суицидальных мыслях. Эти отчеты будут публиковаться на сайте офиса по предотвращению самоубийств.
Почему это важно?
ИИ-компаньоны становятся все более реалистичными. Многие пользователи воспринимают таких ботов как настоящих собеседников, делятся личными данными или просят поддержки в кризисных ситуациях.
Принятый в Калифорнии закон — одна из первых попыток регулировать это направление, обозначить рамки безопасности и сделать взаимодействие с ИИ более прозрачным. Он также может повлиять на мировые практики: разработчики ИИ-систем для глобального рынка базируются в США и будут вынуждены учитывать эти ограничения.
Большие данные Большого террора
Сегодня, накануне Дня памяти жертв политических репрессий, проходит день возвращения имен. В этот день в десятках городов России и мира читают имена погибших в годы Большого террора. Эти имена взяты из документов, которые оставила после себя бюрократическая машина, сопровождавшая репрессии. Память об уничтоженных людях хранят расстрельные списки, архивы с уголовными делами, посмертные справки о реабилитации. Теперь эта память стала цифровой. Вспоминаем, какие базы жертв репрессий существуют.
Жертвы политического террора
Сбором и оцифровкой данных о репрессиях занимается «Международный Мемориал»*: cегодня их база содержит более 3 миллионов записей с информацией о дате и месте рождения, месте проживания и работы, дате ареста и приговоре.
Это прямо здесь
География репрессий волнует многих исследователей, поэтому на основе данных «Мемориала» созданы несколько ресурсов с геопривязкой. Самый известный — московский «Это прямо здесь». Здесь можно обнаружить места массовых расстрелов, здания тюрем, лагерей и лагпунктов, захоронения расстрелянных. Всего — свыше 830 объектов.
Не только жертвы, не только репрессий
Информация есть не только о жертвах системы, но и о тех, кто в ней работал – в отдельной базе данных собрано почти 50 тысяч имен сотрудников органов государственной безопасности СССР с 1935 по 1939 годы.
Еще одна крупная база посвящена остарбайтерам — жителям оккупированных территорий СССР, перемещенных для работы в Германию и возвратившихся после войны.
Узнать подробнее об этих базах данных и о том, какие сложности возникают при их создании и дальнейшей стандартизацией информации, можно из полной версии статьи. А если вы знаете о других проектах и базах данных, которые помогают изучать тему Большого террора — расскажите о них в комментариях.
🤖 «Системный Блокъ» @sysblok
*Международный Мемориал ликвидирован решением ВС РФ 28 февраля 2022 года
Многолесый и старомозгий: как неологизмы Маяковского (не) вошли в речь
Маяковский стремился реформировать язык в разных текстах и разными способами, создавая не только новые поэтические формы, но и новые слова. В новой статье изучаем судьбу его авторских неологизмов с помощью НКРЯ.
Напомните, что за неологизмы
Слова, которые появились в языке совсем недавно и еще не успели в нем закрепиться, называются неологизмами. Ещё лет 20-25 назад такими были, например, привычный сегодня ноутбук и крутой в значении отличный. Это общеязывковые неологизмы, но бывают и авторские. Например, появлением слова влюбленность мы обязаны Николаю Карамзину. Придумывал новые слова — и очень активно — и Маяковский, но не все из них, конечно, ушли в народ.
Как создавались новые слова
Маяковский использовал как стандартные модели словообразования: префиксацию (добавление приставки), сложение (соединение основ или слов), сращение (превращение словосочетания в одно слово), аббревиацию, так и необычные. Например, часто в качестве одного из компонентов в его слова входят числительное, наречие или местоимение: у него найдутся стоугольный Гигант, стодомый содом, многолесый скат и даже всенэповское загорание. А ещё у поэта обнаружатся слова старомозгий и синеволный.
Судьба неологизмов Маяковского
Попасть в разговорную речь и литературу смогли лишь немногие неологизмы поэта. Трижды в корпусе русского языка можно обнаружить придуманное им двухметроворостый. Но есть слово, которое использовали намного более активно: особенно часто в 1940-х и 1970-х.
Что это за слово? Предлагаем вам догадаться в опросе ниже!
🤖 «Системный Блокъ» @sysblok
Искусство оцифровки: подборка интервью «Системного Блока»
Что происходит с памятью, когда она становится цифровой? В новой подборке интервью «Системного Блока» — истории тех, кто превращает архивы в цифровые пространства, пересобирает музеи в онлайн-формате и осмысляет, как современные инструменты помогают сохранять культурное наследие.
📓 «Как устроена оцифровка дневников»
Проект «Прожито» вырос из волонтерской инициативы по оцифровке личных дневников в крупный исследовательский и архивный центр при Европейском университете в Санкт-Петербурге. Михаил Мельниченко, основатель проекта, рассказывает о переходе «Прожито» от текстового корпуса к полноформатному цифровому архиву, а также о значении общественной архивистики и сложностях долговременного цифрового хранения.
💀 Цифровое бессмертие и язык онлайн-скорби
Культуролог и исследователь цифровой среды Оксана Мороз размышляет о трансформациях онлайн-коммуникации в условиях социального кризиса после 24 февраля 2022 года.
🎧 Коллекция аудиозаписей Пушкинского Дома
Заведующая Фонограммархивом Пушкинского Дома Светлана Подрезова делится историей одной из крупнейших коллекций этнографических аудиозаписей в России — от ранних записей голосов Блока и Гумилёва до современных технологий оцифровки.
🎓 Филология, IT и борьба с мракобесием
Цифровой филолог Кирилл Маслинский рассказывает, как он пришел к работе на стыке филологии и IT, а также об одном из крупнейших цифровых собраний детской литературы — Детском корпусе. В интервью — как открытые данные помогают бороться с мракобесием и пренебрежением исторической точностью.
🏛️ Цифровые музеи
Инна Кижнер, эксперт в области цифровых гуманитарных наук, раскрывает сложности создания цифровых музейных коллекций, а также объясняет, как оцифровка влияет на представление культуры и почему цифровые архивы часто бывают нерепрезентативными.
🖼️ Цифровое будущее музеев: кураторство, онлайн-выставки и ИИ
Заместитель директора по цифровому развитию Пушкинского музея Владимир Определенов размышляет о возможностях цифрового кураторства, онлайн-выставок, интеграции музейных данных и использовании искусственного интеллекта в музейной среде.
🤖 «Системный Блокъ» @sysblok
Классное чтение. Писательницы из союзных республик и стран зарубежья
«Системный Блокъ» продолжает рассказывать о писательницах и поэтессах, чьи сочинения в разные годы входили в школьный канон по литературе. В ходе исследования мы выяснили, что в списках для чтения появлялись имена 36 женщин, которым принадлежит в общей сложности всего 2% рекомендованных произведений.
Однако даже из этих 36 авторок сложно сразу вспомнить кого-нибудь, кроме Ахматовой и Цветаевой. В прошлом посте мы рассказывали о тех, кто надолго задержался в школьной программе, а сегодня предлагаем вам узнать больше о писательницах из союзных республик и стран зарубежья.
🤖 «Системный Блокъ» @sysblok
Искажение восприятия: риски использования 3D-диаграмм
Трехмерные диаграммы выглядят современно и эффектно, но очень часто они обманывают наше восприятие, искажают данные и заставляют делать неверные выводы. Разбираемся, как 3D-эффекты становятся источником дезинформации и как этого избежать (очень просто!).
👁️👄👁️ Искажение перспективы
Одной из главных проблем трехмерных диаграмм является искажение перспективы. На восприятие фигур в 3D-формате влияют различные визуальные эффекты, в частности, окклюзия — явление, когда объекты, расположенные ближе к наблюдателю, кажутся больше, чем те, что находятся на заднем плане. Это может вводить в заблуждение при интерпретации данных.
Например, на нашей иллюстрации сектор бирюзового цвета визуально выглядит больше, хотя его числовое значение меньше, чем у синего сегмента.
😐🫥 Потеря информации из-за перекрытия
В трехмерных столбчатых диаграммах столбцы с более высокими значениями могут полностью перекрывать те, что имеют более низкие значения. Из-за этого теряется часть информации, становится сложнее выявлять закономерности и тенденции и точно определять значения на центральных полосах графика (особенно если они не выровнены по числовой сетке).
🔹🔷 Проблемы со сравнением значений
Трехмерные фигуры также создают трудности для сравнения значений. Поскольку на нашем примере не указаны числовые значения, быстро разобраться в соотношении частей на левой диаграмме — практически невозможно.
😎 Что делать?
Решение проблемы довольно простое: избегайте использования трехмерных диаграмм, которые искажают представляемые данные. Вместо этого выбирайте двумерные диаграммы или таблицы, чтобы обеспечить честность и максимальную достоверность информации.
🤖 «Системный Блокъ» @sysblok
Нейротикток от OpenAI, новая модель Anthropic, новый тест для LLM
Рассказываем, что произошло в мире ИИ за последнее время.
Sora 2 и нейротикток
Компания OpenAI представила обновлённую версию модели Sora для генерации видео по текстовым описаниям. Новая версия создает более качественные и реалистичные ролики со звуком, а еще умеет добавлять в кадр конкретных людей и предметы на основе загруженных примеров.
Одновременно с обновлением вышло мобильное приложение Sora для iPhone с короткими роликами, созданными пользователями с помощью Sora 2. Меньше чем за неделю социальная сеть возглавила топ App Store в категории «Фото и видео».
Пока приложение работает только в США и Канаде по приглашениям.
Почему это важно?
Модели для генерации видео начали активно развиваться с 2024 года. С тех пор OpenAI, Google и ряд китайских компаний представили решения, способные создавать относительно реалистичные ролики.
Сейчас их используют преимущественно для развлекательного контента, но существуют опасения, что в будущем компании будут применять такие технологии для генерации крайне персонализированного и вызывающего зависимость контента.
В перспективе генеративные модели могут превратиться в модели мира, способные относительно точно и быстро симулировать физические процессы и ситуации из реальности. Например, моделировать редкие дорожные ситуации для проверки автопилотов или рутинные задачи вроде складывания вещей и приготовления пищи для обучения роботов.
Почему это важно?
Anthropic – один из главных конкурентов OpenAI. Модели Antropic на протяжении долгого времени остаются лидерами в области программирования и агентных систем.
Почему это важно?
Большинство существующих тестов для языковых моделей проверяют академические способности или производительность в узких областях вроде математики и олимпиадного программирования. Поэтому их результаты плохо отражают реальную пользу ИИ в практических задачах. Несмотря на это, в общественной дискуссии активно обсуждается вероятность замены человеческого труда искусственным интеллектом.
GDPval призван тестировать модели на репрезентативных задачах из реальной жизни, чтобы оценить экономический потенциал ИИ и возможные тренды автоматизации труда в будущем.