Компьютер учит срамоту

Как обучить нейросеть генерировать жёлтые тексты в духе самых трешовых баннеров? Наш автор Иван Торубаров погрузился в глубины кликбейта и спешит поделиться с вами тем, что он там нашел

«Да что они понимают»: как младенцы учатся говорить

В младенчестве нам предстояло выучить незнакомый язык на основе речи вокруг себя. Как мы осваивали язык и отделяли слова друг от друга? Рассказываем о речевых подсказках для младенцев и о том, как мы прибегали к статистике уже в 7 месяцев

Визуализация геоданных подтвердила утечку персональной информации

Визуализация геоданных подтвердила утечку персональной информации.

«Кладмен мудак»: анализ тональности отзывов о запрещенных веществах

Язык интернета имеет свои характерные черты. И если исследованию языка Рунета посвящено множество работ, то DarkNet все еще остается серым пятном в этом плане. С помощью анализа тональности текстов выясняем, какая лексика характерна для отзывов о запрещенных веществах.

Веселое Рождество для великой княжны: как поздравляли друг друга в старых открытках

Наш проект по оцифровке открыток «Пишу тебе» продолжает исследовать свою постоянно растущую коллекцию. На этот раз мы изучили поздравительные открытки, написанные как до, так и после революции. Некоторые популярные поздравления сегодня выглядят неожиданно, хотя раньше были распространены повсеместно.

«Так много любовалась морем, что две ночи почти не спала…»: проект «Пишу тебе» провел первую лабораторию расшифровки почтовых открыток.

Именно с такими впечатлениями от посещения Крыма и черноморского побережья пришлось столкнуться участникам первого занятия лаборатории по расшифровке почтовых открыток от проекта «Пишу тебе». Рассказываем, как прошла лаборатория и что мы планируем дальше

ИИ по классике: компьютер досочинил Десятую симфонию Бетховена

Людвиг ван Бетховен создал девять симфоний, а еще он успел набросать несколько заметок и к симфонии № 10. Рассказываем, как ученые с помощью ИИ закончили это произведение «в стиле Бетховена».

язык произведений русской литературы

Опознаете ли вы Пушкина из параллельного мира: тест по векторной литературе

Сможем ли мы отличить «Мастера и Маргариту» от «12 стульев»? Скорее всего, не ошибемся. А что если заменить некоторые слова из оригинальных произведений на близкие по значению с помощью векторной модели на базе word2vec? Предлагаем вам пройти наш тест и проверить, насколько хорошо получится опознать классические тексты, если некоторые слова в них будут модифицированы.

DraCor и Programmable Corpora: корпуса для цифровых гуманитариев

Разбираемся, как работает DraCor — программируемый корпус текстов на 11-ти языках, с помощью которого можно прочитать пьесу, наглядно рассмотреть отношения между персонажами и даже поиграть в карточную игру

Подборка летних открыток дореволюционного и советского времени

Уже минула середина лета, кто-то еще только в предвкушении отпуска, а кто-то возвращается из поездок, путешествий, приключений. Такие моменты хочется разделять с близкими людьми. В дореволюционное и советское время популярным способом поделиться впечатлениями из поездки было отправление почтовых открыток с изображением городских достопримечательностей. Проект «Пишу тебе» сделал подборку летних почтовых открыток, где люди рассказывают об отдыхе и путешествиях.

История про людей: как устроены просопографические базы данных

Для исторической науки важны не только битвы, революции, переселения народов, смены экономических укладов и политических режимов. Важно еще понимать, кем были все те люди, чьими руками и умами велись сражения и торговля, совершались великие географические открытия, создавались новые государства, в общем — творилась история. Рассказываем о просопографии и просопографических базах данных

Как работает GPT-3 — самая продвинутая языковая модель

GPT-3 — самая известная из современных нейросетевых моделей языка. Вокруг нее много мифов, но модель действительно умеет впечатлить. Она отлично справляется с написанием целых эссе на заданную тему, удачно отвечает на вопросы, а также пишет стихи и программный код. Рассказываем, как работает GPT-3.

BERT модель

UniLM — языковая модель для тех, кому мало BERT

Сегодня каждая большая IT-корпорация пытается сделать «еще более умную» нейросетевую языковую модель, которая решала бы сразу множество задач: и ответы на вопросы, и порождение правдоподобного текста по заданной теме, и краткий пересказ. Мы уже писали о BERT от Google и семействе GPT от OpenAI — настал черед UniLM от Microsoft

Что общего между переписью населения и жаккардовой тканью?

Материал о том, как Розелла Бискотти с помощью ткани и ячеек разных цветов и узоров визуализировала данные о жителях родного города.

Преступления и наказания: что показывает статистика судов и приговоров в России

Правозащитный проект ОВД-Инфо запустил сервис анализа и визуализации открытых данных по статистике судебных решений по уголовным делам в России. «Системный Блокъ» разбирается с тем, как сервис становится проводником диалога судебной власти и общества, и зачем это нужно

«Это имитация интеллекта»: Константин Воронцов — о настоящем и будущем машинного обучения

Сможет ли человечество построить искусственный интеллект, не уступающий человеческому, и надо ли его строить? «Системный Блокъ» обсудил это с Константином Воронцовым, одним из известнейших специалистов по машинному обучению в России. Публикуем его ответы на наши вопросы

«Желаю быть паинькой»: как поздравляли с днем рождения в дореволюционных открытках

Сегодня Системный Блокъ отмечает свой третий день рождения. День рождения - очень добрый праздник. В этот день именинник получает приятные пожелания от близких людей. И никакие расстояния не помеха чтобы сказать теплые слова дорогому человеку. Сейчас нам не составит труда позвонить имениннику или отправить ему пожелания в мессенджере. А в начале XX века единственным способом поздравить на расстоянии человека было отправление почтовых открыток или писем.

Тест: Знаете ли вы различия между мужской и женской речью

Женщины и мужчины спорят о равенстве или превосходстве и никак не могут прийти к соглашению. Что если дело в том, что они просто говорят на разных языках? Такой вывод напрашивается после прочтения исследований о зависимости речи от гендера. По мотивам этих исследований мы создали небольшой тест, чтобы проверить, настолько ли заметна разница в коммуникации мужчин и женщин.

зарплаты учителей в россии

«Марь Иванна, у вас воротничок сине́ет»: исследование СБъ о зарплатах учителей

Сегодня в России более 1,3 млн учителей средних школ. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Говоря геймерским языком: насколько трудно «проходить Россию» на уровне сложности «medium teacher»

«Орнамика»: цифровой архив узоров и вдохновение для дизайнера

Рассматривая расписную тарелку дома у бабушки, мало кто задумывается, что декоративно-прикладное искусство — важная часть визуальной культуры. А еще старинные орнаменты отлично вдохновляют современных дизайнеров. Рассказываем про проект «Орнамика», собирающий узоры в цифровом формате

Привет с фронта: военные открытки

80 лет назад, 22 июня 1941 года, началась Великая Отечественная война. В военное время было особенно важно сообщить вести о себе своим близким, друзьям, знакомым. Проект «Пишу тебе» отобрал фронтовые открытки, посвященные тем временам. Эти открытки наполнены любовью, заботой и надеждой на встречу с родными

Transkribus: как компьютерное зрение помогает переводить тексты сирийских мистиков

Сколько ваших знакомых без проблем смогут прочитать рукописи Пушкина? А петровскую скоропись? А рецепт своего лечащего врача? Чтобы разобрать написанное, часто нужен натренированный глаз. Добиться этого можно двумя способами: мы можем тренировать собственное зрение, а можем — компьютерное. Как и зачем тренируют модели распознавания рукописного текста — рассказывают исследовательницы классической сирийской литературы Юлия Фурман и Анна Черкашина

Как видят мир беспилотники и почему «обучение с учителем» сломано. Расшифровка подкаста с Борисом Янгелем

Эта страничка — дополнение к XI выпуску подкаста «Неопознанный Искусственный Интеллект». В этом выпуске мы общались с Борисом Янгелем из команды разработки беспилотных автомобилей в Яндексе. Здесь вы найдете полную расшифровку, оглавление выпуска и полезные ссылки

Как устроена нейросеть BERT от Google

BERT — нейросетевая модель-трансформер от Google, на которой сегодня строится большинство инструментов автоматической обработки языка. Модель появилась в начале 2018-го, а уже в октябре того же года Google встроил модель в свой поисковик. Разбираемся, что же представляет из себя модель BERT и как она работает

Безработица, отчаяние и смерть: что стоит за эпидемией безысходности

Согласно данным проекта Periscopic, на 2021 год приходится пик так называемых «смертей от отчаяния» - преждевременных смертей американцев без высшего образования. Разбираемся, почему каждый год умирает все больше белых жителей США средних лет и как с этим связан русский алкоголизм

документы ВОВ

Что можно найти в цифровом архиве «Документы Победы»

Цифровой архив «Документы Победы» хранит свидетельства о том, как управлялись войска, оборонная промышленность и прочие отрасли хозяйства во время Великой Отечественной войны.

Рыбий жир полнит: о чем писали дети в открытках

1 июня — международный день защиты детей. К этому дню проект «Пишу тебе» собрал подборку старых открыток, написанных детьми. Юные авторы открыток рассказывают родителям о понравившихся игрушках, школьных отметках и последствиях употребления рыбьего жира.

«Нравственное право» и «немеркнущая правда»: как речи президентов на 9 мая влияют на коллективную память

Мы проанализировали все речи президентов, которые произносились в честь 9 мая с 2000 года. О том, как эти выступления влияют на нашу коллективную память и помогают легитимировать власть, читайте в исследовании СБъ

Генеративное искусство: от калейдоскопа до машинного обучения

Со временем машины получают все больше способностей. Одной из них стало творчество. Произведения искусства, созданные автономными механизмами, существовали еще несколько веков назад, но расцвет этого вида творчества происходит в наши дни благодаря развитию технологий. Рассказываем о прошлом, будущем и настоящем генеративного искусства

«Алиса, ты секси»: гендер, харассмент и голосовые помощники

Развитие технологий порождает новые этические проблемы. Например, голосовые помощники могут отражать и укреплять гендерные стереотипы. Мы проверили это, протестировав реакцию российских голосовых ассистентов «Алису» и «Маруси» на флирт, вопросы о гендере и оскорбления.

Программирование для филологов и нейропоэзия: интервью с Борисом Ореховым

Для чего филологу учиться программировать? Зачем учить нейросети писать стихи? Как мы опираемся на корпусные методы исследования языка в повседневной жизни, даже не замечая этого? Системный Блокъ поговорил с цифровым филологом Борисом Ореховым — доцентом школы лингвистики НИУ ВШЭ и постоянным ведущим нашей рубрики «Нейростихи».

Голова в раме: VR-фильмы по мотивам известных картин

Продолжая осваивать виртуальную реальность как медиум, режиссеры и художники создают 360° VR-фильмы по мотивам шедевров мировой живописи. С изображений «снимают рамы» и превращают картины в трехмерные миры, доступные через VR-шлем или очки. Рассказываем, как оживают герои с картин, как меняется восприятие живописи и какую роль здесь играет зритель.

Для чего еще нужны маски: карта загрязнения воздуха

После 2020 мы все усвоили, что вирусные заболевания очень хорошо распространяются воздушно-капельным путем. Но какой еще невидимый глазом враг может таиться в воздухе?

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

Экономия и лень: как мозг заставляет нас ошибаться

Нейролингвисты из Вышки исследовали, насколько легко обмануть мозг с помощью текстовых уловок. Спойлер: очень легко

Подборка интерактивных карт по истории

Крутим глобус времен динозавров, запускаем навигатор по античным дорогам и созерцаем, как менялся мир под воздействием человека в последние тысячелетия

Пообедать у Канта: калининградские ученые воссоздают дом философа в 3D

К грядущему 300-летию одного из самых цитируемых философов мира специалисты из Центра социально-гуманитарной информатики Балтийского федерального университета реконструируют дом своего земляка в Кёнигсберге XVIII в. Виртуальная реконструкция ведется на основе письменных источников, а также единичных старых фотографий и картин

Из-за пандемии музей Виктории и Альберта может остаться без «Театра и Перформанса»

Театральная и перформативная коллекции в Музее Виктории и Альберта представлены как самостоятельный отдел. Он хранит уникальные артефакты: от сборников времен Шекспира до плакатов Sex Pistols. В пандемию доходы музея сильно упали, поэтому отдел хотят закрыть. Даже государственная поддержка не может компенсировать колоссальные убытки музея

VR в психотерапии

VR в психотерапии

Починка человеческих душ — теперь и в виртуальном пространстве! В этой статье мы расскажем, как современные технологии помогают преодолевать фобии и реабилитировать людей после травм. Статья подготовлена факультетом психологии МГУ им. Ломоносова в рамках совместного проекта с изданием «Системный Блокъ».

нарратив

Флэшбеки, сны и встроенный нарратив: каким бывает повествование

Что такое нарратив и из чего складывается повествование? О способах конструировать сюжет рассказываем в новом материале

цифровой гуманитарий

Тест: какой вы цифровой гуманитарий?

Пройдите тест, который покажет, кто вы в мире цифровых гуманитарных исследований. А заодно — познакомьтесь с известными цифровыми гуманитариями.

В пространстве текстов: детоксикация комментариев, подделка отзывов и нейроцензура

Как работают современные методы переноса стиля? Могут ли они быть полезны или опасны? И при чём здесь «бутылочное горлышко» нейросети?

европа xviii век

Царские свитки и биография Конфуция: что есть в корпусе русских переводов общественно-политических сочинений XVIII века

Корпус переводов общественно-политических текстов XVIII века помогает проследить формирование русского политического языка. В корпусе есть философские трактаты, художественные произведения политического характера, учебники и словари

Ткани онлайн: как оцифровать полотно в 6 метров

Мы писали о том, как оцифровывают почти все, даже алтари. Но можно ли перевести ткани в цифровой формат? Разбираемся, как сохраняют узоры на текстиле

паратекст

Окружён, но не сломлен: цифровой паратекст и его применение

Когда мы читаем книгу, то иногда отвлекаемся на нумерацию страниц, перечитываем оглавление или сравниваем обложку с содержанием. Так происходит, потому что все эти элементы являются паратекстом. О том, что означает этот термин и какие функции несёт, расскажем в нашей статье

робот двойник

Что не так с желанием создать робота-клона?

Сюжеты фантастических фильмов, где людей не отличить от роботов, ближе, чем мы думаем. Конечно, современным андроидам нужны еще годы разработок до стопроцентной идентичности, но об их месте среди людей стоит задуматься уже сейчас. Производство двойников и клонов – это неизбежное технологическое будущее или губительная для психики практика, которая не вписывается в этические нормы (даже очень размытые)?

Digital Mappa против Google Maps

Мир глазами средневекового книжника: как разобраться в карте, если север слева, река впадает в круг, а посреди города сидит лев? Сравниваем средневековые карты с современными

дистант образование

Старое новое: почти 300 лет истории дистанта

Формат дистанционного обучения кажется относительно новым, но он старше, чем кажется. Разбираемся, когда на самом деле появился так надоевший в 2020 дистант и какую страну можно считать его родиной

Трансформация языка в Интернете: норма или преступление?

Под влиянием культурных и социальных условий наш язык трансформируется. В эпоху Интернета эти изменения происходят гораздо чаще, и принять их бывает трудно. Разбираемся, достоин ли «великий и могучий» русский язык называться таковым после языка падонкафф, где грань между лол и кек и почему нельзя повышать шрифт на кого попало

дата-журналист

От данных — к людям: что такое дата-журналистика

Анализ смертей от алкоголизма в России и визуализация травм протестующих в Беларуси, изучение статистики наркопреступлений и расследование пыток в силовых структурах на основе тысяч приговоров — все это примеры журналистики данных. Разбираемся, чем занимаются data-журналисты и что в их работе главное. Спойлер: главное — не данные!

Как работают нейросети: подборка постов с пошаговыми разборами

Разбираем сложные технологии глубокого обучения, чтобы они становились понятны каждому

мозговые импланты

Управляй мозгом со смартфона: ученые сделали импланты-антидепрессанты

Работа мозга - одна из самых малоизученных сфер в науке, а лечение психических расстройств и заболеваний мозга очень востребовано. Нейробиологам из США и Южной Кореи удалось найти подход к борьбе с психическими расстройствами с помощью мозговых имплантов и смартфона

историк медиевист

От разобщенности к войне: что показывает сетевой анализ византийских писем

Может ли сеть средневековых писем рассказать исследователям о политических связях византийцев? Видно ли в ней наступление разобщенности элит, за которым последовал политический кризис и новый виток гражданской войны? Рассказываем о теории графов (network theory) на службе у медиевиста

Legal Tech: технологии в юридической деятельности

Что такое Legal Tech и можно ли автоматизировать юриста

Как технологии меняют юриспруденцию? Что такое цифровой суд? Можно ли автоматизировать работу юриста? Ответы на эти и другие вопросы читайте в нашем материале о legal tech

как оживить умершего

«Поднимите мне руку!»: как технологии оживляют покойных

До начала XIX века память об умершем сохранялась в произведениях искусства и письменных источниках. Два столетия спустя человека стало возможно увековечить… целиком. Теперь внешность, голос, мимика и движения — потенциальный материал для виртуальной копии. Да-да, это реальность, а не один из эпизодов «Чёрного зеркала». Разбираемся в тонкостях цифрового бессмертия, бизнесе «двойников» и этике воскрешения

что такое стилометрия

Стилометрия: как в разное время люди искали авторов текстов

Сегодня для того, чтобы понять, кто написал текст под псевдонимом, у исследователей есть количественные методы анализа, в основе которых – подсчет служебных слов в тексте. О том, как люди к этому пришли, рассказываем в материале об истории стилометрии

Почему искусственный интеллект врет и как его его от этого отучить. Расшифровка подкаста с Давидом Дале

Публикуем материалы к седьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

расизм

Не стреляйте черных роботов: расизм, смерть и машины

Если ввести в поисковую строку браузера слово «робот»‎, на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно: расовая нетерпимость распространяется не только на людей.

ObjectNet — датасет, который поставил в тупик лучшие модели компьютерного зрения

Модели компьютерного зрения обычно без труда распознают стул, стоящий на кухне, но перевернутый стул в спальне ставит их в тупик. Создатели ObjectNet постарались решить проблему с помощью датасета с тысячами необычных фотографий

тест по средневековым университетам

Кто такой педель и как получить матпомощь в XIV веке? Тест по cредневековым университетам

Быть студентом в Средние века — это вам не с айфона шпоры списывать. Но многие знакомые современным студентам вещи были в университетах уже тогда. Например, землячества или материальная помощь для малообеспеченных. Проверьте ваши знания об университетской жизни в Средневековье.