Чат-боты угрожают отрезать людям пальцы. Мы все умрем?

Что можно назвать «эмоциональным» искусственным интеллектом и как он работает

Виртуальный музей на 360°

Рассказываем о цифровом проекте Метрополитен-музея в Нью-Йорке, который позволяет рассмотреть с необычных ракурсов самые знаменитые залы, не выходя из дома

Как дата-детектив разоблачает подозрительные медицинские исследования

Как один анестезиолог обнаружил проблемы в сотнях статей, разрушил карьеры нескольких фальсификаторов и вдохновил медицинский журнал изменить правила рецензирования

5 российских библиотек с богатыми цифровыми коллекциями

Оцифровка культурных данных — необходимая база для цифровых гуманитарных исследований. Делимся списком крупных коллекций, созданных российскими библиотеками

"Область, в которой я работаю, рождается прямо на глазах"

Значение слов постоянно меняется, отражаясь в контекстах. Следом меняются и типичные ассоциации, связанные со словами. Как «тюремная камера» превращалась в «сотовый телефон» и какие цифровые методы позволяют отследить эти изменения — рассказывает Андрей Кутузов

Шпионаж и слежка 400 лет назад (и почему это важно знать сегодня)

По метаданным спецслужбы могут узнать о вас многое. Теперь это подтверждают еще и историки — при помощи сетевого анализа старинных писем

Корпус для всех: как используют НКРЯ

Кому и почему «важно, чтобы корпус жил»? Системный Блокъ узнал, как применяют Национальный корпус русского языка: от школьных исследований до изучения перевода культурных реалий

Джон Сноу vs Холера

Коронавирус из Китая разлетается по планете. Уже появились первые жертвы в других странах, а в самой КНР погибло более 400 человек, заражены десятки тысяч. Весь мир ищет способы остановить распространение эпидемии. А мы, конечно, сразу вспомнили классическую историю о том, как доктор Джон Сноу остановил эпидемию холеры при помощи сбора, анализа и визуализации статистики. Хочется верить, что и в этот раз человечество спасут умные врачи и передовые технологии, в том числе анализ данных

Многомерное «Слово о полку Игореве»: от кукушки до алкогольного брендинга

Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах... в Рунете уже были цифровые гуманитарные проекты! Рассказываем в лицах и деталях об одном из них — о параллельном корпусе переводов поэмы «Слово о полку Игореве», которая отметила 13-летие. В конце поста бонус — обзор исследований на основе корпуса

От Ктулху до Человеколося: мифы в цифровой галактике

Как существа из древних легенд «выживают» в современной массовой культуре, перемещаясь из сказок и книг — в мультики, сериалы и компьютерные игры

«Шахерезада»: робот, рассказывающий истории

Разбираемся, как работает алгоритм генерации историй «Шахерезада»

Сети Чехова: откуда вырос «Вишневый сад»

А.П. Чехов переизобрел драматический театр. Его роль в истории драматургии сравнима с ролью Эйнштейна в физике и Джобса — в мобильной электронике. В день 160-летия Чехова рассказываем о том, как посмотреть на его творчество через цифровую оптику — и что может дать такой взгляд.

Позвони мне, позвони: как мобильные данные помогают изучать неравенство

С помощью мобильных данных ученые из MIT Senseable City Lab измерили городскую сегрегацию в Сингапуре. Они проверили, насколько сильно разные социально-экономические группы разделены в физическом и виртуальном пространстве города

Вебинар «Математика для Data Science»

Машинное обучение и Data Science похожи на ядерную физику в начале 50-х или кибернетику в 60-е. Мечтают делать многие, понимают немногие, делают — совсем немногие. Главная преграда — математика. Рассказываем про вебинар наших партнеров из OTUS

Google-проповедник, гендерные стереотипы и развитие ИИ: интервью с разработчиком Googlе-Переводчика

Как совершенствуются системы машинного перевода, стоит ли пугаться религиозных предсказаний при переводе на маори и как избавиться от сексизма и стереотипов в переводчике

Шесть рукопожатий Фрэнсиса Бэкона

Сегодня день рождения Фрэнсиса Бэкона — главного эмпирика мировой философии, выдающегося ученого, крупного политика, талантливого литератора и знатного коррупционера. Рассказываем о том, как ученые восстановили социальную сеть Бэкона и построили из нее целый «фейсбук» Англии 500-летней давности, исследовать который может каждый

Невидимые кинозвезды: как Голливуд не замечает женщин-режиссеров

В 2010 году «Оскар» за лучшую режиссуру впервые получила женщина — Кэтрин Бигелоу с фильмом «Повелитель бури». Стали ли после этого режиссеры женского пола более заметными фигурами в киноиндустрии? Редакция «Системного Блока» провела исследование, проследив динамику упоминаний женщин-режиссеров в статьях популярных киножурналов

280 символов Трампа: как Твиттер стал оружием в политической гонке

Как гневные твиты, написанные КАПСОМ, помогли Дональду Трампу завоевать пост президента США? Разбираются ученые

Вавилонская нейросеть для многоязычного перевода

Не так давно заговорили о том, что система нейронного машинного перевода от Google сама научилась переводить в языковых парах, для которых у неё нет параллельных корпусов. Действительно ли онлайн-переводчик изобрел собственный универсальный язык, машинную интерлингву?

Как накраудсорсить автобус

Ну, или по крайней мере схему его движения. Рассказываем о «диких» ливанских маршрутках — и как студенты вместе с гражданскими активистами приручали их с помощью GPS и мобильных приложений

Машина времени для Рихарда Вагнера

Рассказываем о цифровых проектах, связанных с исследованием творчества великого немецкого композитора Рихарда Вагнера

Код «Мастера и Маргариты»

Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения

Лица Системного Блока

В 2019 году наша команда спецпроектов знакомила вас с учеными, популяризаторами науки, которые применяют цифровые методы в своих гуманитарных исследованиях. А 2020-й мы решили начать со знакомства с участниками самого Системного Блока. Кто, как и почему делает этот проект — расскажем в нашем праздничном интервью

Искусственный интеллект создает новогоднее настроение: 5 праздничных проектов

Нейронные сети научились сочинять рождественские колядки, подписывать поздравительные открытки, находить по-зимнему заснеженные территории и делать предсказания на будущий год. В разгар праздничных каникул публикуем подборку самых ярких новогодних AI-экспериментов

Графики, которых мы еще не видели: как биологи визуализируют данные

Если вам кажется, что самое странное изображение в биологии — это препарированная лягушка, вид сбоку, то спешим вас разубедить: биологи успешно создают визуализации для самых разнообразных данных. О некоторых из них речь пойдет в нашей статье

«Best of Блокъ»: лучшие посты 2019 года

Весь 2019 год «Системный Блокъ» рассказывал, как высокие технологии становятся частью современной науки, культуры и повседневности, принося хорошее и плохое. Мы писали о последних прорывах в автоматической обработке языка и о методах борьбы с фейк ньюс, объясняли на пальцах, как работают нейросети, машинный перевод и фильтры в инстаграме, учили обкачивать VK, твиттер и HTML-страницы и делать корпусные исследования, рассказывали про статистические исследования в истории, литературе и искусстве, а еще много исследовали сами... За год в «СБъ» вышло больше 220 материалов. Предлагаем вам подборку из 12 постов, которые стоит перечитать. Можно как раз под бой курантов 🥂

Как делать тематическое моделирование без боли и командной строки

«Системный Блокъ» уже рассказывал, как делать тематическое моделирование при помощи Mallet — классического инструмента выделения тем с опорой на алгоритм LDA. Однако есть и более современные инструменты, не требующие возни с командной строкой. На этот раз мы расскажем об одном из таких инструментов — сервисе TopicModellingTool, а также о визуализации тем при помощи Tableau Public

Искусственный интеллект поможет подобрать лекарство от депрессии

Резистентность к антидепрессантам – одна из проблем, с которой психиатры сталкиваются в лечении депрессии. Часто подбор препарата ведется долго, методом проб и ошибок. Причина кроется в разнообразии: мозг у разных людей устроен по-разному, и то, что хорошо подходит одному пациенту, может не иметь никакого эффекта для другого. Можно ли, опираясь на биологические особенности строения мозга, повысить эффективность подбора терапии?

Скоро ли появится Альтрон? Битва за лидерство в военном ИИ

Хотя искусственный интеллект все еще находится на ранней стадии своего развития, он способен изменить экономический и военный баланс в международной системе. Все больше государств и негосударственных организаций разрабатывают свои системы ИИ. Пока главные лидеры в гонке вооружений — США и Китай. США стремится удержать первенство, Китай же амбициозно планирует обогнать своего соперника к 2030 году. Несмотря на независимые национальные разработки, США и Китай все же ориентируются на идеи друг друга. Ну, а в чем же тактика и стратегия, сейчас разберемся

Оцифровать Французскую революцию: коллекция Бодуэна

Продолжаем погружение в цифровую историю важнейших документов Французской революции

Зрение, мозг и нейросети

Как ученые пытаются понять по активности мозга, что видит человек, и при чем тут машинное обучение

Виртуальная Кардашьян: кто такие CGI инфлюенсеры и что с ними не так

Рекламными ботами в инстаграме уже никого не удивишь. Но теперь искусственно созданные виртуальные инстаграмеры становятся звездами и начинают оказывать влияние на реальных людей

Где учить Python: обзор онлайн-курсов от «Системного Блока»

Научиться программировать мечтают многие, но как выбрать подходящий курс из сотен доступных вариантов? Мы сделали обзор курсов по Python, которые проходили сами

Помедленнее, я записываю!

Как работает распознавание речи и зачем оно вообще нужно

Как скрыть свои большие данные: не дай создать цифровую копию себя

Чего стоит анонимность в эпоху стеклянного мира, можно ли спрятаться от Гугла и Амазона, кто следит за нами особенно пристально и… нужно ли вообще скрываться

Скажи мне, какой у тебя индекс Хирша, и я скажу, кто ты

Разбираемся, можно ли измерить вклад учёного в науку и стоит ли это делать

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей

Как начать свой путь в NLP (не путать с НЛП)

Хотите разобраться в автоматической обработке языка и стать NLP-инженером? Вам сюда

Черных — в тюрьму, женщин — в секретарши: этика в эпоху искусственного интеллекта

Если мы не знаем наверняка, как именно ИИ принимает решения, можем ли мы доверять этим решениям?

Кто и откуда постит фото в Твиттер

Масштабное исследование фотографий в Твиттере от Cultural Analytics Lab Льва Мановича

Кто это сказал? Разбирается Google AI

Как работает новый инструмент распознавания речи и автоматического определения говорящего

Роботы вступают в гонку вооружений: военные применения ИИ

Военные используют искусственный интеллект с момента его появления. Самонаводящиеся ракеты с компьютерным зрением поступили на вооружение еще в разгар Холодной войны, с начала 2000-х активно применяются беспилотные ударные дроны, обретающие все больше самостоятельности в решении вопросов жизни и смерти... Что дальше?

Baby ex machina: как алгоритмы понимают младенцев

Молодые родители учатся понимать новорожденного ценой нервов и бессонных ночей. Но скоро им на помощь могут прийти системы автоматического распознавания младенческого плача

Разбираем нейросети по частям: как работает градиентный спуск

Градиентный спуск — это способ поиска точек минимума или максимума в сложных функциях. Рассказываем, почему это так важно для обучения нейросетей

Судить журнал по обложке: 65 лет советской фотографии

Что может объединять мать художника-авангардиста Александра Родченко, Сталина и полуобнаженную девушку в джинсах? Все они в разное время появлялись на обложке журнала «Советское фото»

Порноренеcсанс: как секс-индустрия изменила нашу жизнь

Влияют ли порносайты на наши предпочтения в сексе? Чем опасны для людей порно-мемы? И при чем тут крысы, которых научили возбуждаться от запаха смерти? Разбираемся с причинами и последствиями эволюции вкусов зрителей порно в цифровую эпоху.

YouTube на русском, зулусском и урду: как тестируют перевод интерфейсов

Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском... А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?

Как находить похожие слова с помощью расстояния Левенштейна?

Когда в начале XX века в газетной статье «Пребывание вдовствующей императрицы Марии Федоровны в Финляндии» опечатались в первом слове, заменив «р» на «о», вышел жуткий скандал. А как находить такие близкие по написанию слова автоматически? Разбираемся с помощью питона и расстояния Левенштейна

Разбираем по частям научно-популярные ресурсы

Научпоп стремительно обзаводится почитателями по всему миру. Какие ученые хотят рассказать о своей работе больше всего, что ресурсы и паблики для этого делают и какими характеристиками обладает типичный научно-популярный текст?

Большие данные о языках в справочнике Ethnologue

Обзор самого известного онлайн-ресурса о языках мира: что можно узнать и кому это пригодится?

Соцсети русской драмы, часть II Ревизор vs. Городничий: кто же главный герой?

Как, сколько и с кем общаться, чтобы стать по-настоящему главным героем пьесы — отвечает математика

Семантические сети: как представить значения слов в виде графа

Компьютерные лингвисты из Вышки, университета Тренто и университета Осло разработали vec2graph — инструмент для визуализации семантической близости слов в виде сети. Воспользоваться vec2graph может любой желающий. Рассказываем, как это работает и зачем нужно

Акцентуаторы. Памяти А.А. Зализняка. Часть III

Великое, могучее, свободное, подвижное. От праславянской акцентуации к нейросетевым программам автоматической расстановки ударений

Когнитивная стилистика и образование речи

Никогда не задумывались, как мы строим предложения? Конечно, нет, это невозможно. Молодая наука когнитивная стилистика объясняет, почему

Цветокоррекции в стихах Сергея Есенина

Поэзия — цветной вид искусства. В отличие от фотографии и кино, она никогда не была черно-белой. Поэты в своем творчестве окрашивают не только физические объекты, но и запахи, звуки, тактильные ощущения… А можно ли исследовать цветовую картину мира отдельного поэта с помощью цифровых методов?

Как я перестал беспокоиться и полюбил СССР: операция Барбаросса на карте США

Карта времен Второй Мировой войны показала американцам масштабы военных действий и помогла ленд-лизу

Зачем нужна карта метафор?

На литературе в школе нас учили, что метафора — это что-то такое из стихов Пушкина. Помните, как учительница затирала про «образное сравнение»? Но на самом деле метафорами пронизан весь наш язык (даже эта фраза), и их исследование может многое сказать о том, как мы говорим и мыслим. А зачем нужна цифровая карта метафор?

Чем пахнут города?

Урбанисты добрались до запахов городов и составили интерактивную карту

Нейросеть-предатель: алгоритм обучили выявлять тексты-подделки

Нейросети научились неплохо подражать человеку в написании текста. Но теперь есть симметричный ответ: системы обнаружения текста, порожденного нейросетями. Запасаемся попкорном и следим за битвой брони и снаряда в искусственном интеллекте