День
открытых
данных
+ Workshop Week с 1 по 5 марта
6 марта 2021 года
Россия, онлайн
Трансляция
Программа
6 марта
День открытых данных
11:00
Открытие
11:15 - 12:15
Дискуссия. Бизнес на открытости: зачем заниматься открытым кодом и открытыми данными
Движение за открытые данные и открытый исходный код существует уже много лет, но многими воспринимается скорее как некоторая форма общественной деятельности, чем основа для устойчивой бизнес-модели. Тем не менее, в мире бизнес на открытости не редкость. Как строится такой бизнес и какие факторы определяют успешность этих компаний? Что лежит в основе таких бизнес-моделей и какие барьеры мешают возникновению большего числа проектов, использующих открытые данные и открытый код? И главное – почему их развитие может быть важно именно в России?

Спикеры:
  • Вера Адаева, директор Центра цифрового развития Агентства стратегических инициатив
  • Эльза Ганеева, менеджер по работе с государственными органами Microsoft в России
  • Максим Дубинин, генеральный директор NextGIS
  • Виктор Зефиров, советник Президента МАП по цифровым технологиям, вице-президент ООО НПП «Зелакс»
  • Олег Качанов, заместитель министра Министерства цифрового развития
  • Алексей Новодворский, заместитель генерального директора компании БазАльт
Модератор: Василий Буров, соучредитель АНО «Информационная культура»
12:20 - 13:20
Дискуссия. Как инструменты оценки влияют на открытость государства?
Ежегодно публикуются различные аналитические доклады и рейтинги, оценивающие уровень открытости государственных ведомств, влияние открытости данных на общественное развитие и инновации. Мы соберем на дискуссию создателей рейтингов, представителей государственных ведомств и общественных проектов, чтобы обсудить, какое воздействие оказывают инструменты оценки на открытость государства, стимулируют ли более открытые и доверительные взаимоотношения между гражданами и государством.

Спикеры:
  • Владимир Вакулов, заместитель директора Департамента развития цифровой экономики Минэкономразвития России
  • Вероника Криту, директор по стратегии и партнерствам Global Data Barometer
  • Ольга Пархимович, руководитель разработки проекта «Госрасходы» Счетной палаты РФ, руководитель проекта «Госзатраты»
  • Дарья Цыплакова, директор департамента исследований и методологии Счетной палаты
Модератор: Иван Бегтин, директор АНО «Информационная культура»
13:25 - 14:25
Дискуссия. Доступность данных о госфинансах
Доступность данных о госфинансах зависит, прежде всего, от открытости, формата представления и качества этих данных, а также от того, насколько эти данные понятны обычным гражданам, не обладающим экспертными знаниями. На дискуссии мы обсудим, какие проекты помогают сделать данные о госфинансах более доступными, с какими проблемами сталкиваются команды проектов, эксперты и пользователи открытых данных, какие шаги может предпринять сообщество, чтобы эти проблемы преодолеть.

Спикеры:
  • Альберт Бертяков, аналитик проекта «Госрасходы» Счетной палаты РФ
  • Александр Левашов, главный редактор TAdviser.ru
  • Наталия Лукьянова, начальник отдела по обеспечению открытости бюджета Комитета финансов Санкт-Петербурга
  • Ольга Панчихина, заместитель начальника Инспекции по аудиту национальных проектов, Счетная палата РФ

Модератор: Ольга Пархимович, руководитель разработки проекта «Госрасходы»
14:30 - 15:30
Дискуссия. Данные переписи населения 2021: приватность vs польза для общества
Всероссийская перепись населения пройдет в апреле 2021 года и станет третьей переписью, проведенной в современной России. С одной стороны, данные из переписных листов - это достаточно сензитивная персональная информация, безопасность которой должна быть дополнительно обеспечена государством. С другой стороны, перепись населения - один из самых масштабных дезагрегированных источников данных о социально-экономическом и демографическом состоянии российского общества. Эти данные представляют большой интерес для исследований и аналитики. На секции обсудим, в чем состоит дилемма "безопасность vs общественное благо" для данных переписей населения в России, можно ли организовать доступ к таким данным, без рисков деанонимизации, и как повысить ценность данных переписи населения для исследований и аналитики в России?

Спикеры:
  • Дмитрий Булгаков, первый заместитель начальника ГИАЦ МВД России
  • Витовт Копыток, руководитель проектного направления ЦПУР
  • Павел Смелов, заместитель руководителя Росстата
  • Михаил Третьяк, эксперт «РосКомСвободы» и партнёр Digital Rights Center
  • Евгений Яковлев, профессор РЭШ

Модератор: Михаил Комин, директор по исследованиям ЦПУР
15:35 - 15:55
Представление проекта Каталога образовательных материалов по открытости, инструментам и данным
Презентацию проведет Иван Бегтин, Директор АНО «Информационная культура»
16:00 - 17:00
Выступления. Что происходит с тематикой открытости в мире?
Сессия пройдет на английском языке с синхронным переводом
Движение за открытые данные переживает заметную трансформацию — мир переходит к «третьей волне» открытых данных. Если на предыдущем этапе преобладала концепция «открытости по умолчанию», которая вызывала много споров и возражений, то сейчас становится все более очевидной необходимость публикации данных для решения конкретных задач. Недостаточно просто публиковать данные, важно осознавать, какую реальную пользу эти данные могут принести обществу.

Мы пригласили представителей международных проектов, чтобы обсудить мировой опыт, который накоплен за эти годы.

Спикеры:
  • Джереми Роллисон, Senior Director European Government Affairs Microsoft
  • Годфри Такавараша, Data Manager at Humanitarian Data Exchange
  • Саркис Дарбинян, управляющий партнёр юридической фирмы Digital Rights Center, сооснователь «Роскомсвободы»
  • Иван Бегтин, директор АНО «Информационная культура»
17:00 - 17:15
Закрытие
Прошедшие мероприятия
1-5 марта
Workshop Week 2021
Накануне Дня открытых данных пройдет серия мастер-классов по работе с данными. Чтобы принять участие в мастер-классах, достаточно один раз зарегистрироваться на все событие.
1 марта, мастер-класс «Вскрываем декларации. Как при помощи регулярных выражений привести Word'овскую табличку к пригодной для анализа форме»
Дата и время: 1 марта, 18:00-19:30
Формат: онлайн

Иногда журналистам и аналитикам приходится работать с таблицами, которые не пригодны для анализа. Перед началом работы такие таблицы надо «очищать» — убрать все сдвоенные ячейки; заставить табличный редактор правильно определять числа и разнести каждое свойство изучаемого объекта в разные колонки.

Мы рассмотрим один из примеров такого «сложного» датасета — декларации чиновников — и научимся «очищать» его автоматическим образом. Для этого мы изучим основы работы с регулярными выражениями — шаблонами для поиска и извлечения текстов.

Мастер-класс проведет Алексей Смагин, дата-журналист в Тинькофф-журнале; приглашённый преподаватель курсов по журналистике данных в ВШЭ.

Технологии: Google Docs, регулярные выражения.

Требования к участникам: базовое понимание Excel (формулы, сводные таблицы, автозаполнение).

Видеозапись
Материалы
2 марта, мастер-класс «О чем говорят депутаты Госдумы? Анализ текстовых данных на Python»
Дата и время: 2 марта, 18:00-19:30
Формат: онлайн

Вместе с дата-сайентистом Дмитрием Сергеевым проанализируем, о чем за 20 лет говорили депутаты разных партий, как менялось содержание их выступлений по годам, что изменилось в гендерном балансе Думы последнего созыва и как это повлияло на риторику.

Мастер-класс проведет Дмитрий Сергеев, Senior Data Scientist OURA, руководитель курсов по машинному обучению в Otus.ru.

Данные: транскрипты всех выступлений депутатов Государственной Думы с 2000 года.

Технологии: Python, сбор данных через API, Natural Language Processing (NLP), тематическое моделирование, визуализация данных.

Требования к участникам: базового знания Python будет достаточно для понимания происходящего, но присоединяться можно и без навыков программирования.

Видеозапись
Репозиторий (скоро появится код мастер-класса)
3 марта, мастер-класс «Создание карт без специального программного обеспечения»
Дата и время: 3 марта, 18:00-19:00
Формат: онлайн

Если вы всегда хотели сделать красивую карту, но боялись сложностей работы с геоинформационными системами или не умеете программировать, то этот воркшоп для вас. Сервис unfolded.ai позволяет создать красивые и эффектные карты прямо в браузере всего с помощью нескольких кликов.

Мастер-класс проведет Татьяна Балтыжакова, к.т.н., ассистент кафедры инженерной геодезии Санкт-Петербургского горного университета, автор телеграм-канала Geodatamess https://t.me/geomess.

Видеозапись
Репозиторий
3 марта, мастер-класс «Краткий обзор OS-фреймворков для сетевого анализа городской среды на примере задачи построения изохрон»

Дата и время: 3 марта, 19:00-20:00
Формат: онлайн

При работе с городскими данными часто используются метрики соседства — наличие рядом (в зоне доступности, соответствующей какому-то времени пешей прогулки или поездки) с анализируемой точкой магазинов, учреждений, транспортной инфраструктуры и т.д., а также расстояние до этих объектов. Можно считать эти зоны и расстояния между точками геометрически (линейные расстояния, зоны доступности в виде круга), а можно — учитывая граф дорог.

Леонид Крылов
, ведущий аналитик в команде Гео, Big Data Beeline, проведет обзор open source решений и проблем, связанных с зонами доступности и графовыми задачами. Ответит на вопросы: зачем нужен сетевой географический анализ; какие фреймворки для сетевого анализа существуют; как решить задачу построения изохрон разными фреймворками.

Видеозапись
Репозиторий
4 марта, мастер-класс «Формирование карт данных для решения социально-экономических задач»
Дата и время: 4 марта, 15:00-16:30
Формат: онлайн

Эффективное использование данных может помочь в решении глобальных социальных задач, которые не решались ранее из-за недостаточного развития технологий, способных анализировать большие массивы данных. Уже существует множество примеров успешно реализованных цифровых сервисов на данных, которые работают во благо общества.


На мастер-классе спикеры расскажут про то, как строить карты данных и их спецификации для решения задач по снижению уровня бедности и прогнозированию профессий будущего. Эти и другие задачи предлагаются участникам в рамках Конкурса цифровых решений АСИ – World AI&Data Challenge. Подробнее о проекте: https://datamasters.ru/aianddata


Спикеры:

● Вера Адаева, директор Центра цифрового развития АСИ.

● Яна Коваленко, директор проектов Центра цифрового развития АСИ.

● Андрей Петров, руководитель программы Центра цифрового развития АСИ.


5 марта, мастер-класс «Российская официальная статистика: как сделать работу с данными удобнее, а данные — понятнее?»
Дата и время: 5 марта, 16:00-17:30
Формат: онлайн

Росстат собирает и публикует более 5 тысяч базовых показателей. С учетом длинных временных рядов, географических и отраслевых разрезов пользователи получают возможность работать с более чем 700 тысячами различных индикаторов и значений. Однако эти данные не всегда представлены в удобном для машинного анализа виде, что усложняет работу исследователей и дата-аналитиков. В рамках мастер-класса предлагаем обсудить уже имеющиеся решения и алгоритмы, повышающие удобство работы с данными Росстата, наиболее актуальные ключевые запросы от пользователей, а также решения и планы ведомства, которые позволят повысить доступность и качество публикуемых данных.

Спикеры:
● Юлия Хабибуллина, дата-аналитик ЦПУР. Тема выступления: «Panel Data, база данных, граф: инструменты для работы с данными Росстата для исследователей»;
● Анна Богомолова, представитель УИС «Россия». Анна расскажет о показателях, форматах и способах организации данных Росстата в системе УИС "Россия";
Григорий Остапенко, заместитель руководителя Росстата. Тема выступления: «Росстат меняется: как цифровая трансформация ведомства повысит удобство работы с данными?».

Модератор: Михаил Комин, директор по исследованиям ЦПУР
5 марта, мастер-класс «Визуализация данных в ObservableHQ»
Дата и время: 5 марта, 18:00-19:30
Формат: онлайн

На мастер-классе вы научитесь пользоваться ObservableHQ для визуализации данных и прототипирования интерактивной инфографики. Познакомимся с сервисом, обсудим разные возможности его применения, загрузим данные, проведем их обработку и визуализацию с помощью Vega Lite. Научимся оттачивать дизайн визуализаций в Vega Lite и использовать их в других проектах.

Мастер-класс проведет Глеб Тржемецкий, дизайнер отдела инфографики студии дизайна ТАСС. Автор интерактивных проектов, удостоенных наград Red Dot и Information is Beautiful.

Все необходимые материалы соберем во время вебинара. Желательно, но не обязательно иметь начальные знания в JavaScript и HTML. Материалы мастер-класса:
- https://www.dropbox.com/sh/bk7mfb2ljdhnn0j/AAAZ-G-gKyUEZdncfftWdo2wa?dl=0
- https://observablehq.com/@glebtr/mc-2021
- https://observablehq.com/@glebtr

Видеозапись

После мастер-класса, в 19:30 (МСК), состоится подведение итогов Moscow Dataviz Awards — 2021 — ежегодной международной премии за достижения в области инфографики, визуализации данных и дата-арта (moscowdatavizawards.com).
Инфокультура и Ассоциация участников рынка данных приглашают на День открытых данных 2021
Это событие — часть международной инициативы International Open Data Day, которая помогает продвигать концепцию открытых данных и информационной прозрачности деятельности органов государственной власти, бизнеса, некоммерческих организаций и других участников общественной жизни. В честь Дня открытых данных по всему миру проходят конференции, лекции, мастер-классы, хакатоны.
Что мы приготовили для вас в 2021 году?
Workshop Week
Серия мастер-классов о том, какие проекты можно создавать на основе открытых данных. Покажем, как анализировать и визуализировать данные, как создавать интерактивные карты и работать с геоданными.
Дискуссии и выступления
Применение данных для решения общественных проблем, бизнес на открытости, доступность данных о госфинансах и переписи населения. Мы пригласили к участию в дискуссиях российских и международных экспертов, чтобы обсудить, что происходит с открытыми данными в России и мире.
Датавиз-премия
Второй раз ко Дню открытых данных приурочена премия Moscow Dataviz Awards. На этот раз организаторы решили выйти за пределы России — в премии участвуют проекты не только из России, но и из Беларуси, Украины, Молдовы, Казахстана, Армении, Азербайджана, Грузии, Кыргызстана, Таджикистана, Узбекистана, Туркменистана и других стран.
Лонг-лист премии
Спикеры
Организаторы
Партнёры