Россия: рынок госданных только формируется, но уже в кризисе
Рынок открытых данных госструктур, способный принести миллиарды в экономику, слабо развит и вызывает множество претензий у IT-специалистов.
Госсектор в ходе своей работы накапливает большое количество данных, которые могут быть повторно использованы в коммерческих и некоммерческих целях. Потенциал такого использования очень высок и может принести миллиарды в экономику.
Однако степень открытости госданных в России эксперты считают крайне низкой. Доступ к ним организован плохо, сопровождается множеством барьеров, сами сервисы систематически не работают, утверждают они. Кроме того, ведомства порой предоставляют доступ одним организациям, отказывая другим, в чем специалисты усматривают признаки коррупции.
Кому и зачем нужны госданные
В США и Западной Европе предоставляемые государственными ведомствами данные лежат в основе множества популярных приложений, благодаря которым миллионы пользователей могут, например, легко найти нужный адрес в незнакомом месте, принять информированное решение при покупке недвижимости, получить информацию о наиболее опасных с точки зрения преступности районах, с точностью до минуты спланировать поездку в общественном транспорте, и т.д.
Это не только удобно и выгодно пользователям, но также помогает бизнесу, создает рабочие места и в целом стимулирует развитие экономики. Как пишет в своем отчете аналитический центр при правительстве РФ со ссылкой на консалтинговую компанию Deloitte (США), прямой коммерческий эффект от использованиях данных госсектора в мире (стоимость продуктов, созданных с использованием госданных) вырос со 140 млрд евро в 2010 году до 220 млрд в 2017-м. А косвенный эффект (стоимость товаров и услуг, созданных на основе таких продуктов) — со 110 млрд до 170 млрд евро.
Аналогичных оценок по России нет. Российский рынок только пользовательских (часто персональных) данных, которые генерируются как госсектором, так и частными предприятиями (например, банками, ретейлерами или операторами связи), компания OneAudience (США) оценила в 2018 году в $34,2 млн (2,2 млрд рублей), что на 39,8% больше 2017 года. По итогам 2019 года она ожидает рост до $73,3 млн (4,7 млрд рублей). «РосБизнесКонсалтинг» в 2017 году оценивал объем российского рынка покупки и продажи пользовательских данных в 3,3 млрд рублей.
Государственные данные используются в самых разнообразных целях. В России есть проекты по отслеживанию госзаказов («Ростендер», «Закупки360», «Бикотендер»), по анализу контрагентов («СПАРК-Интерфакс», «Коммерсантъ-Картотека», «Контур-фокус»). По данным Kartoteka.ru, выручка ООО «Коммерсантъ картотека» в 2018 году составила 398,5 млн рублей, выручка АО «Производственная фирма "СКБ Контур"» — 12,8 млрд рублей (помимо «Контур-фокус», фирма предлагает сервисы и оказывает разнообразные услуги и в сфере бухгалтерии, торгов и документооборота).
Как пишет в своей статье директор организации «Информационная культура» Иван Бегтин, подобные компании смешивают открытые госданные и те, которые они получают из коммерческих источников, создавая таким образом свой продукт.
Существуют также некоммерческие проекты. Компания Tadata, например, сделала всероссийскую «Карту ДТП» (основана на извлечении данных из системы ГИБДД, исходный код выложен на Github), где можно получить интерактивную статистику аварий, включая схему ДТП, сведения по пострадавшим и погибшим, марки автомобилей и информацию о дорожных и погодных условиях.
Роль открытости госданных для экономики
В России рынок госданных находится на этапе формирования. При этом во многих сферах в последние годы доступ к ним затруднен (например, к данным о госрасходах, реестрам юрлиц и недвижимости, картографическим данным), информация в них не всегда находится в машиночитаемом формате и обновляется она нерегулярно, говорится в докладе аналитического центра при правительстве РФ.
Около пяти лет назад в правительстве РФ был тренд по раскрытию госданных, однако в последнее время он практически остановился, говорит основатель Tadata Сергей Устинов.
«Есть подвижки со стороны отдельных ведомств — Минкульта, Минфина например. Но общий тренд отрицательный. В новой программе о цифровой трансформации [государственных услуг] про открытость данных практически ничего нет», — сказал он.
Между тем, по мнению Устинова, открытость данных имеет большое значение для экономики.
«Чем больше данных, тем больше сервисов и продуктов создается, тем больше возможностей для развития IT-сферы, тем больше пользы для некоммерческих организаций, которые могут использовать эти данные, для журналистов, которые пишут исследования и расследования [а также для научных кругов]. Данные стали фактором производства — как земля или деньги», — отметил он.
Схожей с Устиновым позиции придерживается и гендиректор агентства «Рустелеком» Юрий Брюквин.
«Значение данных для экономики трудно переоценить. Взять хотя бы госзаказ, который чуть ли не фундаментальная вещь для бизнеса. Заявиться на конкурсы без анализа данных о торгах — из области фантастики. Мы, разумеется, не берем случаи, когда используется административный ресурс или имеет место коррупция», — сказал Брюквин.
Среди других примеров — данные Росреестра, необходимые бизнесу, который работает с недвижимостью.
«Уже две недели практически не работает сервис Росреестра. Для бизнеса, которому нужны выписки из реестра недвижимости, это означает зависание сделок. Ситуация с этим систематическим кризисом доступа к госданным не решается годами, хотя это не только обязанность власти, но и не такой уж серьезный труд», — добавил Брюквин.
Согласно оценке Высшей школы экономики, возможный экономический эффект от использования основанных на госданных приложений только лишь в сфере общественного транспорта и в одной только Москве может составить 58,7 млрд рублей в год.
Качество госданных вызывает вопросы
Состояние госданных находится в ужасном состоянии, считает бывший журналист газеты «Коммерсантъ» Борис Горлин, который занимается разработкой программного обеспечения в области Data Science.
«Это боль и стыд», — сказал он, приводя в качестве примера информационную систему Росреестра, в работе которой наблюдались проблемы во второй половине ноября.
«Дело даже не в том, что система падает намертво время от времени, к этому все давно привыкли. Попробуйте в ней найти какой-нибудь объект по сложному адресу, когда в нем есть строение или литера, или корпус, или владение, или все вместе взятое. В поиске Росреестра даже нет возможности задать эти позиции, есть только номер дома, и все. Еще могу открыть страшную тайну, что кривой клиентский код Росреестра де-факто дидосит свой же собственный сервер», — объяснил Горлин.
По его мнению, «верхом цинизма» является то, что Росреестр продает доступ к своим системам за деньги, однако «необходимость ввода капчи, даже если ты заплатил за "сервис", не исчезает» (капча создает препятствия на пути машинного доступа к содержимому информационных систем, препятствуя автоматизации процесса).
Со схожими проблемами с адресами, по словам Горлина, сталкиваются и пользователи системы ФИАС Федеральной налоговой службы.
Другим примером является система ГАС «Правосудие» (данные о судебных делах). В ней, по словам Горлина, нет возможности поиска по целому ряду регионов.
«Информация по ним размыта по каким-то другим неочевидным ресурсам. А в Москве у судебного департамента вообще своя собственная информационная система, не имеющая ничего общего с ГАС "Правосудие". Я уже молчу о том, какие удивительные данные можно [в ГАС "Правосудие"] найти. Например, дела с датой рассмотрения в 2030 году», — сказал он.
Проблемной является и система ГИС «ЖКХ». Большое число участников рынка жилищно-коммунальных услуг обязаны постоянно передавать в нее данные, однако никто не понимает, зачем это нужно и как они используются государством, утверждает Горлин.
«В моей практике случалось, когда большие компании [сферы ЖКХ] были вынуждены нанимать целые отделы, которые занимались только тем, что готовили данные для ГИС “ЖКХ” и отправляли их туда. И, разумеется, все [подобные] затраты отражаются на тарифах [на услуги ЖКХ]», — отметил он.
Наконец, есть сложности с сервисами ГИБДД. В качестве защиты от спама в некоторых своих сервисах инспекция установила капчу reCaptcha v3 компании Google, что, по словам Горлина, также осложняет автоматический доступ к данным.
По словам Юрия Брюквина, есть направления, где проблемы с качеством и полнотой данных не решаются годами. В данных Федерального казначейства, где выкладывается отчетность по расходованию бюджетных средств, присутствуют регионы, которые «систематически не выкладывают эти данные, годами», отметил он.
«Что, об этом не знают? Знают, конечно, но ничего не делают», — сказал Брюквин.
Проблемы конкуренции и коррупция
На фоне этих проблем образовался рынок торговли бесплатными (или очень дешевыми) государственными данными, но в более удобной форме. К примеру, выписка о собственниках недвижимости из Росреестра стоит от нескольких копеек до трех рублей (ее может получить любой желающий после регистрации и оплаты), при этом множество компаний-посредников предоставляют эти же самые данные в более удобном виде, но за 50-500 рублей за выписку, сообщил Юрий Брюквин.
«То же самое происходит с сервисами ФНС, с сервисами по предоставлению бухгалтерской отчетности компаний. Это целая индустрия с огромными оборотами», — сказал он.
По убеждению Брюквина, такие организации существуют только по одной причине — из-за низкого качества работы сервисов по предоставлению госданных.
«В любом направлении капнуть — реализовано все очень плохо и во многих случаях нет свободно доступа [который предоставляет госструктура]. Целый ряд барьеров установлен, чтобы ты не получил эти данные. Разнообразные обходные пути существуют по этой причине», — говорит Брюквин.
Некоторые госструктуры, по его словам, предоставляют доступ одним организациям, отказывая другим. Получить доступ, не имея специальных договоренностей, практически нереально.
«У Росреестра запредельные требования для подключения к API, очень сложно их реализовать: зачем-то там присутствует система шифрования и прочее. Но даже если все это сделать, нет гарантий, что тебе дадут доступ. Когда Росреестр дает доступ сторонним организациям, которые в сотни раз дороже продают выписки, он об этом не знает? Конечно, знает. И закрывает на это глаза. И, очевидно, не просто так», — убежден Брюквин.
«Вопиющий пример — доступ к картотеке арбитражных дел. Там тоже есть посредник, не хочу его называть, но все его знают на рынке. Он получает информацию раньше, чем она выкладывается в данных арбитража», — сказал он.
С оценкой Брюквин согласен и Борис Горлин.
«Одни участники рынка получают данные напрямую от близких к себе государственных структур, другие [вынуждены] действовать иначе [получать данные собственными, не всегда простыми методами]», — отметил Горлин.
Подписывайтесь на бесплатную еженедельную рассылку Eurasianet (на английском языке).