«Практически в каждом ведомстве сейчас стоят задачи по переходу от документированной информации к структурированным и связанным наборам данных», — говорит основатель компании «Биорг» Георгий Зуев. В Татарстан пришел лидер российского рынка обработки данных, который с помощью собственной платформы Beorg: Smart Vision* извлекает и анализирует информацию с различных носителей. Такие современные технологии позволяют модерировать контент, готовить дата-сеты и эталонные данные для конечных систем. О том, как можно в сферу госуправления внедрить одни из наиболее передовых технологических, организационных решений и при этом привлечь к достижению стратегических целей обычных жителей страны, — в нашем материале.
«Практически в каждом ведомстве сейчас стоят задачи по переходу от документированной информации к структурированным и связанным наборам данных»
Заказчик платит только за достоверные и верифицированные данные — за результат
Компанию «Биорг» на рынке знают как провайдера масштабной оцифровки информации с бумажных документов. Ее история началась в 2003 году, с создания «Биорг Скан Центра» и предоставления услуг в области ресурсоемких работ по сканированию документов для корпоративных заказчиков. К 2007 году проект сфокусировался на рынке автоматизации и перевода документов в электронный вид уже под брендом «Биорг».
«Объемы и сложность работ возрастали и служили предпосылками для создания интеллектуальной онлайн-платформы Beorg Smart Vision на основе нейронных сетей и краудсорсингового сервиса, — рассказывает директор направления государственных программ компании „Биорг“ Александр Миронов. — С 2017 года „Биорг“ является разработчиком и поставщиком SaaS**-сервисов на базе данной платформы, с помощью которой компании распознают одни из самых сложных объектов и данных, включая рукописный текст на различных языках, аудио- и видеофайлы».
Схема работы сервиса
Как утверждает наш собеседник, на сегодня не существует программы, которая автоматически и безошибочно сможет распознать неструктурируемый, разноформатный рукописный текст. Процесс либо полностью передают на ручной операторский ввод, а это значит, возрастает риск ошибки из-за влияния человеческого фактора, сложности с трудоустройством и масштабированием процесса, маленькая скорость обработки документов, либо соглашаются на автоматическое распознавание, но без требования к качеству. Компания «Биорг» предлагает уникальное на рынке решение по извлечению данных с рукописных документов за счет ноу-хау, сочетающего возможности человеческого и искусственного интеллекта.
«Важно отметить, что мы предлагаем сервис под ключ, где заказчик платит только за достоверные и верифицированные данные — за результат. Эта услуга на рынке очень востребована, так как в нашей большой стране огромное количество предприятий, ведомств с накопленным архивом. Согласно тенденции цифровизации, все стараются перевести информацию в электронный вид», — отмечает Миронов. Цифровые данные позволяют компаниям экономить миллионы рублей на поиске информации, принятии выверенных управленческих решений на основе статистики, прогнозировании развития компании, оптимизации расходов.
Как известно, по всей России, в том числе и в Татарстане, в последние годы активно реализуются государственные проекты, связанные с развитием цифровых ресурсов органов власти. Благодаря переводу документооборота и архивов в «цифру» ускоряется процесс поиска информации, упрощается межведомственный обмен данными, а сама информация страхуется от утраты в результате чрезвычайных происшествий вроде пожара или наводнения.
Компания «Биорг» взялась и с блеском выполнила задачу федерального уровня — по наполнению единого государственного реестра (ЕГР) загса. По всей стране нужно было конвертировать более 550 млн актовых записей. «Биорг» стал одним из крупнейших подрядчиков по конвертации актовых записей, обработав порядка 43 млн записей по всей России. Такой проект позволил уверенно заявить о себе и положил начало крепкой деловой репутации — сегодня среди заказчиков «Биорга» числятся корпоративные и финансовые организации, госкорпорации, госструктуры. Среди них — «Роснефть», Tele2 (для федерального мобильного оператора «Биорг» обработал 15 тонн документов за три месяца), НЛМК, аэропорт Шереметьево, БКС, Московская биржа, УБРИР, ФСИН и другие.
Стать частью краудсорсинговой платформы может любой гражданин России, получив белый заработок и новую профессию
«Проекты загса стали отличной основой для развития бизнеса на новом рынке, — комментирует Миронов. — Мы разобрались, как работать с государственными заказчиками, какие у них боли и потребности. Научили наши нейросети работать с трудночитаемым рукописным текстом на, пожалуй, одном из самых больших обучающих дата-сетов объемом примерно в миллиард сведений. Развили краудсорсинговую часть платформы, в которой операторы проводят разметку данных для обучения нейросетей и верифицируют информацию перед передачей заказчику».
Искусственный интеллект развивается семимильными шагами, но он не всемогущ, и на помощь ему приходят «живые» специалисты. В структуру «Биорг» входит краудсорсинговый сервис, насчитывающий более 55 тыс. операторов — население маленького города. При оцифровке могут потребоваться разные специалисты, это и электрики, и инженеры, и картографы-геодезисты, и переводчики, и финансисты — все зависит от архива и хранимой в нем информации, а также требований заказчика.
«Мы используем ансамбль из 11 нейросетевых алгоритмов для обработки документов, но нейросети не всегда справляются ввиду того, что всплывают определенные сложности: корявый почерк, сокращения, артефакты, мешающие определению текста, и так далее, — поясняет наш собеседник. — Чтобы гарантировать заказчикам качество на уровне 99 процентов плюс стабильную работу 24/7, даже в пиковые нагрузки требуется огромный штат обученных специалистов. И мы его набрали. Эта платформа очень гибкая, может в короткие сроки масштабироваться под нужды конкретного проекта. Так, например, под проект по конвертации АГС в загсе Тамбовской области мы в течение нескольких дней привлекли, обучили и трудоустроили более 500 специалистов».
Тем самым, отмечает наш собеседник, «Биорг» берет на себя и определенную социальную функцию — обеспечение массового трудоустройства и занятости. Все граждане РФ старше 18 лет, включая социально незащищенные слои населения, для которых работа из дома может являться единственным источникам заработка, в любой момент могут примкнуть к операторскому пулу краудсорсинговой платформы и получить не просто дополнительный, полностью белый источник заработка, но и новую профессию. Государству краудсорсинг помогает решать различные макрозадачи даже в экономически депрессивных регионах, где наблюдается нехватка квалифицированных кадров и низкий уровень дохода населения. Бизнесу краудсорсинговый сервис и искусственный интеллект позволяют автоматизировать различные рутинные операции с минимальными издержками без необходимости содержать многочисленный штат сотрудников для выполнения рутинных операций, создавать электронные архивы c возможностью поиска по заданным критериям.
Кроме того, крупные корпорации могут использовать краудсорсинговую платформу на условиях аутсорсинга для реализации социально значимых проектов, привлекая к работе жителей моногородов с высоким уровнем безработицы.
«Заказчики, исторически работающие на бумаге, тяжело представляют себе, как все будет работать и взаимодействовать в цифровом пространстве, — говорит наш собеседник. — Чтобы развеять все сомнения, мы предлагаем партнерам провести пилотный проект, который покажет скорость работы, качество и удобство. В Татарстане у нас есть обособленное подразделение, расположенное в Иннополисе. Мы сразу же поможем выстроить логику работы в „цифре“. От заказчика требуется только описать задачи, предоставить документы и на этапе приемки убедиться в качестве полученного результата. Все остальное мы берем на себя».
Что касается сроков выполнения, они зависят от запроса заказчика, от документов, количества атрибутов, от того, в каком формате предоставлять результат, и т. д.
Важный вопрос — конфиденциальность и безопасность данных. У «Биорга» для работы с персональными данными имеются все необходимые разрешения: лицензии ФСТЭК, ФСБ, компания зарегистрирована в реестре в качестве оператора персональных данных, все данные хранятся и обрабатываются на территории РФ, а профессиональная ответственность и претензии третьих лиц застрахованы.
«Для еще более высокой надежности мы деперсонализируем данные — режем цифровое изображение на фрагменты, — заключает Миронов. — Наши операторы не видят документ целиком и не могут сопоставить, например, фамилию с отчеством или адресом проживания».
Контакты:
Александр Миронов — директор направления государственных программ.
Тел: +7 495 739-92-37 (143)
Электронный адрес: aleksandr.mironov@beorg.ru
ООО «Биорг»
Электронный адрес: info@beorg.ru
Тел: +7 495 739-92-37
*Биорг Смарт Вижн
**Саас