С тех пор, как королева Виктория взошла на трон, Земельный кадастр Её Величества фиксировал все изменения в праве собственности на территории Англии и Уэльса – это гора данных, которая выросла за десятилетия до более чем 25 миллионов наименований документов, охватывающих 87% земель на этих территориях. И, как говорят англичане, они только начали. Цель Земельного кадастра Ее Величества заключается в том, чтобы «стать ведущим мировым земельным реестром в плане скорости, простоты и открытости доступа к данным.»
Каждый день Земельный кадастр Ее Величества получает от 2000 до 3000 бумажных заявок, чертежей, фотографий и удостоверений личности, которые должны быть обработаны силами компании Xerox на ее удаленных площадках.
«Сохранение целостности Земельного Реестра Англии и Уэльса, в то же время обеспечивая отличное обслуживание клиентов, является нашей целью», – говорит Ив Фостер, руководитель Центрального оперативного управления, Земельного Кадастра Ее Величества. «С компанией Xerox, в качестве проводника между физическим и цифровым мирами, наши процессы более эффективны – без какого-либо компромисса в области качества.»
Все началось четыре года назад, когда Земельный кадастр Ее Величества запустил проект с Xerox, с целью преобразования своего бумажного каталога и создания процесса перевода документов в цифровую систему, которая, в итоге, модернизирует весь документооборот.
Используя платформу Xerox Production Workflow Management, Xerox начала внедрять новые приложения для извлечения ключевых данных, включая как текстовую информацию, так и изображения. Поскольку на основании данных из этих документов людьми принимаются крупные финансовые и юридические решения, здесь нет места ошибкам при сканировании, отсутствию данных или нечитаемым записям.
«Все дело в качестве», – говорит Ник Клиффорд, клиент-менеджер Xerox, который работает с Земельным кадастром Ее Величества. «Качество данных должно быть как можно ближе к совершенству.» Насколько ближе? «Точность ввода данных должна быть на 99,5% или выше», - говорит Клиффорд. «Контроль качества чрезвычайно серьёзен.»
Документы часто включают фотографии, рисунки и прописной текст. Автоматизация извлечения данных из этих видов документов в прошлом, как правило, требовала дополнительных человеческих ресурсов, при этом ответственные сотрудники дважды проверяли и повторно вводили неправильные или неполные данные.
В целях сокращения объема работы Xerox и Земельный кадастр Ее Величества работают над экспериментальной программой по включению в процесс распознавания данных искусственного интеллекта и машинного обучения для постепенной передачи части работы от людей к машинам. Новый сервис на базе платформы Xerox Production Workflow Management предназначен для улучшения процесса оптического распознавания символов, и может обучаться в процессе ручного сканирования и распознавания. Идея заключается в том, что каждая итерация извлечения данных (комбинируя автоматизацию и человеческий интеллекта) со временем повысит точность распознавания. В итоге эта технология позволит сократить количество ручных операций, выполняемых человеком, лишь до небольшого процента из наиболее сложных, к примеру таких, как устный перевод рукописей.
На данный момент система (пока с поддержкой индексации силами сотрудников) может распознать, что написанное вручную «t», которое выглядит как «7» на самом деле «t». В итоге, после завершения процесса тестирования и обучения, платформа будет способна распознать многие вариации буквы «t» и проверит их без участия человека.
В будущем Земельный кадастр Ее Величества надеется исключить любое вмешательство человека в простые прикладные операции, сохранив при этом свой исторический архив и выведя свою производительность на новый уровень.