Викиданные (Wikidata) - это проект Викимедиа, который является свободной базой знаний.
Сейчас этот проект содержит около 20 миллионов элементов связанных данных. Как и во всех других проектах Викимедиа, любой желающий может улучшить существующий элемент, или добавить новый, если он соответствует критериям значимости.
Каждый элемент Викиданных имеет постоянный идентификатор и URI. Для улучшения можно добавить элементу метку (название), псевдонимы (альтернативные названия), краткое описание (помогает разрешить неоднозначность для элементов с одинаковыми метками), ссылки на связанные с элементом объекты из других проектов Викимедиа (например, статьи из Википедии).
Также можно описать элементы свойствами. Благодаря свойствам элементы можно связывать между собой по принципу "объект-предикат-субъект". Свойства здесь выступают в качестве предикатов. В качестве субъекта может выступать как другой элемент, так и литерал (строка, число, URL и т.д.) Сейчас в проекте около 2000 свойств. Они подобны элементам и тоже имеют постоянный идентификатор, метку, описание и прочее.
Значительную часть Викиданных занимают элементы об административно-территориальных единицах. Пока набор этих элементов неполон и плохо связан (не хватает многих элементов о сельских населённых пунктах, городах, округах, сельсоветах; деревни не всегда связаны со своими сельсоветами, районы - с областями). Также у большинства этих элементов отсутсвуют метки, описания, не указаны многие свойства, в том числе ОКАТО и ОКТМО.
Валидатор предоставляет удобный способ увидеть текущую ситуацию с элементами административно-территориального деления в разрезе наличия у них кодов ОКАТО и ОКТМО. Можно оценить, каких элементов не хватает, какие элементы недостаточно или неверно описаны.
Каждый понедельник валидатор получает дамп Викиданных в формате JSON. Из этого дампа импортируются элементы, имеющие свойство с идентификатором P721 (код ОКАТО) или P764 (код ОКТМО). Далее валидатор отмечает по соответствующим классификаторам, какие коды найдены у элементов, выполняет подсчет найденных кодов, а также выявление кодов с ошибками или устаревших.
Результат работы валидатора можно увидеть здесь.