ivdon3@bk.ru
В данной работе описываются подходы к визуализации и сравнению семантических деревьев, отражающих компонентную структуру патентуемого устройства и связи между ними, при помощи графовых баз данных. Данные СУБД используют графовые структуры для хранения, обработки и представления данных. Основные элементы графовой базы данных - узлы (nodes) и ребра (edges), которые в рамках поставленной задачи моделируют сущности 3-х типов (SYSTEM, COMPONENT, ATTRIBUTE) и 5 типов связей (PART-OF, LOCATED-AT, CONNECTED-WITH, ATTRIBUTE-FOR, IN-MANNER-OF). По результатам исследования можно заявить, что Neo4j демонстрирует наилучшие возможности для визуализации графов; ArangoDB несмотря на правильно введённые запросы, осуществляет неполную визуализацию; AllegroGraph показал сложную работу с кодом, затрудненную настройку визуализации графового дерева. Апробированы 3 алгоритма сравнения графовых представлений информации: Graph Edit Distance, Topological Comparison, Subgraph Isomorphism. Алгоритмы реализован на python, сравнивает 2 графовых дерева, выводит на экран визуализацию и анализ общих структур и различий графов.
Ключевые слова: семантическое дерево, компонентная структура, патент, графовые БД, Neo4j, AllegroGraph, ArangoDB