15 декабря, 2015

Методы поиска изображений промышленного дизайна (ПИС 2012 №2)

Л.Г.Кравец,Главный редактор журнала “Патентная информация сегодня”, к.ф.н., доцент

В Интернете появилось множество онлайновых библиотек типа ShutterStock® (http://www.shutterstock.com/), FotoSearch® (http://www.fotosearch.com) и прочих информационных массивов, содержащих  миллионы различных изображений, которые могут быть использованы в промышленном дизайне.  Это обострило необходимость совершенствования методов индексирования и поиска изобразительной информации. Среди ученых  преобладают два подхода к поиску изображений: «концептуальный» и «содержательный».  Первый из них основан на использовании при поиске текстовых элементов (например, заглавий  или  ключевых слов), а второй – зрительных элементов  искомых изображений. Хотя в последнее время исследования концентрируются больше на втором подходе, основанные только на нем поисковые системы не удовлетворяют, в должной степени, нужд пользователей.

Использование текстового описания изобразительных элементов

Крупнейшие провайдеры информационно-поисковых услуг типа Google Images® (http://images.google.com) and Yahoo!® (http://images.search.yahoo.com/) пользуются текстовыми описаниями встречающихся в сети изображений (заглавиями, аннотациями и т.п.). Однако эти системы не подвергают текстовые описания семантическому анализу и поэтому не могут применяться для поиска концептуально сложных изображений. Большинство изображений сопровождается составленными вручную аннотациями. Однако в них встречается много неточностей,   субъективизма и неправильного толкования  многозначных слов. Устранению этих недостатков способствовала бы система, способная извлекать семантическое значение изображений посредством автоматизированного  анализа текстов. Автоматизированная система, способная вскрывать посредством текстового анализа семантическое значение изображений, облегчила бы снижение неоднозначности ключевых слов. Для этого можно воспользоваться методом семантического индексирования и поиска изображений (SDNA), основанным на лексической онтологии.

Семантическое индексирование изображений.

Предлагается метод вскрытия  «семантического ДНК» ( SDNA) с использованием онтологического  словаря, основанного на онлайновой версии тезауруса Roget’s Thesaurus.В отличие от обычных словарей, толкующих значения слов, тезаурус группирует слова вокруг выражаемых ими идей. В методике используются 6 уровней онтологической иерархии (от класса слов до частей речи), которые представляют «ДНК последовательности»  словесных значений. Одно из достоинств тезауруса – способность идентификации значений слов в разных контекстах. Поэтому слово располагается в иерархической структуре в зависимости от его контекстуальной идеи. Семантическое индексирование изображений начинается с выделения лексем (отдельных слов во всей системе их значений и форм) из аннотаций изображений, представленных пользователями и  отбора «семантической ДНК» для определения места каждой лексемы в иерархической структуре тезауруса. Каждая выделенная в тексте лексема подвергается  процессу устранения неоднозначности ее смысла посредством определения ее контекстуального значения. Затем проводится оценка сходства ее «семантической ДНК» со всеми вариантами, содержащимися в таблице контекстуальных значений, для отбора наиболее релевантного.  После этого определяется весомость «семантической ДНК» в данном изображении.

Семантический поиск.

Процедура поиска разбивается на две стадии. Прежде всего, поисковый запрос подвергается рассмотренному выше семантическому индексированию изображения с припиской каждой лексеме соответствующей «семантической ДНК». Затем производится сопоставление ДНК, состоящее из двух процессов: сопоставления ДНК запроса с ДНК таблицы индексирования для установления весомости их взаимосвязи, а затем – ранжирования изображений, полученных на предыдущей стадии.  Далее определяется степень взаимосвязи ДНК конкретной лексемы путем вычисления среднего значения весомости ее ДНК в рассматриваемом  изображении. Изображение с высоким показателем весомости считается релевантным поисковому запросу. Эксперименты показали, что – в условиях формирования огромных онлайновых массивов различных изображений – рассмотренный метод семантического индексирования может  облегчить проводимый  дизайнерами  поиск изображений, которые содержат семантические элементы, соответствующие концепции или тематике   разрабатываемого ими промышленного дизайна (1).

Информационный поиск зрительных элементов промышленного дизайна

Последние исследования в области моделирования, оцифровки и визуализации 3-мерных объектов повлекли за собой формирование в Интернете различных информационных массивов, начиная с собрания  древних скульптур и кончая  реестрами промышленных образцов. За этим последовали разработки систем поиска 3-мерных моделей промышленного дизайна.

Особенности поиска трехмерных моделей. По сравнению с  текстовым поиском  нахождение 3-мерных моделей значительно сложнее. Их поиск с использованием текстовых аннотации во многих случаях не приводит к положительным результатам. Аннотации  могут быть субъективными, чрезмерно лаконичными или двусмысленными. В отличие от них методы содержательного поиска 3-мерных моделей на основе анализа конкретных элементов их формы обеспечивают значительно более высокие результаты. Сопоставление формы представляет собой процесс определения сходства элементов двух форм, которое зачастую представляет собой компьютеризированное измерение «расстояния» между ними,  дополняемое процессом их индексирования. Существует обширная  литература, посвященная  компьютерному дизайну, опознанию объектов, геометрическому моделированию, технологии поиска 3-мерных моделей и сопоставления элементов их формы. На концептуальном уровне типичная система поиска 3-мерных форм включает заранее проиндексированную базу данных и программу онлайнового формирования запросов. Каждая 3-мерная модель идентифицируется посредством дескрипторов элементов  ее формы. Для эффективного онлайнового поиска в обширном массиве требуется развитая структура  индексирования и  поисковый алгоритм. Программа онлайнового формирования запросов отбирает нужные дескрипторы и  осуществляет поиск сходных моделей в проиндексированной базе данных. Поисковый запрос может быть сформирован по результатам предыдущего поиска; прямого отбора нужного дескриптора; использования имеющейся 3-мерной модели. Оценку методов поиска 3-мерных моделей  можно проводить с использованием следующих характеристик: 1) требований представления формы, воспринимаемой данной поисковой системой; 2) реквизитов измерения различия  для  установления «дистанции» между парами дескрипторов, 3) эффективности поиска, обеспечиваемой автоматизированным индексированием формы модели, 4) различительной способностью дескриптора ухватывать особенности формы; 5) способностью частичного сопоставления не формы в целом, а отдельных ее элементов; 6) надежностью, проявляющейся в невосприятии информационного шума и второстепенных характеристик формы; 7) необходимости осуществления нормализации, поскольку 3-мерные модели изначально имеют произвольную форму, ориентацию и позицию в 3-мерном пространстве.

Методы сопоставления форм.

Основываясь на возможностях дескриптивного представления формы можно подразделить методы ее сопоставления на три взаимосвязанные  категории: на те, что основаны на сопоставлении признаков, графов или геометрии.  При наличии того и другого во внимание принимается   наиболее характерный аспект репрезентации формы.  Признаки, в данном контексте, включают геометрические и топологические свойства трехмерных форм, по которым и допускается их разграничение. Для обозначения признаков применяются дескрипторы формы, обозначающие позицию признака в более  обширном пространстве. Две формы считаются сходными, если они располагаются в этом пространстве неподалеку. Методы, основанные на сопоставлении признаков, делятся на группы в зависимости от типа используемых признаков. Если методы, основанные на сопоставлении признаков, принимают во внимание исключительно геометрию формы, то методы, основанные на сопоставлении графов, предназначены для вычленения геометрического значения 3-мерной формы с применением графов, указывающих на взаимосвязь различных компонентов формы. Эти методы подразделяются на группы в зависимости от вида используемых графов. Метод, основанный на геометрическом сопоставлении, исходит из необходимости сопоставления сходства форм под различными углами зрения. Несходство двух 3-мерных форм определяется сопоставлением различия  ее 2-мерных силуэтов, получаемых под 10 углами зрения. Возможно также использование объемных характеристик и весовых коэффициентов точек измерения 3-мерной формы (2)

Нетрудно заметить, что  предлагаемые в методике алгоритмы сопоставления форм не обеспечивают одинаковых результатов в случае применения их к разным типам объектов. Поэтому, здравый смысл подсказывает неизбежность комплексного использования при информационном поиске изображений промышленного дизайна обоих рассмотренных выше подходов.

Литература

1. FADZLI S. A., SETCHI R. A SEMANTIC APPROACH TO TEXT-BASED IMAGE RETRIEVAL USING ALEXICAL ONTOLOGY – www.cardiff.academia.edu/…/A_Semantic_Appro.

2. Veltkamp R.C. et al. Content Based 3D Shape Retrieval – 3D shape retrieval aspects, Shape matching methods, Comparison-www.encyclopedia.jrank.org/…/Content-Based-3…