Содержание статьи
Сборник 2001
Для установления соглашения о знаниях, представленных на некотором языке, в частности на логическом языке, по мнению N.Guariano, онтология должна характеризовать концептуализацию, ограничивая возможные значения предикатов и функций. В этом понимании, онтология это логическая теория, аксиомы которой ограничивают интерпретации нелогических символов языка.
Результатом работы поисковой системы является множество ссылок на HTML-документы. Так как среди этого множества ссылок могут содержаться ресурсы, не имеющие ничего общего с запросом пользователя, то на следующем этапе происходит проверка результатов работы поисковой системы на соответствие поисковому образу документа. Анализ соответствия результатов HTML-документов должен основываться на выделении ключевых слов из таких частей документа как заголовки, ссылки и тела документа. Так как результатом работы поисковой системы может быть большое количество ссылок, то анализ документов должен проводиться на основе жестких критериев отбора. После проведенного «отсечения» лишних документов результаты поиска отображаются в удобном пользователю виде.
Согласно описанной выше схеме на каждом шаге движения запроса от пользователя к поисковой системе и, наоборот, от поисковой системы к пользователю происходит оценка релевантности смысла запроса и смысла результатов запроса. Эта оценка осуществляется на основе механизма вывода на онтологии.
Использование онтологий является одним из перспективных подходов к разработке систем искусственного интеллекта, поскольку дает возможность делать выводы на основе контента и, следовательно, имитировать интеллектуальные действия человека. Светлана Олеговна представила подробный обзор существующих подходов к пониманию термина «онтология» в прикладных исследованиях и их классификацию по различным основаниям.
Предложен подход к применению онтологий для организации поиска информации в больших массивах знаний и данных, в частности, в сети Internet. Проведенные эксперименты показали, что благодаря использованию вывода на онтологии удается строить образ достаточно релевантный запрашиваемому документу. Этот образ может использоваться для формирования более эффективных запросов для поисковой системы. При данной организации поиска оценка релевантности смысла запроса запрашиваемому документу может проводиться на всех этапах движения запроса от пользователя к поисковой системе.
Создан макет онтологии для области представление знаний, подтвердивший плодотворность данного подхода к решению проблемы эффективного поиска информации. Средством для построения онтологий был выбран технологический комплекс SemP-TAO (Загорулько, Попов97), позволяющий описывать знания с помощью фреймов, семантических сетей и продукционных правил. Для организации вывода на онтологии использовались продукционные правила SemP-TAO. Для поддержки построения онтологии организован словарь терминов, который содержит такие понятия, как модели, языки и системы представления знаний. Описание понятий было сделано в графической оболочке комплекса SemP-TAO, позволяющей в визуальном режиме задавать иерархию понятий предметной области.
Так как при обращении к поисковой системе пользователь должен иметь возможность получить в ответ ресурсы релевантные смыслу запроса, то их поиск должен быть семантически ориентированным. Для этого средства поиска соответствующей запросу информации предлагается организовать на основе онтологии, содержащей описания семантики ресурсов.
Общей целью проекта Enterprise Project является улучшение и там, где необходимо, замена существующих методов моделирования при помощи набора средств, позволяющих интегрировать различные методы и средства. Построение этого набора основывается на онтологии для моделирования предприятия. Главной целью EnterpriseProject является создание таких инструментальных средств, которые помогут зафиксировать и проанализировать данные для того, чтобы определить и сравнить действия, направленные на удовлетворение коммерческих требований. Эти инструментальные средства будут обеспечивать управление задачами пользователей, помогая им осуществлять моделирование деятельности предприятия. С помощью этих средств станет возможным 1) фиксирование и описание предметной области; 2) определение задач и требований (согласующихся с онтологией); и 3) определение и оценка вариантов решений и альтернативных проектов, реализация выбранной стратегии. При независимой разработке инструментальных средств возможно использование разной терминологии, что в свою очередь может привести к конфликтам и неоднозначности при их интегрировании. Для решения этой проблемы была построена онтология, в которой задан набор часто используемых и общепринятых терминов, таких как деятельность, процесс, организация, стратегия, маркетинг.
«Хочу еще раз поблагодарить Светлану Олеговну за очень интересный и полезный доклад! Все было замечательно. Ребята не хотели расходиться! Материал подан содержательно», – отметила Татьяна Шерстинова, доцент департамента филологии Санкт-Петербургского кампуса НИУ ВШЭ, руководитель научно-учебной группы.
В настоящее время существует множество проектов, в основу которых положены онтологии. Рассмотрим некоторые системы, которые были созданы для того, чтобы обеспечить совместное использование различных видов знаний (Gruber93; Ushold,Gruninger96; Ushold, King95; Luke и др.99; Fikes, Farquhar97; Guarino99; Takeda и др.98).
Деятельность отдельных людей, коллективов и организаций сейчас все в большей степени зависит от имеющейся у них информации и способности ее эффективно использовать. Имея доступ к морю информации, представленной в Internet, пользователю хотелось бы получать только нужные ему документы, в то время как поисковые системы работают более чем неудовлетворительно. Проблема усугубляется еще и тем, что различные группы людей, занимающиеся сбором и поиском информации, используют для общения с поисковыми системами, как свои специальные термины, так и термины, широко используемые другими сообществами в ином контексте. Вследствие этого может возникнуть проблема несовместимости используемых терминов, так как современные машины поиска используют в основном механизмы поиска по ключевым словам, не учитывающие контекст, в котором существует информация. В итоге результатом работы таких машин поиска являются сотни тысяч ссылок, большинство из которых указывают на документы, не относящиеся к делу, что затрудняет восприятие и выбор полезной информации. Таким образом, возникает противоречие между хранящейся в Internet информации и ограниченными возможностями человека по ее поиску и переработке.
После преобразования исходного запроса с использованием онтологии пользователю в режиме диалога предлагается уточнить поисковое предписание. Затем, расширенный и уточненный таким образом запрос автоматически модифицируется в запрос к поисковой системе. При этом задаются параметры поиска, специфичные для каждой системы.
KACTUS является Европейским проектом в рамках проекта ESPIRIT, цель которого заключается в построении методологии многократного применения знаний о технических системах во время их жизненного цикла. Данная методология необходима для того, чтобы использовать одни и те же базы знаний для проектирования, оценки, функционирования, сопровождения, перепроектирования и обучения. KACTUS поддерживает интегрированный подход, включающий производственные и инженерные методы и методы инженерии знаний, на основе создания онтологической и вычислительной основы для многократного использования полученных знаний параллельно с различными приложениями технической области. Это достигается при помощи построения онтологии предметной области и их многократного использования в различных прикладных областях. Кроме этого, в KACTUS делается попытка объединить эти онтологии с существующими стандартами как, например, STEP, применяя онтологии, там, где возможно фиксирование данных об области. Основным формализмом в KACTUS является CML ( Conceptual Modeling Language). KACTUS предоставляет комплекс инструментальных средств, который является интерактивной средой для просмотра, редактирования и управления онтологиями. Инструментарий KACTUS предоставляет среду, в которой можно экспериментировать с теоретическими результатами (например, организовывать библиотеки онтологий, преобразовывать данные между онтологиями, делать преобразования для различных онтологических формализмов), а также осуществлять практические действия (например, просмотр, редактирование и уточнение онтологий в разных формализмах).
В настоящее время проблема поиска информации в больших массивах сравнивается с проблемой Вавилонской башни. Эта проблема усугубляется еще и тем, что существующие поисковые механизмы осуществляют поиск информации без учета семантики слов, входящих в запрос, а также контекста, в котором они используются. В данной работе рассматривается применение онтологий для повышения эффективности поиска информации в больших массивах знаний, в частности, в сети Internet.