Значение слова тезаурус в лингвистическом энциклопедическом словаре. Тезаурус: что это такое

Раздел очень прост в использовании. В предложенное поле достаточно ввести нужное слово, и мы вам выдадим список его значений. Хочется отметить, что наш сайт предоставляет данные из разных источников – энциклопедического, толкового, словообразовательного словарей. Также здесь можно познакомиться с примерами употребления введенного вами слова.

Найти

Значение слова тезаурус

тезаурус в словаре кроссвордиста

Толковый словарь русского языка. С.И.Ожегов, Н.Ю.Шведова.

тезаурус

[тэ], -а, м. (спец.).

    Словарь языка, ставящий задачу полного отражения всей его лексики.

    Словарь или свод данных, полностью охватывающий термины, понятия какой-н. специальной сферы.

    прил. тезаурусный, -ая, -ое.

Новый толково-словообразовательный словарь русского языка, Т. Ф. Ефремова.

тезаурус

    Словарь какого-л. языка, представляющий его лексику в полном объеме.

    Полный систематизированный набор данных о какой-л. области знания, позволяющий человеку или вычислительной машине в ней ориентироваться (в информатике).

Энциклопедический словарь, 1998 г.

тезаурус

ТЕЗАУРУС (от греч. thesauros - сокровище)

    словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в полном объеме осуществим лишь для мертвых языков).

    Словарь, в котором слова, относящиеся к каким-либо области знания, расположены по тематическому принципу и показаны семантические отношения (родо-видовые, синонимические и др.) между лексическими единицами. В информационно-поисковых тезаурусах лексические единицы текста заменяются дескрипторами.

Тезаурус

(от греч. thesaurós ≈ сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических (см. Семантика) отношений. Т. фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Первоначально Т. рассматривали как одноязычный словарь, в котором семантические отношения определяются группировкой слов по тематическим рубрикам. Например, английский Т. (автор П. М. Роджет), изданный в 1962 (1-е издание 1852), содержит 1040 рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к этому Т. содержит алфавитный перечень слов с указанием рубрик и подрубрик, к которым относится каждое слово. Существуют традиционные общеязыковые Т. (описания семантических систем отдельных языков) для английского, французского, испанского языков. К Т. весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова, например словарь русского языка С. И. Ожегова.

В 70-х гг. 20 в. получили распространение информационно-поисковые Т. В этих Т. выделены специальные лексические единицы ≈ дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого Т. сопоставляется синонимичный дескриптор (см. Синонимия), и для дескрипторов явным образом указываются семантические отношения: род ≈ вид, часть ≈ целое, цель ≈ средство и т. д. Обычно принято разделять родо-видовые (иерархические) и ассоциативные отношения. Так, «Информационно-поисковый тезаурус по информатике», изданный в СССР в 1973, для каждого дескриптора предусматривает словарную статью, где отдельно указаны синонимичные ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей ориентации в ассоциативных связях между дескрипторами к этому Т. приложены семантические карты тематических классов. При автоматизированном информационном поиске ищутся документы, у которых индекс содержит не только дескрипторы запроса, но и те дескрипторы, которые находятся с ними в определённых семантических отношениях. Иногда бывает полезно выделять в Т. конкретные ассоциативные отношения, специфичные для данной тематической области: болезнь ≈ возбудитель, прибор ≈ назначение (или измеряемая величина) и т. п. Положение лексической единицы (слова, словосочетания) в Т. характеризует его смысл в языке; знание системы семантических отношений, в которые вступает данное слово (в том числе и рубрик, куда оно входит), позволяет судить о смысле этого слова.

В широком смысле Т. интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приёмника дополнительной информации, вследствие чего изменяется и его Т. Исходный Т. определяет при этом возможности приёмника при получении им семантической информации. В психологии и при изучении систем с искусственным интеллектом рассматривают свойства Т. индивидуумов, проявляющиеся при восприятии и понимании информации. В социологии и теории коммуникаций изучают свойства Т. индивидуумов и коллективов, обеспечивающие возможность взаимопонимания на основе общности Т. В этих ситуациях в Т. приходится включать сложные высказывания и их семантические связи, определяющие запас сведении, которыми располагает сложная система . Т. фактически содержит не только информацию о действительности, но и метаинформацию (сведения об информации), обеспечивающую возможность приёма новых сообщений.

Лит.: Черный А. И., Общая методика построения тезаурусов, «Научно-техническая информация. Сер. 2», 1968, ╧5; Варга Д., Методика подготовки информационных тезаурусов, пер. [с венг.], М., 1970; Шрейдер Ю. А., Тезаурусы в информатике и теоретической семантике, «Научно-техническая информация. Сер. 2», 1971, ╧ З.

Ю. А. Шрейдер.

Википедия

Тезаурус

Теза́урус , в общем смысле - специальная терминология , более строго и предметно - словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации; в современной лингвистике - особая разновидность словарей, в которых указаны семантические отношения (синонимы , антонимы , паронимы , гипонимы, гиперонимы и т. п.) между лексическими единицами. Тезаурусы являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

В психологии тезаурус индивидуума характеризуют восприятие и понимание информации. Теория коммуникации также рассматривает общий тезаурус сложной системы, благодаря которому взаимодействуют её элементы.

Тезаурус (значения)

Тезаурус :

  • Тезаурус - словарь, собрание сведений, охватывающие понятия, определения и термины специальной области знаний или сферы деятельности.
  • Тезаурус Роже - один из первых в истории и наиболее известных на сегодня идеографических словарей.

Примеры употребления слова тезаурус в литературе.

Для восприятия и сотворчества необходим некий оптимальный тезаурус , не малый, но и не слишком большой.

При неограниченно большом количестве поступающей информации, существенно превышающем тезаурус , ее ценность от этого количества не зависит и целиком определяется тезаурус ом.

Многосторонность, системность искусства приводит к неравномерности восприятия произведения в целом: для восприятия одних аспектов стиха тезаурус оптимален, для других-недостаточен или слишком велик.

Так как тезаурус растет и меняется, повторное знакомство с произведением может означать получение новой ценной информации.

Стремление ребенка многократно перечитывать полюбившуюся ему сказку понятно: его тезаурус быстро возрастает и его способность к сотворчеству, к ассоциативному фантазированию особенно велика.

Эта сторона дела более переменчива и субъективна, чем тезаурус , и в поисках объективной эстетической оценки произведения ее должно свести к минимуму.

Он проникает в тезаурус поэта и адресует перевод тезаурус у иноязычного читателя.

Это самое главное заключается в том, чтобы определить, насколько велик твой тезаурус , т.

Нет, просто его собственный багаж - мизерный, он неразвит, его тезаурус находится в зачаточном состоянии, и если он не поймет, что тезаурус должен быть увеличен, то, во всяком случае, этой женщине с ним придется несладко.

Богатый тезаурус , основанный на истинном знании, позволяет человеку в общении с другим человеком, в том числе и в самом близком общении с самым близким человеком, правильно реагировать на все, что ни случится.

Очевидно, что падение ценности информации с ростом тезауруса должно зависеть от отношения тезауруса к количеству получаемой информации.

Очевидно, что оптимальная ценность художественной информации соответствует близости тезауруса читателя и тезауруса поэта.

Можно сказать, что сотворчество, подобно творчеству, требует вдохновения, то есть включения тезауруса в широком смысле этого слова.

Такое внутреннее повторение яркой образности и яркого звучания, оставаясь в рамках имеющегося тезауруса , обогащает его тем же эстетическим моментом повтора.

В этом пункте тезауруса антиподами Платонова надо было бы считать Набокова и Пришвина, а сходным с ним можно признать Марину Цветаеву.

Понятийная система предметной области Основой любой предметной области служит система понятий этой области. Определение понятия: Понятие – мысль, отражающая в обобщенной форме предметы и явления действительности посредством фиксации их свойств и отношений; последние (свойства и отношения) выступают в понятии как общие и специфические признаки, соотнесенные с классами предметов и явлений (Лингвистический словарь)


Понятия и термины Для выражения понятия предметной области в текстах служат слова или словосочетания, называемые терминами. Совокупность терминов предметной области образуют ее терминологическую систему. Отношение конкретного термина с другими терминами терминосистемы предметной области задается посредством дефиниции


Определения термина? Слово (или сочетание слов), являющееся точным обозначением определенного понятия какой-либо специальной области науки, техники, искусства, общественной жизни и т.п. || Специальное слово или выражение, принятое для обозначения чего-л. в той или иной среде, профессии (Большой толковый словарь русского языка)


Термины – точные названия понятий Обычно каждому понятию области соответствует хотя бы один однозначно понимаемый термин, значением которого является это понятие. - термины, в смысле традиционной теории терминологии Свойства терминов – точных наименований понятий - термин должен относиться непосредственно к понятию, он должен выражать понятие ясно; - значение термина должно быть точным и не должно пересекаться по значению с другими терминами; - значение термина не должно зависеть от контекста. Термины, точно именующие понятие, - предмет исследования теории терминологии, терминологов


Текстовые термины В реальных текстах предметной области для ссылки на понятие помимо основных терминов может использоваться множество разнообразных языковых выражений, которые мы называем текстовыми терминами: - синтактико-словообразовательные варианты: получатель бюджетных средств – бюджетополучатель; - лексические варианты – безакцептное списание, бесспорное списание; - многозначные выражения, в зависимости от контекста служащие отсылкой к разным понятиям области, например, слово валюта в разных контекстах может означать национальная валюта или иностранная валюта.














Дескрипторы с пометами Помета - часть названия дескриптора cranes (lifting equipment) vs cranes (birds) shells (structures) – сопоставление разных тезаурусов Предпочтения словосочетаниям: –Phonograph records vs. records (phonograph) Пометы и множественное число: Wood (material) Woods (forested areas)






Включение дескрипторов на основе многословных выражений Расщепление термина увеличивает многозначность: plant food Смысл выражения зависит от порядка слов: информационная наука - научная информация Одно из слов-компонент находится вне сферы тезауруса или слишком общее: first aid Отношения дескриптора не следуют из его структуры: –Искусственные почки, статус беженца, traffic lights




Ассоциативные отношения Сфера деятельности – действующее лицо –Математика – математик Дисциплина – объект изучения –Неврология – нервная система Действие – агент или инструмент –Охота – охотник Действие – результат действия –Ткачество – ткань Действие – цель –Переплетные работы - книга Причина-следствие –Смерть – похороны Величина – единица измерения –Сила тока - ампер Действие - контрагент –Аллерген – антиаллергический препарат и т.п.


Информационно-поисковые тезаурусы: этапы разработки Первый этап: индексаторы описывают основную тему текста произвольными словами и словосочетаниями Полученные по многим текстам термины сводятся вместе Среди близких по смыслу терминов выбирается наиболее представительный Некоторые из оставшихся становятся условными синонимами, остальные удаляются Конкретные термины обычно не включаются


Информационно-поисковые тезаурусы: искусство разработки Дескрипторы – это термины, которые нужны для выражения основной темы документа Синонимы включаются только самые необходимые (например, начинаются с другой буквы), чтобы не затруднять работу индексатора Близкие термины должны быть сведены к одному термину, чтобы избежать субъективности индексирования Уровни иерархии, включение конкретных терминов ограничиваются


Информационно-поисковый тезаурус: искусство разработки - 2 В сложных случаях дескрипторы снабжаются пометами и комментариями –LIV: bombardment – bombing –Многозначные термины: одно значение в тезаурусе (capital), не помещаются в тезаурус, пометы!!! Традиционный информационно-поисковый Тезаурус – искусственный язык, построенный на базе реальных терминов




Традиционные ИПТ: применение в автоматической обработке Нехватка знаний о реальном языке ПОНехватка знаний о реальном языке ПО Legislative Indexing Vocabulary:Legislative Indexing Vocabulary: –в тексте TROOPS – в тезаурусе MILITARY FORCES –в тексте CAPITAL – столица, в тезаурусе только капитал Предлагается: каждый дескриптор дополнить списками слов и терминов Предлагается: каждый дескриптор дополнить списками слов и терминов Но: многозначность или относящийся к разным дескрипторам. Но: многозначность или относящийся к разным дескрипторам. Разрешение многозначности Разрешение многозначности


Традиционные ИПТ: автоматическое расширение запроса Проблема с ассоциациями Предлагается: вводить веса вводить веса вводить названия отношений: объект, свойство и т.п. вводить названия отношений: объект, свойство и т.п. ВЫВОД: нужно научиться строить лингвистические ресурсы специально для автоматической обработки текстовых коллекций


Тезаурус EUROVOC – многоязычный тезаурус Европейского Сообщества Тезаурус на 9 языках Русская версия EUROVOC –+5 тысяч понятий, отражающих российскую специфику Многоязычный тезаурус –Дескриптор – названия на разных языках –Аскрипторы – для некоторых языков


Автоматическое индексирование по тезаурусу EUROVOC, основанное на правилах (Hlava, Heinebach, 1996) Пример правила: IF (near "Technology" AND with "Development") USE Community programme USE development aid ENDIF 40 тысяч правил. Тестирование: 20 наиболее частотных по тексту дескрипторов, порожденных автоматически – 42% полноты, по сравнению с ручным рубрицированием


Автоматическое индексирование на основе установления весов соответствия между словами и дескрипторами (Steinberger и др., 2000) 1 этап – установление соответствия между словами текста и приписанными дескрипторами на основе статистических мер (chi-square или log-likelihood) дескриптор FISHERY MANAGEMENT - следующие слова (в порядке убывания веса): fishery, fish, stock, fishing, conservation, management, vessel, и т.д. 2этап собственно индексирование – суммирование логарифмов весов или как скалярное произведение векторов


Сочетание свободных запросов и запросов на основе информационно-поискового тезауруса Проиндексированная вручную коллекция – установление корреляций Пользователь задает запрос на естественном языке Запрос расширяется наиболее сильно коррелированными с запросом дескрипторами тезауруса (Petras 2004; Petras 2005). Например, по запросу Insolvent Companies (Неплатежеспособные компании) может быть получен список дескрипторов liquidity, indebtness, enterprise, firm., и выполнено расширение запроса Точность в эксперименте выросла на 13 %.



Значение слова ТЕЗАУРУС в Лингвистическом энциклопедическом словаре

ТЕЗАУРУС

(от греч. thesauros — сокровище, сокровищница) — 1) словарь, в к-ром максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; 2) идеографический словарь, в к-ром показаны семантические отношения (родовидовые, синонимические и др.) между лексическими единицами. Т. в 1-м значении в полном объеме осуществим лишь для мертвых языков, ср. «Thesaurus linguae latinae» (с 1900). К этому типу приближается, напр., «Словарь польского языка XVI в.» (с 1966). Для живых языков требование исчерпывающей цитации примеров неосуществимо (ср. попытку изменения типа академич. «Словаря русского языка» А. А. Шахматова, т. 2, 1907, т. 4, 1916, и Л. В. Щербы, продолживших работу Я. К. Грота), Структурной основой Т. во 2-м значении обычно служит иерархич. система понятий, обеспечивающая поиск от смыслов к лексич. единицам (т. е. поиск слов, исходя из понятия). Для поиска в обратном направлении (т. е. от слова к понятию) используется алфавитный указатель. Так, напр., построен тезаурус П. М. Роже «Roget"s thesaurus of English words and phrases» (1852), от названия к-poro в лексикология, практику вошло 2-е значение термина «Т.». В теоре-тич. отношении Т. является одной из возможных моделей семантич. системы лексики. Практически используется как средство обогащения индивидуального словаря пишущего. В практике информационной работы большое распространение получили информационно-поисковые Т., гл. задача к-рых — единообразная замена лексич. единиц текста стандартизов. словами и выражениями (дескрипторами) при индексировании документов и использование родо-вндовых и ассоциативных связей между дескрипторами при автоматизированном информационном поиске документов. . Михайлов Л. И., Ч е р и ы й А.И., Гиляревский Р. С Основы информатики. 2 изд., М., 1968; Ш рей дер Ю. А.. Тезаурусы в информатике и теоре-тнч. семантике. «Науч.-технич. информация. Сер. 2», 1971, Ms 3; Караулов Ю. Н., Общая и рус. идеография, М., 1976; Dornseiff F., Der deutsche Wortschatz nach Sachgruppen, Tl 1—2, В.— Lpz., 1933 — 1934; С as a res у Sanchez J., Diccio-nario ideologico de la lengua espanola, 2 ed., Barcelona. 1959; H a 1 1 e r J., Cesky slov-nik vecny a synonymicky, dl 1 — 3. Praha. 1969—77. А. Я. Шайкевич.

Лингвистический энциклопедический словарь. 2012

Смотрите еще толкования, синонимы, значения слова и что такое ТЕЗАУРУС в русском языке в словарях, энциклопедиях и справочниках:

  • ТЕЗАУРУС в Большом энциклопедическом словаре:
    (от греч. thesauros - сокровище) ..1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Большой советской энциклопедии, БСЭ:
    (от греч. thesauros - сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических (см. Семантика) …
  • ТЕЗАУРУС в Энциклопедическом словаре Брокгауза и Евфрона:
    см. древнегреческое искусство …
  • ТЕЗАУРУС в Современном энциклопедическом словаре:
  • ТЕЗАУРУС
    (от греческого thesauros - сокровище), 1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Энциклопедическом словарике:
    , а, м. 1. лингв. Словарь (языка в целом или языка какой-нибудь специальной сферы деятельности) с полной и логически упорядоченной …
  • ТЕЗАУРУС в Энциклопедическом словаре:
    [тэ], -а, м. (спец.). 1. Словарь языка, ставящий задачу полного отражения всей его лексики. 2. Словарь или свод данных, полностью …
  • ТЕЗАУРУС в Большом российском энциклопедическом словаре:
    ТЕЗ́АУРУС (от греч. thesauros - сокровище), словарь, в к-ром максимально полно представлены слова языка с примерами их употребления в тексте …
  • ТЕЗАУРУС в Энциклопедии Брокгауза и Ефрона:
    ? см. древнегреческое искусство …
  • ТЕЗАУРУС в Полной акцентуированной парадигме по Зализняку:
    теза"урус, теза"урусы, теза"уруса, теза"урусов, теза"урусу, теза"урусам, теза"урус, теза"урусы, теза"урусом, теза"урусами, теза"урусе, …
  • ТЕЗАУРУС в Новом словаре иностранных слов:
    (гр. thesauros запас) 1) лингв. словарь языка с полной смысловой информацией; 2) в информатике-полный систематизированный набор данных о какой-л. …
  • ТЕЗАУРУС в Словаре иностранных выражений:
    [ 1. лингв. словарь языка с полной смысловой информацией; 2. в информатике-полный систематизированный набор данных о какой-л. области знания, позволяющий …
  • ТЕЗАУРУС в словаре Синонимов русского языка:
    макротезариус, свод, …
  • ТЕЗАУРУС в Новом толково-словообразовательном словаре русского языка Ефремовой:
    м. 1) Словарь какого-л. языка, представляющий его лексику в полном объеме. 2) Полный систематизированный набор данных о какой-л. области знания, …
  • ТЕЗАУРУС в Полном орфографическом словаре русского языка:
    тезаурус, …
  • ТЕЗАУРУС в Орфографическом словаре:
    тез`аурус, …
  • ТЕЗАУРУС в Словаре русского языка Ожегова:
    словарь языка, ставящий задачу полного отражения всей его лексики тезаурус словарь или свод данных, полностью охватывающий термины, понятия какой-нибудь специальной …
  • ТЕЗАУРУС в Современном толковом словаре, БСЭ:
    (от греч. thesauros - сокровище),..1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в …
  • ТЕЗАУРУС в Толковом словаре Ефремовой:
    тезаурус м. 1) Словарь какого-л. языка, представляющий его лексику в полном объеме. 2) Полный систематизированный набор данных о какой-л. области …
  • ТЕЗАУРУС в Новом словаре русского языка Ефремовой:
    м. 1. Словарь какого-либо языка, представляющий его лексику в полном объеме. 2. Полный систематизированный набор данных о какой-либо области знания, …
  • ТЕЗАУРУС в Большом современном толковом словаре русского языка:
    м. 1. Словарь, стремящийся отразить весь словарный состав языка с исчерпывающим перечнем примеров их употребления в текстах (в лингвистике …
  • ПЛАТОН
    (Plato) (428/427-348/347 до н.э.) -древнегреческий философ, классик философской традиции; мыслитель мирового масштаба, к чьей оригинальной философской концепции генетически восходят многие …
  • ИСТОРИЦИЗМ в Новейшем философском словаре:
    стратегия исторического (и - шире - гуманитарного) познания, предполагающая постижение истории с парадигмальной позиции снятия субъект-объектной оппозиции внутри когнитивной процедуры. …
  • ПУСТОЙ ЗНАК в Словаре постмодернизма:
    - понятие постмодернистской философии, фиксирующее парадигмальную презумпцию постмодернизма на восприятие семиотических сред как самодостаточной реальности - вне какой бы то …
  • КОНЦЕПТУАЛЬНОЕ ИСКУССТВО в Словаре постмодернизма:
    - наиболее радикальное направление в рамках авангарда "новой волны" (см. "Новой волны" авангард), фундированное презумпцией отказа от генетической связи художественного …
  • ДЕНОТАТ в Словаре постмодернизма:
    (лат. de-notation - обозначение) - множество онтологически артикулированных предметов, обозначаемых данным именем. Денотативный процесс есть отношение имени к предмету безотносительно …
  • КЛАССИЧЕСКАЯ ФИЛОЛОГИЯ в Словаре Кольера:
    критическое и экзегетическое изучение литературы Древней Греции и Рима, исследование всех этапов античного быта, истории, философии, языка и искусства. История …

Под тезаурусом понимается сложный компонент словарного типа, в котором все значения словаря связаны между собой семантическими отношениями, отражающими основные соотношения понятий в описываемой предметной области знаний. В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

В состав тезауруса входят лексемы , относящиеся к четырем частям речи: прилагательному, существительному, глаголу и наречию. Описания, соответствующие каждой части речи, имеют различную структуру.

Основными отношениями в тезаурусе являются:

  • синонимия – связь между словами одной части речи, различных по звучанию и написанию, но имеющих одинаковое или очень близкое лексическое значение, например: кавалерия – конница, смелый – храбрый;
  • антонимия – связь между словами одной части речи, различных по звучанию, имеющих прямо противоположные значения: правда – ложь, добрый – злой;
  • гипонимия/гиперонимия. Гипероним – слово с более широким значением, выражающее общее, родовое понятие, название класса (множества) предметов (свойств, признаков). Гипоним – слово с более узким значением, называющее предмет (свойство, признак) как элемент класса (множества). Эти отношения транзитивны и несимметричны. Гипоним наследует все свойства гиперонима. Являются центральными отношениями для описания существительных;
  • меронимия/партонимия – отношение «ЧАСТЬ-ЦЕЛОЕ». Внутри этого отношения выделяются отношения «быть элементом» и «быть сделанным из». Отношение определено только для существительных;
  • следствие (это отношение связывает между собой глаголы);
  • причина (также определено для глаголов).

Пример тезауруса:

Изба – деревянный крестьянский дом [гипероним]: жилое здание [мероним]: сельский населенный пункт [синоним]: дом

Все отношения создают сложную иерархическую сеть понятий, и знание о том, где находится понятие в этой сети, является важной частью знания об этом понятии. Свойства отношений различны при описании различных частей речи.

В разных системах тезаурус может выполнять разные функции:

  • источник специальных знаний в узкой или широкой предметной области, способ описания и упорядочения терминологии предметной области;
  • инструмент поиска в информационно-поисковых системах;
  • инструмент ручного индексирования документов в информационно-поисковых системах (так называемый контролирующий словарь);
  • инструмент автоматического индексирования текстов.

Начало тезаурусам как понятийным словарям положил Роже (или Роджет, английский физик), систематизировавший лексику английского языка по группам. Каждая группа представлена именем понятия («категории», которых насчитывалось сначала одна тысяча; это обычные слова, расположенные в алфавитном порядке, например AFFIRMATION ... AGENCY...), далее идут его синонимы по частям речи (существительные, глаголы, прилагательные, наречия), антонимы и затем списки родственных слов (их много, и некоторые представляют собой отсылки к именам других категорий, в словарной статье которых список «дальних родственников» может продолжаться, например, от AGENCY... see BUSINESS). Со времени издания тезауруса Роже в 1852г. и до сих пор продолжаются его переиздания в разных видах и для разных пользователей, тезаурус постоянно пополняется новой лексикой и связями, но за всеми вариантами остается имя создателя первой версии. Ценность этого тезауруса в его естественности, в том, что это описание всей лексики языка, а не только терминологии, а также в том, что его можно привлекать к использованию в системах информационного поиска как средство увеличения семантической силы системы.

Тезаурусы остаются до настоящего времени наиболее принятой формой описания знаний предметной области, пригодной для восприятия человеком. Примерами современных иностранных тезаурусов являются WordNet и EuroWordNet.

Тезаурус английского языка WordNet появился в 1990г. и начал активно привлекаться в различные сферы автоматической обработки текстов. WordNet охватывает около 100 тыс. различных единиц (из них почти половина – словосочетания), организованных в 70 000 понятий.

В настоящее время начинает разрабатываться многоязычный тезаурус EuroWordNet. Первоначально для четырех языков (датского, итальянского, испанского и американского английского) разрабатывается сеть значений слов, связанная семантическими отношениями и позволяющая находить близкие по смыслу слова различных языков. В отличие от тезауруса Роже и сети WordNet, которые создавались для описания лексической и понятийной системы английского языка, EuroWordNet создается в первую очередь для решения практических задач автоматической обработки больших массивов текстов. Важнейшими задачами, которые предполагается решать с помощью этого тезауруса, являются следующие:

  • обеспечение многоязычного информационного поиска;
  • увеличение полноты информационного поиска;
  • формулирование запроса на естественном языке;
  • семантическое индексирование документов и др.

Кроме этих отношений вводятся также тематические отношения, которые связывают понятия одной предметной области. Предполагается также ввести специальные пометки на отношения между понятиями, обозначающие дизъюнкцию или конъюнкцию отношений. Если некоторое понятие в сети имеет несколько одноименных отношений, то они могут быть дизъюнктивными, т. е. реально реализуется одно из этих отношений, или конъюнктивными, т. е. для понятия действительны все эти отношения.

В отечественных институтах создано более сотни отраслевых тезаурусов, удовлетворяющих определенному государственному стандарту на словари подобного типа. Они так и именуются – ИПТ – информационно-поисковые тезаурусы. Из всех возможных смысловых отношений между понятиями в них зафиксированы три: синонимические, родовидовые (к которым относят обычно и отношение «ЧАСТЬ-ЦЕЛОЕ») и «все прочие», называемые также ассоциативными.

Стандартные ИПТ предназначены в основном для ручного индексирования документов, а также для формулировки и варьирования запросов при поиске. Есть нестандартные тезаурусы, которые ставят задачу скорее выборочной систематизации терминологии в конкретной области знаний – это особенно актуально для новых предметных областей. Растет тенденция к обогащению тезаурусов определениями терминов, что важно для различения неоднозначности терминов, особенно в случае смежных дисциплин и при выходе из границ узких предметных областей.



Понравилась статья? Поделиться с друзьями: