Познавательно о
Информационно-поисковых
языках
Искусственные языки, предназначенные для выражения
формы и содержания документов, запросов, описания
фактов с целью последующего поиска информации.

Структура ИПЯ:
  1. Алфавит
  2. Лексические единицы
Виды информационно-поисковых языков
1
По степени регламентации лексики:
  • ИПЯ с контролируемой лексикой
  • ИПЯ с неконтролируемой лексикой
2
По времени построения лексики:
  • предкоординатные ИПЯ;
  • посткоординатные (координатные) ИПЯ
3

По способу построения лексики

  • словарные ИПЯ;
  • кодированные ИПЯ
Требования к информационно-поисковому языку
  • Однозначность
  • Эксплицитное выражение полезных для поиска отношений между словами

  • Возможность корректировки и пополнения, гибкость и адаптивность
  • Удобство пользования, мнемоничность, компактность
  • Семантическая выразительность

Термины –

основа лексики информационно-поисковых языков

Термин – слово или словосочетание какой-либо сферы, предметной области, точно и однозначно обозначающее понятие

ГРАММАТИКА

средства и правила построения поисковых образов

на информационно-поисковом языке

Грамматические средства:
  • Мешочная грамматика
    Нет определенной последовательности
  • Позиционная грамматика
    Жесткий строгий порядок
Технология создания лексико-семантической основы информационно-поисковых языков:
  • Отбор лексических единиц:
- собрать термины, словосочетания.
  • Нормализация лексики:

- представление лексических единиц в единообразной грамматической форме;

- устранение синонимии и полисемии.

  • Систематизация и группировка лексических единиц:

- распределение по смыслу.

  • Организационное оформление лексики:

- единая форма при индексировании.

I. ИЕРАРХИЧЕСКИЕ КЛАССИФИКАЦИОННЫЕ ИПЯ

иерархическая классификация подчинение / соподчинение иерархическое древо

основания классификации

индекс (код)

Свойства иерархических классификаций:

глубина классификации







ёмкость классификации

Достоинства иерархических классификаций:

1) привычность, значительный опыт и традиции использования, широкая сфера применения;

2) наглядность, обозримость («карта знаний»);

3) возможность управлять полнотой выдачи при проведении тематического поиска;

4) информативность и мнемоничность индексов (кодов);

5) независимость индексов (кодов) международных иерархических ИПЯ от национальных языков.

Недостатки иерархических классификаций:

1) жёсткость структуры, строгое фиксирование классификационных

делений и порядка их следования;

2) низкий уровень «гостеприимства», слабая приспосабливаемость;

3) затруднительность многоаспектного раскрытия содержания документов и запросов, сложность проведения многоаспектного поиска;

4) спорные результаты изменения глубины индексирования;

5) сложность автоматизации индексирования;

6) субъективизм индексирования.

Структура иерархических классификационных ИПЯ:

1) алфавит;

2) лексика (план выражения – план содержания).

Организация иерархических классификационных ИПЯ:
  • Введение
  • Классификационные деления:

    - основные;

    - вспомогательные.
  • Алфавитно-предметный указатель:

    - Десятичная классификация Дьюи;

    - Универсальная Десятичная классификация (УДК);

    - Библиотечно-библиографическая классификация (ББК);

    - Государственный рубрикатор научно-технической информации (ГРНТИ);

    - Международная патентная классификация;

    - Классификатор правовых актов;

    - Классификатор международных стандартов;

    - Общероссийский классификатор стандартов.

II. НЕИЕРАРХИЧЕСКИЕ КЛАССИФИКАЦИОННЫЕ ИПЯ

фасетная классификация

алфавитно-предметная классификация

Алфавитно-предметный классификационный информационно-поисковый язык

(язык предметных рубрик)

Авторитетные файлы предметных рубрик разработанный Российской национальной библиотекой. Совершенно единообразные, унифицированные, утвержденные рубрики.

Структура алфавитно-предметного классификационного ИПЯ:

1) алфавит;

2) лексика (план выражения – план содержания).

Информационно-поисковые языки ключевых слов.

Дескрипторные информационно-поисковые языки

Ключевые слова - информативные слова или словосочетания, раскрывающие содержания документа или запроса и приведенные в стандартны лексикографический формат.

Дескрипторы - нормализованные ключевые слова, являющиеся именами класса синонимичных или близких ключевых слов. Остальные ключевые слова этого класса называются Аскрипторами и при индексировании заменяются на дескрипторы.

Координатное индексирование

Свободное
работаем с ключевыми словами





Контролируемое
работаем с дескрипторами и со словарем

Структура ИПЯ ключевых слов и дескрипторного ИПЯ:

1) алфавит;

2) лексика (план выражения – план содержания).

Примеры использования:

Структура дескрипторного словаря:

Дескриптор с. Аскриптор

Аскриптор см. Дескриптор



Структура информационно-поискового тезауруса:

Дескриптор:

Аскрипторы:

Вышестоящий дескриптор:

Нижестоящие дескрипторы:

Ассоциативные дескрипторы:

Объектно-признаковые информационно-поисковые языки

фактографический информационно-поисковый язык, предназначенный для индексирования описаний фактов в виде перечня объектов (предметов) с указанием относящихся к ним признаков (свойств) и соответствующих значений признаков.

объект – признак – значение признака

Фактографические информационно-поисковые языки

- алфавит;

- лексика (план содержания = план выражения)

Парадигматические отношения лексем в фактографическом информационно-поисковом языке.

Синтагматические отношения лексем в фактографическом информационно-поисковом языке.

Язык библиографического описания

- алфавит;

- лексика (план содержания = план выражения)


Синтагматические отношения лексем

в языке библиографического описания.

Информационно-поисковые языки-идентификаторы

Языки которые позволяют идентифицировать информацию.
Виды языков:
  • Язык международных стандартных номеров

    ISBN - Международный стандартный книжный номер (англ. International Standard Book Number) — уникальный номер книжного издания, необходимый для распространения книги в торговых сетях и автоматизации работы с изданием.
    Существует также подобный стандарт ISSN (International Standard Serial Number) для периодических изданий.
    (см. Изображение ниже)
  • Язык штриховых кодов


    Графическая информация, наносимая на поверхность, маркировку или упаковку изделий, предоставляющая возможность считывания её техническими средствами — последовательность чёрных и белых полос, либо других геометрических фигур. Cовпадает с ISBN.
  • Язык авторских знаков

    Один из основных элементов выходных сведений печатного издания в виде кодированного сокращённого обозначения первого слова библиографической записи (фамилии первого автора книги или её заглавия, если автор не указан или авторов более трёх). Представляет собой заглавную букву первого слова библиографической записи и соответствующего начальному слогу этого слова двух- или трёхзначного числа (значение числа определяется по специальным авторским таблицам).
    (см. Изображение ниже)
This site was made on Tilda — a website builder that helps to create a website without any code
Create a website