Проблемы при использовании УДК

Архангельский Андрей

       Основная проблема заключается в том, что УДК хоть и задумывалясь как чисто иерархическая классификация, на самом деле таковой не является.
       Идея Мельвиля Дьюи была очень простая — каждая следующая цифра уточняет предыдущую. Это и обеспечивает иерархичность всей классификации. Но последующее развитие пошло не по пути уточнения и усовершентствования структуры, а по пути насаждения общих и специализированных правил. При этом создатели правил как всегда "думали на бумаге", т.е. вводя специальные символы они не задумывались о том, как тот или иной код можно будет найти с помощью компьютера.
       При разработке приложений с использованием УДК нужно помнить что:
       — симовол '*' используется в УДК для присоединения к индексам УДК индексов других классификаций. В поисковых системах символ * часто используется как символ заменяющий любой другой;
       — в качестве специального определителя используется символ апострофа и так так называемые определители с апострофами. В то же время символ апострофа практически во всех языках программирования используется в качестве ограничителя текстовых данных (строк), в том числе и строк поиска. Таким образом возникают некоторые проблемы, когда нужно найти один или несколько целевых апострофов в строке ограниченной апострофами;
       — Среди общих определителей следует отметить "Определитель времени (Таблицы Ig)", которые имеют отличительныей признак "..." (кавычки). Таким образом, если в одной строке поиска — код УДК — есть и апостроф, и кавычки, то у программиста не остается способа каким-либо образом ограничить строку поиска.
       Следующая группа проблем относится к знакам УДК.
       Знак апострофа и проблемы, с ним связанные, описаны выше.
       Знак присоединения '+' обозначает наличие в документе двух и более независимых друг от друга тем или независимых формальных особенностей документа. Знак присоединения автоматически разрушает иерархическую структуру. По сути он говорит о том, что у документа имеется несколько кодов. Например, индекс 628.33(73+71) для поиска должен быть записан как 628.33.73+628.33.71.
       С одной стороны, если классификация построена на двух таблицах, то один и тот же товар (книгу) можно записать два (или несколько) раз в нескольких категориях или дублировать, как говорится в правилах УДК.
       С другой стороны, есть Знак отношения, который также связывает два (или несколько) понятий. Однако, как сказано в правилах Знак присоединения нельзя заменить ни Знаком распространения, ни Знаком отношения. И что делать в этом случае?
       Знак распространения "/" (читается "косая черта") предазначен для обобщения ряда последовательных индексов, не имеющих общего (родового) индекса. Этот знак вообще находится за гранью здравого смысла.
       С одной стороны, так как классификация иерархическая, то все последовательные индексы имеют в качестве общего (родового) индекса родительский индекс, в который входят все общие цифры индекса.
       С другой стороны, если Знак распространения объединяет часть дочерних индексов, то почему его нельзя заменить Знаком присоединения?
       Как это разложить по таблицам и интерфейсу поиска непонятно. В общем перемудрили разработчики.
       Знак отношения ":" указывает на факт связи между двумя и более понятиями. При этом Знак отношения не дает никаких указаний на характер связи.
       Сюда же примыкает Знак двойного отношения "::", который закрепляет порядок двух или более компонентов в составном индексе, т.е. в тех случаях, когда инверсия невозможна из-за изменения смысла индексируемой информации.
       И, если такие составные индексы действительно создают новые понятия, то их необходимо разделять на простые индексы, которые записываются в основную таблицу, записи о книгах) или других дакументах) дублируются в несколько категорий, соответствующие простым индексах, а новые составные понятия записываются во вспомогательную таблицу с указанием характера связи. В эту эе вспомогательную таблицу могут записываться понятия, образованные с помощью знака присоединения.
       Квадратные скобки необходимо просто раскрывать как обычные математические скобки.
       И, наконец, восемь правил индексирования ставят крест на иерархии УДК. Конечно, узкий специалист, эксперт по систематизации некоторой узкой области внимательно прочитав книгу, используя все знаки и правила, может составить весьма сложный индекс, похожий на шифровку от Штирлица, но сможет ли обычный читатель составить запрос, который найдет по частям составного индекса список книг, соответствующих интересующей его теме? Скорее всего нет!
       Разработчики УДК, наверное, это и сами понимают, так как добавили в классификацию вспомогательные таблицы для обратного поиска, такие как АПУ (Алфавитно-предметный указатель).
       Конечно построить некоторую систему поиска на основе УДК, но это будет не прямой иерархический поиск с последовательным уточнением области поиска, а многоступенчатый процесс, когда сначала ищется по АПУ индекс и его составные части, а затем по сложному интексу попытается найти то, что эксперт по нему закодировал. Практика показывает, что два разных эксперта создадут два разных индекса. Что уж говорить об обычных читателях.
       Не меньшую проблему создают постоянные изменения самой структуры УДК, когда отменяются целые разделы и их фрагменты переносятся в новые. Конечно разработчику классификации это сделать легко — он просто в описании пишет строчку:

681.3.07 <Аспекты запоминающих устройств (ЗУ) и ввода - вывода>.
Исключено E&C 18 [1996]
-> 004.08

       А как быть библиотекарям в Государственной Публичной Библиотеке, с фондом в несколько миллионов единиц хранения? А издательство "Вильямс" (и многие другие) до сих пор под этим индексом (681.3.07) выпускают все книги так или иначе связанные с вычислительной техникой. Значит библиотекарь или менеджер в книжном магазине должен каждую книгу заново индексировать, но уже в разделе 004... А обладает ли он достаточными знаниями для детального индексирования? А разработчик базы данных должен учитывать эти обстоятельства, чтобы обеспечить правильный поиск.
       Таким образом, грамотному разработчику придеться вносить те или иные упрощения, например, в виде отказа от некоторых знаков и определителей, при построении классификации УДК и описания с ее помощью книг или документов в реальной базе данных.

© 01.08.2009, Архангельский А.Г.

<<Пред. Оглавление
Об Авторе
Все персоны
Главная страница
След.>>



Поддержите культуру
ЯндексЯндекс. ДеньгиХочу такую же кнопку

Google
 
Web azdesign.ru az-libr.ru


Дата последнего изменения:
Wednesday, 23-Oct-2013 09:03:00 UTC