Барахнин В.Б. Федотов А.М.
Технология обработки слабоструктурированных документов.
Докладчик: Барахнин В.Б.
В докладе излагается технология автоматизированного включения в научно-информационный процесс слабоструктурированных документов с целью получения на основании содержащихся в них данных новой информации и знаний. Описываются алгоритмы, автоматизирующие основные этапы обработки документов:
0. Создание онтологии (тезауруса) предметной области.
1. Извлечение метаданных из документов.
2. Получение недостающих метаданных.
3. Индексирование документов.
4. Кластеризация документов (для классификации и поиска «по аналогии»).
Файл презентации: | pres_dirc_bar.pdf |
К списку докладов