Барахнин В.Б.   Федотов А.М.  

Технология обработки слабоструктурированных документов.

Докладчик: Барахнин В.Б.

В докладе излагается технология автоматизированного включения в научно-информационный процесс слабоструктурированных документов с целью получения на основании содержащихся в них данных новой информации и знаний. Описываются алгоритмы, автоматизирующие основные этапы обработки документов:

0. Создание онтологии (тезауруса) предметной области.

1. Извлечение метаданных из документов.

2. Получение недостающих метаданных.

3. Индексирование документов.

4. Кластеризация документов (для классификации и поиска «по аналогии»).
 

Файл презентации: pres_dirc_bar.pdf


К списку докладов