Мальцев В.Ю.   Молородов Ю.И.   Скачков Д.М.  

Технология извлечения информации об ареалах распространения видов бактериальных патогенов переносимых иксодовыми клещами

Reporter: Скачков Д.М.

Разработана структура и проведена опытная эксплуатация  базы данных нуклеотидных последовательностей бактерий и вирусов, переносимых клещами [1]. Для управления базой данных используется объектно-реляционная система PostgreSQL8.4. К настоящему времени таблицы БД содержат более 700 записей объемом  более 2Мб, а их работу обеспечивает набор специализированных программ. Программы и структура таблиц обеспечивают не только поиск данных, но и позволят реализовать некоторые эвристические алгоритмы анализа данных полевых наблюдений. По существу это позволит сделать базу данных информационно - аналитической системой (ИАС). ИАС по клещам и переносимым ими патогенам позволяет не только накапливать первичную информацию, но и проводить всесторонний анализ закономерностей географического распространения и паразито-хозяинных связей представителей этой группы (насекомых) паразитов.
Разработка моделей и алгоритмов поиска функциональных зависимостей в массивах данных предполагает, прежде всего, построение модели предметной области.  В качестве модели предметной области обычно выступает ее онтология. 

Мы показали [2], что тезаурус становится онтологией тогда, когда связи между дескрипторами не просто эксплицированы (как это предусмотрено в классическом определении тезауруса),  но и классифицированы универсальными зависимостями типа «общее – частное», «часть – целое», «причина – следствие» и т.п. Для эффективной работы с фактами следует, чтобы сущности, относящиеся к  предметной области, были представлены не только обозначающими их терминами, но и достаточно широким набором атрибутов, т.е. речь идет об онтологии, обладающей известными признаками модели предметной области.

В процессе работы была уточнена модель предметной области «Геномика патогенов, переносимых иксодовыми клещами» и на ее основе построена онтологическая спецификация понятий.

Для создания долговременных архивов данных секвенирования, разработаны алгоритмы интеграции в БД текстов секвенированных последовательностей в формате FASTA. Предусмотрено проведение проверок при загрузке текстов, допустимой последовательности символов.  Структура базы данных дополнена  двумя связанными таблицами:  Последовательности (Sequences) и  Клещи (ticks), в общем случае – организмы. В таблице Sequences определены основные поля, которые являются атрибутами последовательности.  Для дополнительных атрибутов выделено отдельное поле, где значения хранятся в формате: [attribute_name_1=attribute_value_1] ; [attribute_name_1=attribute_value_1] . Таким образом, некоторые записи в таблице Sequences могут иметь свои текстовые атрибуты. Аналогичные поля определены в таблице Ticks. Основными полями являются атрибуты клеща. Для дополнительных атрибутов выделено отдельное поле, где значения хранятся в формате: [attribute_name_1=attribute_value_1] ; [attribute_name_1=attribute_value_1] .
В настоящее время проходит опытную эксплуатацию процедура загрузки данных в таблицу Sequences на основе XML-формата.

Для отображения ранее собранной информации об ареалах распространения клещей и переносимых ими бактериальных патогенов на территории Азиатской части России [3] разработан специализированный программный ГИС-модуль. В результате работы этого модуля на географической карте в виде маркеров места обитания конкретной популяции клещей видов Ixodes persulcatus и Ixodes pavlovskyi и связанных с ними переносимых заболеваний. На карте выбраны территории Южной, Северо-Восточной и Северной физико-географических провинций Алтае-Саянской горной страны, ее предгорий (Салаирский кряж) и лесостепного Приобья Западно-Сибирской равнины. В качестве карт был использован сервис Google Maps. По умолчанию на карту добавляются дополнительные элементы управления – большой элемент масштабирования и панорамирования, а также переключатель типа карты. Пользователь имеет возможность изменить размер карты, одновременно изменяя и размер информационного маркера.


ЛИТЕРАТУРА

1. В.Ю. Мальцев, Ю.И. Молородов, Д.М. Скачков, Н.В. Тикунова Информационно-вычислительная система "Геномика патогенов, переносимых иксодовыми клещами" // Совместный вып. Вестник Восточно-Казахстанского государственного технического университета им. Д. Серикбаева и журнала "Вычислительные технологии" Института вычислительных технологий СО РАН .- с. 305-312. Усть-Каменогорск 2013.

2. Барахнин В.Б., Федотов А.М. Уточнение терминологии, используемой при описании интеллектуальных информационных систем, на основе семиотического подхода // Известия вузов. Проблемы полиграфии и издательского дела.  – 2008. – № 6 –  С.73-81.

3. 2. Ливанова Н.Н., Боргаяков В.Ю., Ливанов С.Г., Тикунова Н.В., Фоменко Н.В.. Характеристика природных очагов клещевых боррелиозов новосибирского научного центра и новосибирской области. // Журнал инфекционной патологии. 2012. Т.19 № 3, С.33.

1)Работа выполнена при частичной поддержке РФФИ (проекты 12-07-00472) и Интеграционного пректа СО РАН №135).

Presentation file: Skachkov.pdf


To reports list