Название статьи:
Кластеризация информации баз данных оборудования
Авторы: Боровский А.В., доктор физико-математических наук, профессор, кафедра информатики и кибернетики, Байкальский государственный университет, 664003, г. Иркутск, ул. Ленина, 11,
andrei-borovskii@mail.ru,
Раковская Е.Е., аспирант, кафедра информатики и кибернетики, Байкальский государственный университет, 664003, г. Иркутск, ул. Ленина, 11,
rakovskaya19@mail.ru,
Бисикало А.Л., кандидат химических наук, доцент, кафедра аналитической химии, Иркутский государственный университет, 664003, г. Иркутск, ул. К. Маркса, 1,
bisikalo.a@yandex.ru Для цитирования:
Боровский А. В. Кластеризация информации баз данных оборудования / А. В. Боровский, Е. Е. Раковская, А. Л. Бисикало // Известия Байкальского государственного университета. — 2016. — Т. 26, № 5. — С. 805–810. — DOI: 10.17150/2500-2759.2016.26(5).805-810.
В рубрике:
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ, СИСТЕМНЫЙ АНАЛИЗ
Год: 2016 Том: 26 Номер журнала: 5
Страницы: 805-810
Тип статьи: Научная статья
УДК: 004.89
DOI: 10.17150/2500-2759.2016.26(5).805-810
Аннотация:
В статье описывается метод кластеризации информации баз данных оборудования на основе анализа естественно-языковых текстов. С помощью этого метода облегчается задача сортировки входных данных, а также поиска и устранения неверного соответствия данных. Анализ проводился с применением технологий Data Mining и Text Mining. По исходным данным, представляющим собой фрагменты описаний назначения приборов, строились таблицы частот слов-вхождений в документ с учетом их «важности» и семантики исходных текстов. Использование декомпозиции сингулярного значения позволило уменьшить размерность матрицы и выделить пространство наиболее изменчивых признаков. Полученное множество признаков применяется для нахождения различных группировок текстов - кластеризации, классификации и т. д. Также показывается возможность применения методов интеллектуального анализа текстов для кластеризации информации баз данных оборудования и приводятся первоначальные результаты проведенного исследования.
Ключевые слова: Text Mining, кластеризация, базы данных оборудования, датчики, частота слов, декомпозиция сингулярного значения
Информация о статье: Дата поступления 17 мая 2016 г. Дата принятия к печати 13 июня 2016 г. Дата онлайн-размещения 31 октября 2016 г.
Список цитируемой литературы: - Ясенев В. Н. Информационные системы и технологии в экономике: учеб. пособие / В. Н. Ясенев. - М. : Юнити, 2008. - 560 с.
- Прикладная статистика. Классификация и снижение размерности / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков [и др.]. - М. : Финансы и статистика, 1989. - 606 с.
- Мандель И. Д. Кластерный анализ / И. Д. Мандель. - М. : Финансы и статистика, 1988. - 176 с.
- Классификация и кластер / под ред. Дж. Вэн Райзина. - М. : Мир, 1980. - 390 с.
- Сэлтон Г. Автоматическая обработка, хранение и поиск информации / Г. Сэлтон. - М. : Сов. радио, 1973. - 560 с.
- Барсегян А. А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко. - СПб. : БХВ-Петербург, 2007. - 384 с.
- Маннинг К. Д. Введение в информационный поиск / К. Д. Маннинг, П. Рагхаван, Х. Шютце. - М. ; СПб. ; Киев : Вильямс, 2011. - 520 с.
- Salton G. Term-weighting approaches in automatic text retrieval / G. Salton, C. Buckley // Information Processing & Management. - 1988. - № 5 (24). - P. 513-523.
- Larson R. R. Classification clustering, probabilistic information retrieval, and online catalog / R. R. Larson // Library Quarterly. - 1991. - Vol. 61 (2). - P. 133-173.
- Леонтьева Н. Н. Автоматическое понимание текстов. Системы, модели, ресурсы : учеб. пособие / Н. Н. Леонтьева. - М. : Academa, 2006. - 202 с.
- Катасёв А. С. Модели и методы формирования нечетких правил в интеллектуальных системах диагностики сложных объектов : дис. … д-ра техн. наук : 05.13.18 / А. С. Катасёв. - Казань, 2014. - 257 с.
- Боровиков В. П. STATISTICA. Искусство анализа данных на компьютере / В. П. Боровиков. - СПб. : Питер, 2003. - 686 с.
- Халафян А. А. STATISTICA 6. Статистический анализ данных : учеб. пособие / А. А. Халафян. - М. : Бином-Пресс, 2007. - 512 с.
- Паклин Н. Б. Бизнес-аналитика: от данных к знаниям : учеб. пособие / Н. Б. Паклин, В. И. Орешков. - СПб. : Питер, 2013. - 704 с.