Название статьи:
Исследование топонимов Иркутской области с применением методов искусственного интеллекта
Авторы: Боровский А.В., доктор физико-математических наук, профессор, кафедра математических методов и цифровых технологий, Байкальский государственный университет, г. Иркутск, Российская Федерация,
borovskii@mail.ru,
Раковская Е.Е., аспирант, кафедра математических методов и цифровых технологий, Байкальский государственный университет, г. Иркутск, Российская Федерация,
rakovskaya19@mail.ru В рубрике:
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ, СИСТЕМНЫЙ АНАЛИЗ
Год: 2021 Том: 31 Номер журнала: 3
Страницы: 382-390
Тип статьи: Научная статья
УДК: 004.8
DOI: 10.17150/2500-2759.2021.31(3).382-390
Аннотация:
Актуальные проблемы топонимики подразумевают исследование отдельных слов с целью восстановления утраченного в современном языке понятийного значения географических названий, выяснения того, как в них отразились характерные особенности рельефа местности, род деятельности населяющих ее людей и т.п. Разрешение такого рода проблем возможно с помощью применения интеллектуальных методов анализа данных на основе информационных технологий, но в научных работах по топонимике таким методам практически не уделяется внимания. Статья посвящена исследованию происхождения и смысловых значений географических названий путем нахождения их семантических ассоциатов и вычисления семантического сходства слов с применением эмбеддинговой модели. По предлагаемому методу было определено происхождение некоторых топонимов Иркутской области, выявлены их семантические отношения. К топонимам, имеющим в своем составе два корня, был применен метод дихотомии, который улучшает работу модели за счет уточнения морфемного состава исходного слова. Для определения этимологии топонима «Москва» был применен метод трансформации слов, получены новые версии происхождения топонима. Показано, что использование методов на основе дистрибутивной семантики и векторного представления слов, полученного на основе больших массивов текстовых данных, значительно расширяет возможности исследований в области определения происхождения топонимов, уточнения их смысла.
Ключевые слова: искусственный интеллект, обработка естественного языка, происхождение топонимов, эмбеддинговые модели, дистрибутивная семантика, векторное представление слов, метод дихотомии, метод трансформации
Список цитируемой литературы: - Efficient Estimation of Word Representations in Vector Space / T. Mikolov, K. Chen, G. Corrado, J. Dean // International Conference on Learning Representations. - Scottsdale, 2013. - URL: https://arxiv.org/abs/1301.3781.
- Goldberg Y. Word2vec Explained: Deriving Mikolov et al.'s Negative-sampling Word-Embedding Method / Y. Goldberg, O. Levy // ArXiv. - 2014. - URL: https://arxiv.org/abs/1402.3722.
- Enriching word vectors with subword information / P. Bojanowski, E. Grave, A. Joulin, T. Mikolov. - DOI 10.1162/tacl_a_00051 // Transactions of the Association for Computational Linguistics. - 2017. - Vol. 5, № 1. - P. 135-146.
- Мильхеев М.Н. Топонимика Бурятии. История, система и происхождение географических названий / М.Н. Мильхеев. - Улан-Удэ : Бурят. кн. изд-во, 1969. - 150 с.
- Носовский Г.В. Библейская Русь. В 4 т. / Г.В. Носовский, А.Т. Фоменко. - Москва : Римис, 2004.
- Фасмер М. Этимологический словарь русского языка. В 4 т. / М. Фасмер ; пер. с нем. и доп. О.Н. Трубачева. - 2-е изд. - Москва : Прогресс, 1986-1987.