Научный журнал Байкальского государственного университета
ИЗВЕСТИЯ
Байкальского государственного университета
ISSN 2500-2759 (Print)
Издается с 2002 года
Menu

Информация о статье

Название статьи:

Некоторые перспективы автоматического построения аудиодескрипции динамичных объектов

Авторы:
Раздуев А.В., кандидат филологических наук, доцент, профессор кафедры западноевропейских языков и культур, Институт переводоведения, русистики и многоязычия, старший научный сотрудник НОЦ «Прикладная лингвистика, терминоведение и лингвокогнитивные технологии», ведущий научный сотрудник Департамента координации научно-исследовательской и инновационно-проектной деятельности в специалитете, магистратуре и аспирантуре, https://orcid.org/0000-0002-9936-014X, SPIN-код: 8821-4091, AuthorID РИНЦ: 614154, Пятигорский государственный университет, г. Пятигорск, Российская Федерация, arazduev@bk.ru
Для цитирования:
Раздуев А.В. Некоторые перспективы автоматического построения аудиодескрипции динамичных объектов / А.В. Раздуев. — DOI 10.17150/2500-2759.2025.35(2).341-347. — EDN AUFWFD // Известия Байкальского государственного университета. — 2025. — Т. 35, № 2. — С. 341–347.
В рубрике:
ТЕОРЕТИЧЕСКАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
Год: 2025 Том: 35 Номер журнала: 2
Страницы: 341-347
Тип статьи: Научная статья
УДК: 811.1
DOI: 10.17150/2500-2759.2025.35(2).341-347
Аннотация:
Статья посвящена выявлению возможных перспектив автоматического построения аудиодескрипции динамичных объектов (в отличие от статичных) на русском языке. Обосновывается необходимость данного вида описания объектов для лиц, имеющих различные проблемы со зрением, - плохо видящих и полностью незрячих. Описываются конкретные этапы автоматического построения аудиодескрипции: от применения систем компьютерного зрения (CV), алгоритмов YOLO и/или SSD) и обработки текстов на естественном языке (NLP), использования генеративного предобученного трансформера (GPT) с учетом персонализации и контекстуализации и последующего озвучивания сгенерированного текста. Автоматическое построение аудиодескрипции динамичных (как и статичных) объектов - это многообещающая область человеческой деятельности, которая может в значительной степени улучшить качество жизни людей с различными нарушениями зрения, приобщить данных лиц к культурным достижениям, дать им доступ к разного рода информации, которая может быть им недоступна.
Ключевые слова: аудиодескрипция, динамичный объект, автоматическая аудиодескрипция, компьютерное зрение, незрячий человек, плохо видящий человек, искусственный интеллект, генерация аудиодескрипции
Финансирование: Исследование выполнено в рамках научного проекта «Разработка лингвистических принципов и проектирование технических решений для создания прототипа нейросети для сопровождения аудиодескрипции» по Государственному заданию Министерства науки и высшего образования РФ (ФГБОУ ВО «Пятигорский государственный университет», проект № 1022100500014-8-6.2.1, научный руководитель — кандидат филологических наук, профессор А.В. Раздуев).
Информация о статье: Дата поступления 11 февраля 2025 г. Дата принятия к печати 10 июня 2025 г. Дата онлайн-размещения 30 июня 2025 г.
Список цитируемой литературы:
  • Филиппова Ю.В. И станут зримыми незримые миры / Ю.В. Филиппова. - EDN XOUDKH // Актуальные проблемы языкознания. - 2018. - Т. 1. - С. 293-298.
  • Раздуев А.В. Опыт анализа русскоязычных текстов аудиодескрипции статичных объектов: лексико-грамматические особенности / А.В. Раздуев. - EDN CJLZPJ // Вопросы романо-германской и русской филологии. - 2023. - Т. 1. - С. 73-77.
  • Александрова Е.В. Применение айтрекера при написании сценария аудиодескрипции / Е.В. Александрова. - EDN FOEIZR // Современная наука: актуальные проблемы теории и практики. Серия: Гуманитарные науки. - 2019. - № 5. - С. 112-115.
  • Snyder J. Audio description: The visual made verbal / J. Snyder // The International Journal of the Arts and Society. - 2007. - Vol. 2, no. 2. - P. 99-104.