Научный журнал Байкальского государственного университета
ИЗВЕСТИЯ
Байкальского государственного университета
ISSN 2500-2759 (Print)
Издается с 2002 года
Menu

Информация о статье

Название статьи:

Некоторые перспективы автоматического построения аудиодескрипции динамичных объектов

Авторы:
Раздуев А.В., кандидат филологических наук, доцент, профессор кафедры западноевропейских языков и культур, Институт переводоведения, русистики и многоязычия, старший научный сотрудник НОЦ «Прикладная лингвистика, терминоведение и лингвокогнитивные технологии», ведущий научный сотрудник Департамента координации научно-исследовательской и инновационно-проектной деятельности в специалитете, магистратуре и аспирантуре, https://orcid.org/0000-0002-9936-014X, SPIN-код: 8821-4091, AuthorID РИНЦ: 614154, Пятигорский государственный университет, г. Пятигорск, Российская Федерация, arazduev@bk.ru
В рубрике:
ТЕОРЕТИЧЕСКАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
Год: 2025 Том: 35 Номер журнала: 2
Страницы: 15-
УДК: 811.1
Аннотация:
Статья посвящена выявлению возможных перспектив автоматического построения аудиодескрипции динамичных объектов (в отличие от статичных) на русском языке. Обосновывается необходимость данного вида описания объектов для лиц, имеющих различные проблемы со зрением, - плохо видящих и полностью незрячих. Описываются конкретные этапы автоматического построения аудиодескрипции: от применения систем компьютерного зрения (CV), алгоритмов YOLO и/или SSD) и обработки текстов на естественном языке (NLP), использования генеративного предобученного трансформера (GPT) с учетом персонализации и контекстуализации и последующего озвучивания сгенерированного текста. Автоматическое построение аудиодескрипции динамичных (как и статичных) объектов - это многообещающая область человеческой деятельности, которая может в значительной степени улучшить качество жизни людей с различными нарушениями зрения, приобщить данных лиц к культурным достижениям, дать им доступ к разного рода информации, которая может быть им недоступна.
Ключевые слова: аудиодескрипция, динамичный объект, автоматическая аудиодескрипция, компьютерное зрение, незрячий человек, плохо видящий человек, искусственный интеллект, генерация аудиодескрипции
Извините, полный текст статьи временно недоступен Извините, полный текст статьи временно недоступен