Исследователи из Института математики и фундаментальной науки Сибирского федерального Университета (СФУ) совместно с коллегами из Тувинского государственного университета и научно-образовательного центра "Тюркология" Республики Тыва изучили тувинские фольклорные произведения с помощью алгебраического метода формального анализа понятий, сообщила в пятницу пресс- служба СФУ.
Исследование показало, что таким образом можно автоматически определить жанр произведения, а также авторство и пространственно-временной период его написания.
Анализ формальных понятий - это один из алгебраических методов анализа данных в котором каждый объект описывают через его основные признаки. В новой работе исследовался национальный корпус тувинского языка, собранных из оцифрованных художественных-литературных произведений, а за признаки были взяты сюжеты, зачины, основные языковые клише и многие другие характеристики произведений.
Дальше каждому произведению была сопоставлена таблица, фиксирующая наличие тех или иных признаков, а для всего эпоса в целом была составлена так называемая решетка формальный понятий - схема, показывающая глобальные взаимосвязи между различными признаками. "Благодаря такой формализованной модели все произведения эпоса можно автоматически классифицировать на семантическом, то есть качественном уровне", - говорится в пресс-релизе.
"Человек познает мир через понятия, то есть определяет объекты, выделяет для них существенные признаки и на их основе классифицирует и систематизирует реалии окружающего его мира. Анализ формальных понятий представляет собой познание сути вещей при помощи математики. Однако чтобы получить достоверные и устойчивые знания, необходимо использовать большой объем данных. И здесь математики сталкиваются с "проклятием размерности" - чтобы проанализировать необходимый объем данных, не хватит человеческой жизни", - приводятся в пресс-релизе слова руководителя исследования, профессора кафедры Высшей и прикладной математики Валентина Быкова.
Оптимизация алгоритмов
Подобные задачи сложны с этой точки зрения даже для компьютеров - к примеру, работа с моделью на ста признаках, по словам ученых, может потребовать миллионы лет вычислений. Однако, российские исследователи смогли оптимизировать свои алгоритмы и теперь искусственный интеллект может анализировать произведения эпоса гораздо быстрей. Научная статья с последними результатами их работы опубликована в "Журнале СФУ. Математика и физика".
Исследователи отмечают, что "возможность разложить по полочкам" фольклорные тексты, поможет не только в изучении тувинского языка, но и станет хорошим подспорьем в работе переводчиков и поможет изучению и сохранению этнокультурного наследия Республики Тыва. Сейчас интерпретацией построенных математических моделей занялись филологи и лингвисты научно-образовательного центра "Тюркология".
Также аналогичные исследования российских ученых, посвященные тюркоязычным текстам, заинтересовали математиков и лингвистов Национального университета Узбекистана им. М. Улугбека.