Публикации
Муллонен И.И., Новак И.П., Родионова А.П., Крижановская Н.Б.
Открытый корпус вепсского и карельского языков: структура, функциональность, перспективы развития
// Труды Отделения историко-филологических наук РАН. Т.13. 2024. C. 187-196
Ключевые слова: карельский язык; вепсский язык; корпусная лингвистика; Открытый корпус вепсского и карельского языков
ВепКар – Открытый корпус вепсского и карельского языков, ведущий свою историю с 2009 г. Тогда была начата работа над «Корпусом вепсского языка», а в 2016 г. было принято решение расширить его за счёт языка титульного этноса Карелии – карельского. За годы работы над ресурсом языковедами ИЯЛИ КарНЦ РАН и программистами ИПМИ КарНЦ РАН была проделана большая работа по его наполнению не только текстами, но и словарями, а также инструментами, обеспечивающими удобную работу и возможность проведения научных исследований. В настоящий момент в корпусе размещено около 6 тыс. текстов (2 млн. словоупотреблений) на диалектах и нормированных вариантах карельского и вепсского языков, более 67 тыс. словарных статей. ВепКар стал базой для исследования прибалтийско-финских языков Северо-Запада России. Материалы корпуса активно используются в процессах разработки новых словарей и грамматик, редактирования правил и норм новописьменных вариантов языков, в обучающих процессах. Они послужили основой для таких ресурсов, как Аудиокарта прибалтийско-финских языков Карелии, Приложение для проверки орфографии и Мультимедийный словарь карельского языка LiPaS. При условии дальнейшего расширения объёма и структурного потенциала платформы в будущем эти данные планируется направить на решение таких сложных задач как, например, распознавание и синтез речи, машинный перевод, построение компьютерных моделей карельского и вепсского языков.
Индексируется в РИНЦ
Последние изменения: 27 ноября 2024