Lıngvodoc как форпост цифрового языкознания

На международной научно-практической конференции «Языковое и социокультурное пространство современной Евразии: вызовы, традиции, перспективы», посвященной юбилею доктора филологических наук, профессора, главного научного сотрудника Института стратегических исследований Республики Башкортостан Луизы Хамзиновны Самситовой, которая прошла 14 февраля в Геральдическом зале Государственного Собрания – Курултай Республики Башкортостан выступила руководитель проекта Lingvodoc, д-р филол. наук Юлия Викторовна Норманская (Институт языкознания Российской академии наук, Институт системного программирования им. Иванникова Российской академии наук).

Эксперт рассказала о таком уникальном проекте, как Lıngvodoc, обратив внимание, что использование приложения открывает широкие возможности перед филологами будущего, который ученый оценивают как шаг в «завтрашний день» языкознания.

Юлия Викторовна Норманская до упомянутой конференции несколько дней проводила семинары интенсивного обучения для молодых ученых и студентов на платформе Lıngvodoc, один из которых прошел в стенах Всемирного курултая башкир.

– Особенность программ, с которыми мы знакомим на курсах – в очень быстром анализе того, что раньше исследователи делали вручную. Возьмем конкретный пример одной из участниц наших курсов – ученого-филолога Айгуль Сагитовой. Она проводит в программе анализ слов родственных башкирских диалектов. В данном случае – это ряд словоформ северо-западного диалекта башкирского языка. За несколько минут программа анализирует три тысячи слов из родственных диалектов и получает тысячу родственных башкирских корней в разных диалектах, – отмечает Юлия Викторовна.

Это позволяет делать фонетический разбор, выстраивать системы того, как согласные и гласные в разных диалектах соответствуют друг-другу. Программа высчитывает близость разных диалектов на основе математического анализа. В результате выдача получается на шестьсот страниц слов.

– С прежними «доцифровыми» технологиями это заняло бы почти год работы, подсчетов, анализа собранного материала. Мы знаем это по опыту составления этимологических словарей тюркских и иных языков. Они делались годами! Сейчас это занимает минуты, – подчеркивает Юлия Викторовна.

Безусловно, программа не выдает окончательный результат – технологии просто расширяют возможности исследователя, берут на себя рутинную механическую работу. Поэтому здесь важен человеческий труд – на нынешних курсах мы учимся записывать слова и звуки, транскрибировать их в международном фонетическом алфавите. После математического анализа также этот массив являет собой просто широкую базу для ученого, исследователя. И он уже делает окончательные выводы. Но вместо долгих лет вычислений ученый получает полный анализ собранного материала буквально за несколько минут.

– Безусловно, в выдаче программ наблюдается ряд несовершенств работы искусственного интеллекта, которые должны исправлять ученые. В результате этой работы можно получить математические точные результаты степени близости разных башкирских говоров между собой. Например, кандидат филологических наук Айгуль Сагитова промежуточные результаты уже представит на конференции. Они показывают, что северо-западный диалект наиболее близок к башкирскому языку XVIII в. по словарям П.С.Палласа, – подчеркивает руководитель проекта Lingvodoc.

Нынешний проект в Башкортостане объединил усилия языковедов трех ведущих научных учреждений республики: Института истории, языка и литературы УФИЦ РАН, Уфимского университета науки и технологий и Института стратегических исследований Академии наук РБ. Координатором нынешних семинаров выступает Центр социокультурного моделирования.

Юлия Викторовна отметила высокий уровень башкирских студентов и ученых, работающих при поддержке Фонда грантов Главы РБ в рамках проекта Центра социокультурного моделирования (директор Азат Тагирович Бердин) «Молодые ученые Башкортостана на платформе Лингводок», под научным руководством ИИЯЛ УФИЦ РАН (научный руководитель проекта – Рамиля Нигматьяновна Каримова).

По материалам Всемирного курултая башкир