Как молодые ученые изучают и сохраняют языки малых народов и литературное наследие страны
2022 год объявлен Президентом РФ Годом культурного наследия народов России. Этой теме посвящают свои разработки и молодые ученые. В подведомственных Минобрнауки России вузах и НИИ уже несколько лет успешно работают уникальные молодежные лаборатории, которые изучают языки и культуру этносов, проживающих в разных регионах страны, а также работают над сохранением богатого культурного наследия страны — литературы разных эпох.
«Тунгусские заметки» и настольная игра на 15 диалектах северных народов
Изучением и сохранением миноритарных, или малых языков занимается коллектив лаборатории Института языкознания РАН. Более 80% сотрудников научной лаборатории — молодые исследователи. Уже почти три года они ведут полевую работу, собирают и документируют языковой материал, оцифровывают полученные данные и ведут активную популяризаторскую работу с молодежью. Сегодня, по словам заведующей лабораторией Ольги Казакевич, фокус исследований перемещается на малоизученные локальные варианты малых языков.
«Результаты изучения локальных вариантов языков, особенно тех, что находятся под угрозой исчезновения, должны быть доступны не только научному сообществу, но и этническим группам носителей этих языков. Для этого мы развиваем наши информационные проекты и уделяем большое внимание популяризации знаний как о самих миноритарных языках, так и об их ценности для человечества», — отмечает Ольга Казакевич.
Ученые молодежной лаборатории не только участвуют в крупных научно-практических конференциях и форумах, но и используют современные технические возможности для сохранения и распространения знаний. Так, чтобы собрать воедино и актуализировать разбросанную по разным интернет-ресурсам информацию о миноритарных языках на территории страны, лингвистами был запущен сайт «Малые языки России» и корпусная платформа. Там размещены интерактивные карты распространения языков с информацией о диалектном членении и языковые генеалогические деревья языковых семей, визуальные представления фонетических данных и медиаматериалы.
Особое внимание в работе лаборатории уделено популяризации изучения национальных языков народов Севера, прежде всего, эвенкийского и эвенского. Молодая ученая Карина Шейфер уже больше двух лет ведет регулярный научно-популярный блог «Тунгусские заметки» об эвенах и эвенках. Кроме того, она разработала настольную игру «Стойбище» на 15 диалектах языков этих народов. В сюжет игры легли оленеводческие традиции и обычаи северян. С помощью «Стойбища» дети и взрослые могут освоить язык с нуля или повысить уровень владения эвенским и эвенкийским языками, развивая коммуникативные навыки.
Цифровой анализ русской литературы
Литературное достояние — то, чем уже несколько веков по праву гордится наша страна. Тысячи произведений разных типов словесности и исторических периодов ложатся в основу корпусов — собраний текстов в электронной форме, где можно осуществлять поиск. Такие корпусы формируют сотрудники молодежной лаборатории цифровых исследований литературы и фольклора Института русской литературы РАН.
Изучать такие «сборники» привычными для филологов методами сложно — внимательное чтение требует слишком большого времени. Зато новые методы автоматизированной работы с текстом дают возможность ставить совершенно новый тип вопросов о закономерностях литературного процесса. Они позволяют значительно расширить горизонт анализа и рассматривать длительные и масштабные процессы в истории словесности, занимающие десятилетия и столетия.
Как отмечает заведующий лабораторией Кирилл Маслинский, огромные структурные изменения в характере работы лингвистов произошли в середине 2000-х годов, когда исследовательскому сообществу страны стал доступен Национальный корпус русского языка. Если раньше примеры годами выписывали вручную из разных источников, то теперь одним поиском можно сразу составить объемную картину употребления какого-либо слова. Вслед за методами изменились и исследовательские вопросы, которые можно задавать.
«После появления корпуса лингвистическая русистика уже никогда не будет прежней. Наша лаборатория работает над тем, чтобы подобный качественный переход мог произойти и в российском литературоведении. Я считаю, что очень важный первый шаг для этого — создание и популяризация общедоступных корпусов. Мы стремимся к тому, чтобы в какой-то момент появился Национальный корпус русской литературы, и отечественное литературоведение перешло на новый уровень понимания истории литературных процессов», — рассказывает Кирилл Маслинский.
У каждого сотрудника молодежной лаборатории свой круг интересов. Ринат Бакиров с помощью современных цифровых методов изучает русскую литературу XVIII и XIX веков. Это позволяет раскрыть с новой, неожиданной стороны даже «школьную классику» — например, узнать, что скрывается за устоявшимися терминами «романтизм» или «реализм», «ода» или «поэма» и чем они формально отличаются. Также можно определить национальную или региональную идентичность произведений, исследуя то, как писатели и их тексты представлены в современном интернет-пространстве.
«Отдельная часть нашей работы — исследование и публикация забытых или вовсе неизвестных текстов, в том числе из архивов. Цифровые технологии позволяют систематизировать и досконально изучить этот материал, а также, после публикации в открытом репозитории, делают его доступным для исследования другими учеными по всему миру», — рассказывает Ринат Бакиров.
В числе направлений работы лаборатории — создание и наполнение репозитория открытых данных по русской литературе на платформе Dataverse. Стратегически важный для ученых проект по созданию научной инфраструктуры объединяет собранные корпусы, библиографические и биографические данные в качестве открытых данных, пригодных для машиночитаемой обработки и количественного анализа.
Большую работу ученые молодежной лаборатории проделали при формировании корпуса детской литературы. Для его цифрового изучения даже был разработан специальный инструмент, с помощью которого можно искать слова, места, события одновременно более чем в двух тысячах произведений XX-XXI века. А благодаря сотрудникам из Российской государственной детской библиотеки в коллекцию детского корпуса попали редчайшие тексты произведений 1920-х годов.
«Подготовка корпусных данных для репозитория открытых данных по литературе и фольклору — еще одно направление нашей работы. Наши датасеты в дальнейшем могут послужить как для воспроизведения исследований, сделанных на материалах Деткорпуса, так и для надежного хранения данных», — добавляет молодая ученая Евгения Лекаревич.
Сегодня на базе российских вузов и НИИ создано более 500 молодежных лабораторий, ведущих исследования в самых разных областях науки. 300 лабораторий было открыто в 2018-2019 годах, еще 80 — в 54 университетах в 2020 году. А в прошлом году 120 лабораторий начали работу на базе организаций-участников научно-образовательных центров мирового уровня. До 2024 года предстоит создать еще 400 молодежных лабораторий: по 150 в 2022 и 2023 году и еще 100 — в 2024.