Аспирантка из Томска помогла создать хранилище данных для всемирной организации

В рубрике «Женщина в науке» в рамках Года науки и технологий Анастасия Кайда, аспирант по направлению информатика и вычислительная техника, ассистент отделения информационных технологий Инженерной школы информационных технологий и робототехники Томского политехнического университета, рассказала, как в свои 25 лет успела поработать в одной из крупнейших в мире организаций по ядерным исследованиям CERN, и о том, как по максимуму использовать возможности для молодых ученых

Обработка цифрового следа

Анастасия Кайда из Томска в конце декабря 2020 года вместе с еще 597 студентами и аспирантами со всей страны стала получателем стипендии Президента РФ молодым ученым и аспирантам, осуществляющим перспективные научные исследования и разработки по приоритетным направлениям модернизации российской экономики за разработку технологии интеллектуального анализа веб-данных для трекинга цифрового следа сообществ в социальных сетях сроком на три года.

По словам молодой ученой, веб-ресурсы, особенно социальные сети, являются кладезем информации, в частности для социологов, с которыми она работает.

«Зачастую в социо-экономических исследованиях важно посмотреть тенденцию, динамику, связи между различными сообществами в социальных сетях, – рассказывает Анастасия Кайда. – Например, для принятия решений в области молодежной политики, значимой может оказаться информация о динамике развития и связях волонтерских сообществ».

Но для того, чтобы увидеть ту или иную тенденцию в этих сообществах, необходимо обработать большой массив текстовых данных. При этом, как отмечает Анастасия, она вместе с коллегами работает только с открытыми данными – то есть с публикациями в открытых сообществах и комментариями.

«Поскольку работать с такими объемами данных сложно, так как это просто сырые тексты, никак не маркированные, нужны алгоритмы для их эффективной обработки, – объясняет аспирантка. – Технологии должны быть универсальными, так как суть текста не так важна. В текстовых массивах сначала отфильтровывается все ненужное, сами тексты приводятся в пригодный для анализа вид, затем они анализируются, оцениваются по ряду метрик, которые позволяют, например, оценить их схожесть. После того, как эта связь установлена, идет уже научная визуализация, мы видим, между какими сообществами нет связи вообще или она слабая, а некоторые сообщества, напротив, группируются в отдельные кластеры».

Параллельно с работой над технологиями интеллектуального анализа веб-данных, написанием кандидатской диссертации, преподаванием в ТПУ, написанием заявок на гранты и ведением отчетов о работе, Анастасия Кайда сейчас трудится над созданием программного обеспечения на основе алгоритмов машинного обучения для обнаружения сетевых атак. Проект был поддержан грантом «УМНИК» Фонда содействия инновациям.

20210416_150733.jpg

Как устроен первый компьютер

То, что свою жизнь Анастасия Кайда свяжет с IT-сферой, она решила еще в детстве.

«В возрасте шести лет родители подарили мне первый компьютер. И через несколько лет, как я помню, он сломался. Мне стало так любопытно, как это все работает, захотелось залезть в системные файлы, что-то посмотреть, поглядеть», – вспоминает девушка.

Позже, в 8-м классе, Анастасия участвовала в олимпиаде для школьников, где раздавали буклеты о приемной кампании Томского политеха. С тех пор сомнений, куда поступать – у нее не было.

Вдохновляющий пример

Несмотря на то, что Анастасия Кайда лишь два года назад поступила в аспирантуру, в ее резюме уже есть контракт с всемирно известной организацией CERN – местом, где был построен Большой адронный коллайдер и находится крупнейшая в мире лаборатория физики высоких энергий.

Молодая томичка вместе с группой IT-специалистов со всего мира работала с CERN в рамках эксперимента ATLAS, в ходе которого в 2012 году обнаружили бозон Хиггса.

«Поскольку эксперименты на детекторе ведутся давно (с 1994 г. – Прим.ред.), о нем скопилось очень много информации, при этом данные, связанные с экспериментами, хранятся в разных источниках. Ученым было крайне неудобно искать ее. И как раз у нас была задача создать специальное систематизированное хранилище метаданных», – рассказывает Анастасия Кайда.

По словам девушки, этот контракт она получила, еще будучи студенткой.

«Когда я училась на четвертом курсе бакалавриата, на базе Томского политеха проводилась Международная школа по большим данным. Заведующий кафедрой предложил мне сходить на собеседование, которое проводили специалисты CERN, попробовать себя. Им нужен был человек, который работал с онтологическими хранилищами - особыми хранилищами данных - и знал английский», - вспоминает молодая ученая.

По стечению обстоятельств именно эта тема была в основе творческого проекта, над которым Анастасия Кайда работала еще на втором курсе. Но тогда талантливой студентке и ее научному руководителю не хватило финансирования для дальнейших исследований, и работа остановилась. Зато двумя годами позже девушку взяли на работу в CERN.

20210416_150744.jpg

Дома много возможностей

Для подписания контракта Анастасии Кайда необходимо было съездить в Женеву, где базируется организация. Но всего раз, так как большую часть своей работы IT-специалисты могут выполнять удаленно.

Также в студенчестве в рамках магистерской образовательной программы «Технологии больших данных» девушка ездила учиться по обмену в Финляндию, в летние школы Черногории и Китая. При этом на вопрос о том, мечтает ли она уехать работать за границу, Анастасия Кайда отвечает отрицательно.

«Я хочу заниматься наукой и преподавать – то, что я сейчас и делаю здесь, в Томске. Например, в той же Финляндии получить такую работу непросто, – объясняет она. – Недавно я была на открытой лекции, ее читала преподаватель из Сибирского государственного медуниверситета, прошедшая определенный научный путь. К ней пришли ее студенты. Маленький зал человек на 20 был переполнен, и после 2-часовой лекции они окружили ее и задавали ей вопросы. Я посмотрела на нее и поняла, что хочу быть таким лектором».

По словам томской ученой, сейчас для молодых ученых много возможностей и дома – в России.

«Например, в нашем и некоторых других томских вузах есть система «Фламинго» – система оповещения о научных мероприятиях, олимпиадах, конкурсах. Студентам и аспирантам поступают уведомления на почту или в соцсети, о новых объявлениях по конкурсам, грантам, стипендиям. Главное быть активным и следить за новостями мира науки, тогда будет возможность получать финансовую поддержку для ведения научной работы», – советует Анастасия Кайда.