«В компьютерной лингвистике ТГУ – на уровне»

1 Февраля 2019

Магистрант САЕ «Институт человека цифровой эпохи» Антон Шевчук, изучающий компьютерную лингвистику, прошел обучение на семинаре по технологиям обработки речи в Афинах. Эта поездка стала возможной благодаря тревел-гранту конкурса «Академическая мобильность» фонда Михаила Прохорова.

В лаборатории когнитивных исследований языка ТГУ мы изучаем различные алгоритмы, которые применяются при генерации и анализе текста, если нужно извлечь информацию из текстовых данных. Моя магистерская работа посвящена автоматической классификации текста. Например, у нас есть набор новостей и нужно их разделить по конкретным разделам. Эта тема находится на стыке лингвистики, программирования и искусственного интеллекта, — рассказывает Антон.

В семинаре-конференции приняли участие представители компаний, которые активно используют эти технологии — Google, Apple, Amazon, Яндекс. Формат общения на мероприятии был открытым: участники представляли постерные доклады, и можно было свободно пообщаться с любым экспертом.

«Такой живое общение с людьми, чьи статьи ты читал и чьими идеями восхищался, очень вдохновляет», — признается Антон. Магистрант также заметил, что нашел на конференции коллег, с которыми будет развивать свой проект: одну и ту же задачу они будут решать в разных языках.

Большинство передовых идей и технологий в области компьютерной обработки текста созданы за рубежом. Исследователи в лаборатории под руководством профессора Зои Резановой адаптируют эти программы для русского языка. Кроме того, ученые вместе со студентами придумывают и свои проекты, которые, уверены они, будут востребованы. Ведь спрос на разных чат-ботов и голосовых помощников, которые строятся на автоматизированной обработке текста, растет по всему миру.

Познакомившись с ведущими экспертами, я могу сказать, что в моей профессиональной области ТГУ — на уровне: в лаборатории мы в курсе всего, что происходит в компьютерной лингвистике в мире, на конференции обсуждались те же проекты и новинки, о которых мы говорим сейчас в Томске. Возможно, мы пока не создаем такие продвинутые штуки, но мы уже на пути к ним, — говорит Антон Шевчук.

Автономная междисциплинарная магистерская программа «Компьютерная и когнитивная лингвистика» реализуется на базе САЕ «Институт человека цифровой эпохи». Выпускники смогут решать задачи, связанные с автоматическим анализом естественного языка для широкого спектра социально значимых проблем, таких как взаимоотношения работодателей и потребителей, особенности восприятия текста у представителей разных социальных и психологических типов. САЕ сотрудничает с крупными компаниями и университетами, среди которых Университет Турку (Финляндия), Университет наук и технологий Тронхейма (Норвегия), компании «ABBYY Россия», «Эконофизика» (Econophysica).

Фото предоставлены Антоном Шевчуком и https://twitter.com/slt2018