Первый в РФ лингвахакатон: в ТГУ создали сервис для анализа новостей

14 Мая 2018

В ТГУ прошел первый в России лингвистический хакатон LinguaHack. Айтишники и лингвисты вместе создали программы по анализу поздравлений для «Томскпромстройбанка» и по автоматическому распределению новостей в соответствии с регионом, где произошло событие. Они также предложили провести эксперимент с виртуальной реальностью (VR), чтобы показать, как эта технология улучшает качество обучения школьников и студентов.

LinguaHack предполагал два формата участия: команды могли разработать проект научного исследования связи языка и мышления или создать прототип IT-продукта для решения кейсов.

Команда победителей решала проблему автоматического распределения новостей по регионам. Студенты филологического факультета Александр Здоровец, Антон Шевчук, Долана Сарагбай, Татьяна Алексеева и Анна Хохлова создали программу, которая анализирует встречающиеся в тексте названия городов и соотносит их с соответствующим регионом. В будущем они планируют добавить в анализатор достопримечательности и решить проблему омонимичных названий, например, город Тайга и тайга как лес. По мнению филологов, программа пригодится новостным агрегаторам, СМИ для анализа повестки регионов и другим компаниям.


Экспертами на хакатоне выступили начальник управления инновациями ТГУ Михаил Головатов, зав.лабораторией когнитивных исследований языка, профессор ТГУ Зоя Резанова, доцент ФилФ, специалист по Cognitive Science Оксана Царегородцева, старший преподаватель ТПУ Борис Пякилля, начальник отдела информации и маркетинга «Томскпромстройбанка» Елена Маслова, руководитель отдела подбора и адаптации персонала компании «Эконофизика» (ООО «Эко-Томск») Александр Бойко. Также в работе приняла участие директор учебного центра «Эко-академия» Ольга Брагина.

Все эксперты согласились, что ребята показали высокий уровень и за короткий срок создали продукт, который можно выводить на рынок, – отметил Михаил Головатов.

Две другие команды создали программы для анализа поздравлений по заказу «Томскпромстройбанка», эти сервисы могут выделять уникальные и шаблонные тексты и показывать топ-20 слов, характеризующих банк. Итогом стали рекомендации по коммуникации с клиентами, партнерами и СМИ.

Мы хотели вычленить, что о нас думают в первую очередь наши клиенты, какими словами о нас отзываются, – пояснила начальник отдела информации и маркетинга «Томскпромстройбанка» Елена Маслова.Команды показали два абсолютно разных пути, и тот, и другой имеют место быть. Одна команда предоставила результат с уже готовыми рекомендациями, вторая создала программу, куда я как специалист могу в будущем вбивать тексты и понимать, что думают клиенты о банке. Оба проекта имеют интересные перспективы.

Команда бакалавров-лингвистов описала научный эксперимент с применением видео и VR-технологий. Он должен подтвердить, что с помощью виртуальной реальности человек лучше запоминает термины. Также студенты хотят посмотреть, какие участки мозга при этом активно работают.

На хакатоне реализовалась наша главная цель – создать прототипы команд, которые объединяют лингвистов и программистов для решения задач, востребованых на рынке труда, – отметила профессор ТГУ Зоя Резанова. – Важно, что студенты приглашены для участия в реализации исследовательских и прикладных проектов в ТГУ и организациях-партнерах хакатона. Также мы показали перспективы нашей магистратуры. Лингвистика в настоящее время – прикладная наука, ее методы используются для решения многих прикладных задач.

Все участники лингвистического хакатона при поступлении на магистерскую программу «Компьютерная и когнитивная лингвистика» получат 100 баллов по вступительному экзамену. Кроме того, их пригласили в лабораторию лингвистической антропологии и лабораторию когнитивных исследований языка ТГУ для реализации совместных проектов.

В 2017 году в ТГУ в САЕ «Институт человека цифровой эпохи» была запущена магистерская программа «Компьютерная лингвистика», в этом году объявлен набор на интегрированную программу «Компьютерная и когнитивная лингвистика» с двумя модулями. Студенты изучают формальные модели языка, языки программирования, математическую статистику, дисциплины, синтезирующие лингвистические и математические подходы (Text Mining), анализ естественного языка (NLP), а также дисциплины «Язык и мозг», «Основы психолингвистики», «Методы окулографии в лингвистических исследованиях» и другие. Обучение предусматривает много практики.