ТГУ и ВятГУ в составе Университетского консорциума исследователей больших данных реализуют проект по поиску жертв супружеского насилия через интернет. Исследование онлайн-обращений и комментариев к ним стало дополнительным источником информации о специфике супружеского насилия, его видах и формах, а также масштабах распространения.
Центр прикладного анализа больших данных ТГУ помог коллегам из Кировской области с масштабным сбором данных из различных сегментов интернета, их обработкой и извлечением конкретной информации, которая интересует исследователей. Сбор и обработка данных проекта осуществляется в рамках Центра коллективного пользования платформой PolyAnalyst на базе суперкомпьютера Томского государственного университета Cyberia.
Функция извлечения ключевых слов при помощи данной платформы дала возможность ученым не только предложить теоретические механизмы анализа, но и применить открывшиеся возможности на практике. Из всего массива сообщений о насилии были выделены посылы, связанные с просьбами реальных жертв о помощи: «помогите», «спасите», «караул», «поддержите», «прошу совета», «прошу помощи», «больше не могу терпеть».
– Сбор информации шел в соцсетях, в блогах и микроблогах, в интернет-СМИ, на форумах, в YouTube и на тематических порталах на протяжении года. Но надо понимать, что в Сети собирается большое количество информационного «мусора», так что данные нужно фильтровать. Вручную это сделать, по сути, невозможно, поэтому такая работа ведется в автоматическом режиме с использованием программных инструментов наших партнеров. Полученные данные мы передавали в ВятГУ, где велись анализ и описание результатов, – уточняет руководитель направления текстовой аналитики Центра прикладного анализа больших данных ТГУ Евгений Петров.
Согласно полученным данным, основной формой насилия, о которых люди пишут в сообщениях, является физическое насилие (81%), на втором месте – психологическое насилие (15%). Сексуальное и экономическое насилие составляют менее 5% от всех релевантных сообщений. В сознании пользователей насилие ассоциируется, прежде всего, с применением физической силы. При этом женщины чаще являются жертвами насилия (72%), однако мужчины также бывают пострадавшими (28%). Если жертвой выступает мужчина, то чаще речь идет о смешанной форме насилия, когда женщина совершила деяние в ответ на мужское насилие.
Сотрудничество ВятГУ и ТГУ началось в декабре 2019 года во время проведения Томским государственным университетом «Школы прикладного анализа данных» в Москве. После этой школы руководство ВятГУ приняло решение войти в Университетский консорциум исследователей больших данных с проектом, направленным на оценку эффективности деятельности онлайн-сообществ по поддержке жертв супружеского насилия.
– Тематика, связанная с домашним насилием, была определена в самом начале нашего сотрудничества кафедрой социальной работы и молодежной политики ВятГУ. Ученые кафедры понимали, что за время работы накоплен значительный опыт по работе с жертвами супружеского насилия, и применение новых методов, связанных с анализом данных из открытых источников, поможет существенно обогатить применяемые теоретические алгоритмы, – рассказывает руководитель проекта, проректор по развитию на основе анализа данных ВятГУ Екатерина Митягина.
По словам Екатерины Митягиной, выбор ТГУ в качестве партнера был очевиден – именно Томский госуниверситет является основателем самого успешно действующего консорциума по анализу данных в РФ.
Кроме того, результатом совместной работы ТГУ, ВятГУ и Центра социально-психологической помощи стала поддержанная Фондом Потанина заявка на создание нового сайта и чат-бота для сбора первичного анамнеза и оказания помощи людям из отдаленных районов Кировской области. Так появился на свет умный помощник «Лада».
– За год вручную и автоматически при помощи лаборатории интеллектуальных систем ВятГУ было обработано 133 000 сообщений и создан первый русскоязычный корпус о супружеском насилии. При поддержке ТГУ и компании «Мегапьютер Интеллижденс» произведена обработка данных, определены основные формы и виды насилия, типы абьюзеров, – добавляет Екатерина Митягина.
Сейчас сайт уже запущен, а умный помощник «Лада» находится в процессе обучения. В планах – автоматический поиск жертв насилия в социальных сетях и предложение им помощи.