ТГУ и «Наносемантика» научат студентов готовить «топливо» для ИИ

19 Мая 2021

ТГУ и компания «Наносемантика», один из ведущих разработчиков технологий искусственного интеллекта (ИИ), разработали курс по контент-аналитике для студентов. Студентов научат готовить «топливо» для машинного обучения – то есть данные, на основе которых ИИ выявляет полезные закономерности и подбирает «математическую формулу» для их анализа.

За разработку программы отвечает Центр прикладного анализа больших данных ТГУ. Компания «Наносемантика» предоставляет доступ к платформе по разметке данных NlabMarker, а также участвует в проработке учебных модулей. Лучших студентов пригласят на стажировку в компанию. Новый курс будет доступен всем желающим студентам ТГУ.

Основная проблема любого разработчика искусственного интеллекта – где добыть такой датасет – массив обучающих данных – который будет и качественным, и большим, и релевантным поставленной задаче. Любой достаточно большой датасет требует огромного количества ручного труда: иногда это труд людей без специализации, а иногда – труд врачей, юристов или лингвистов. В любом случае, участник этого процесса – контент-аналитик, разметчик, асессор – должен понимать критерии качества, способы организации работы над разметкой, а также уметь работать в различных инструментах для сбора, разметки и аналитики данных, – объясняет Станислав Ашманов, глава компании «Наносемантика».

Сейчас рынок нейросетей испытывает большую нехватку контент-аналитиков, специалистов, которые умеют собирать, обрабатывать, классифицировать и анализировать текстовый контент для решения задач на основе ИИ в разных отраслях. Студенты ТГУ получат возможность получить эту специальность как дополнительную к основной, и уже в студенчестве найти работу.

Мы и сами столкнулись с нехваткой хорошо подготовленных контент-аналитиков, когда выполняли большой проект по анализу мнений и настроений российского студенчества в рамках заказа Минобрнауки в прошлом году, – рассказывает Вячеслав Гойко, директор Центра прикладного анализа больших данных ТГУ. – Теперь мы готовы обучать студентов и трудоустраивать их в свои проекты, а также в проекты наших партнеров по Консорциуму исследователей больших данных в других вузах страны.

Благодаря программе, разработчики планируют обеспечить рынок ИИ достаточным количеством специалистов по датасетам, без которых невозможна разработка алгоритмов продвинутой автоматизации.

Записаться на курс можно по ссылке.

Центр прикладного анализа больших данных ТГУ создан в 2016 году. Через год по инициативе ТГУ на базе Центра создан Университетский консорциум исследователей больших данных, включающий на данный момент, помимо ТГУ, 31 вуз. В 2019-2021 гг. совместно с технологическими партнерами Центр организовал несколько Школ прикладного анализа данных– в Томске, Москве, Якутске, Тольятти и Севастополе. В общей сложности обучение анализу больших данных прошли более 600 человек из 12 регионов России.