Пять углов



Спецпроекты
Развлечения
Лайфхаки
Студентам
Школьные новости
Культура
Психология
ВОПРОС-ОТВЕТ
Колонка редактора
Наши опросы
Вопрос в редакцию
На практику — в ПУ!
О нас
Контакты
Архив номеров
МЕНЮ
Журнал старшекласcников
|
Читайте нас Вконтакте Читать

ЕГЭ-2022Что почитатьКаталог профессийРособрнадзорувлеченияпрофессииЕГЭ-2024интервьюрецензияподготовка к ОГЭлайфхакиитоговое сочинениеработаНовый годКак сдать ЕГЭфестивалькуда поступатьличный опытКем бытьвопрос-ответразвлеченияМинистерство образованияСПбГУопросмузыкаВУЗэкзаменыВостребованныеприемная кампания 2024советыСочинениесоветы психологарейтинг вузовКаталог вузовПсихологиярейтингЛучшее на Стенелитературапоступлениена практику — в ПУ!МГУлайфхакиЕГЭ 2024Театрподготовка к экзаменампрофориентацияшколаискусствоКнижная полка ПУподросткикарантинолимпиадыВаши историиОГЭспортжурналистикаКуда сходитьНа практику — в ПУ!75 лет ПобедытрендыДевятиклассникамподготовка к ЕГЭСпецпроектырусский языкЕГЭ 2018фильмы и сериалыолимпиадародителипутешествиявузыНовостиволонтерствочто посмотретьисследованиекиносуббота с ПУкультуражурфакотношениясаморазвитиекарьерастудентамКонцерткиноинтересные фактыкнигиисторияПоступление 2024Учительхоббиобразованиекаталог сочиненийновости кинонедели
ТОП авторов
Ольга Чибиряк

Опубликовано статей: 31

Елизавета Уварова

Опубликовано статей: 7

Екатерина Волгина

Опубликовано статей: 14

Илья Воробьев

Опубликовано статей: 8

Дарья Хрипунова

Опубликовано статей: 8

София Харламова

Опубликовано статей: 5

Пять углов

Знакомьтесь — Вася! Студенты НИУ ВШЭ рассказали, как они создавали чат-бот для Эрмитажа

6 минут

Кто такой Вася и где его найти, узнала Анна Александрова, СПбГУ, г. Санкт-Петербург

Считается, что ты прожил жизнь не зря, если оставил что-то после себя. Можно сказать, что студенты ВШЭ этого уже достигли. Они разработали специальный проект для Эрмитажа — чат-бот в Телеграме, который ищет картины из коллекции музея. 

Если вы забыли, как называется произведение, но помните, что на нем изображено, можно просто написать «Коту Васе» (название бота). И он выдаст несколько вариантов, подходящих под описание, расскажет об истории полотна, а также о том, в каком зале Эрмитажа оно выставлено.

КАК ПОЯВИЛСЯ «ВАСЯ»?


Представители музея довольно продолжительное время думали о создании проекта, который бы помог им пополнить базу с описанием различных артефактов Эрмитажа. И когда собственных сил стало недостаточно, сотрудники музея начали привлекать к этому делу «молодые умы». Так, магистрантам направления «Языковые технологии в бизнесе и образовании» предложили необычный вариант выпускной квалификационной работы: чат-бот для музея.

Над проектом работает команда из семи человек, во главе которой Мария Сергеева. Она регулирует работу команды и ее взаимодействие с заказчиком. Полина Налобина — специалист по Эрмитажу и второе «лицо» проекта. Вместе с еще двумя студентками — Ангелиной и Камилой — она работает над базой данной: девушки изучают картины, места их хранения и общую историческую информацию. В команду технической разработки модели входят Влада и Полина. Влада —разработчик языковой модели, именно «бэкэнда» проекта. А над самим чат-ботом работают Антон и Лиза. Антон на год старше, и у него гораздо больше опыта в разработке, поэтому он сильно помог команде. 

Изначально мы пытались работать над генерацией текста в определенном стиле. Мы смотрели, как это можно сделать через анализ самих картин, но в итоге решили, что будет куда выигрышнее сделать бота, которым бы могла пользоваться более широкая аудитория. Поэтому мы пришли к варианту, который сейчас имеется у нас на руках
Камила, одна из участниц команды

Магистранты начинали со «странных вещей»: например, тегов, когда компьютер сам обрабатывает текст и выделяет в нем определенные «якори» (имена собственные, геолокачии). По этим «якорям» компьютер и ищет то, что нужно: сравнивает запрос со своей базой таких же текстов. 

Правда, потом студенты поняли, что этот способ им не подходит, потому что картины достаточно сложно описать по таким тегам. Так ребята нашли способ векторизации.

КАК РАБОТАЕТ ЧАТ-БОТ?


Основной вопрос для студентов состоял в том, как научить компьютер понимать естественный язык? И если вы хоть раз задумывались о том, как работает поиск в гугле, то здесь все примерно похоже. 

Векторизация — это процесс, при котором компьютер понимает текст. Происходит это за счет того, что буквы и знаки переводят в цифру, а для каждого числового значения задают свой вектор. Это помогает компьютеру понимать не только отдельные слова, но и целые предложения. 

Например, два слова вместе значат что-то иное, чем по отдельности. Тогда в «коробке» высчитывается вектор, определенное числовое значение. Для нас оно ничего не значит, но компьютер понимает под этим числовым значением именно ту фразу, которую мы сказали.

В базе данных хранятся вектора для уже готовых описаний картин. Соответственно, мы ищем описания, соответствующие векторам, которые наиболее близки к запрашиваемому, и выдаем топ-5 наиболее близких векторов. Иначе говоря, выдаем те картины, описания которых наиболее близки к запрашиваемому для того, чтобы векторизовать описания, которые у нас есть для картин. Описание тоже строится не руками, для этого мы используем модель под названием GRIP, чтобы из картины произвести имидж-то текст и получить текст
Влада, одна из участниц команды
Фото: сайт НИУ ВШЭ

Когда команда думала, как соединить три части — модель, чат-бот и базу данных, они пришли к выводу, что единственный доступный вариант — это запустить все на трех компьютерах, связать между собой и держать их включенными, пока чат подработает. Реализация очень сложная, почти невозможная. В этом случае, если запросов будет много, ноутбуки просто не выдержат. И тогда они обратились за помощью к Яндексу. 

Яндекс сотрудничает с Высшей школой экономики достаточно долго. Они с радостью предоставляют нам возможности для реализации проектов. Это такое двухстороннее соглашение, мы помогаем им, а они — нам. И сейчас Яндекс согласился поучаствовать в нашем проекте. Они предоставили нам вычислительные мощности и сервер, с которыми мы сейчас работаем
Мария Сергеева, одна из участниц команды

В будущем, когда проект перейдет к Эрмитажу, компания продолжит поддерживать бота и помогать его развивать. По сути, они не единственные, кто помог студентам. Ребят поддерживали специалисты кампусов ВШЭ не только из Петербурга, но и из других городов. 

ПЕРСПЕКТИВЫ ПРОЕКТА


Сейчас чат-бот находится на стадии доработки. Многое сделано, но еще больше предстоит. Название «Кот Вася» — тестовое. Оно родилось благодаря кошкам Эрмитажа, с которыми тот неразрывно связан, и временно прижилось. Кто знает, может быть, представители музея сохранят название. А еще в будущем у «кота» появится и своя легенда, но об этом еще рано говорить.

Сам Эрмитаж видит в боте большой потенциал и планирует развивать его, когда магистранты закончат свою работу и полностью передадут управление над ботом. 

Мы не ограничены только Зимним дворцом. Также в нашей базе есть и предметы из Главного Штаба. Пока мы работаем только с живописью, но хотелось бы, чтобы бот мог искать и другие произведения искусства. Однако коллекция музея огромна, и для этого требуется большая команда и много времени
Камила, одна из участниц команды

Чат-бот готовят к 260-летию Эрмитажа, которое состоится в декабре этого года. К этому моменту он будет запущен и доступен публике в рамках празднования. Однако после этого команда планирует продолжить дорабатывать его, чтобы представить окончательно готовый вариант в мае 2025 года к моменту своего выпуска и защиты. 

Бот не привязан к юбилею, он бессрочен, потому что основной массив данных неизменен, он таким останется, разве что, если какие-то новые картины попадут в коллекцию Эрмитажа, тогда его нужно будет дополнять. Он еще долго сможет быть актуален и будет успешно функционировать
Камила, одна из участниц команды

Проект действительно оказался огромным и очень сложным. На каждой стадии было все труднее: физические моменты не работали так, как должны были работать, идея оказывалась проигрышной, хотелось все бросить, но ребята все преодолели. Они держались за свой исследовательский интерес и желание сделать что-то по-настоящему крутое. Теперь благодаря им кошки Эрмитажа поселятся не только на территории музея, но и в Интернете.

Кто такой Вася и где его найти, узнала Анна Александрова, СПбГУ, г. Санкт-Петербург


Комментировать

Новые материалы

Читайте также

Привязка статьи к блоку

ID статьи:
Сохранить
Самое читаемое
Яндекс.Метрика
ООО «Пять углов» Контакты:
Адрес: 9-я Советская, д.4-6 191015 Санкт-Петербург
Телефон:8 (812) 274-35-25, Электронная почта: mail@5uglov.ru