Любовь Ковригина, доцент кафедры информатики и прикладной математики, Университет ИТМО о профессии матлингвиста:
Математическая лингвистика – это
научное направление, возникшее в 1950-х годах на стыке многих дисциплин.
Матлингвистика занимается разработкой математических моделей единиц языка,
языковых процессов, моделей коммуникации
— все эти формальные модели
нужны, чтобы компьютер мог понимать естественный язык, на котором ежедневно
общаются люди. Мы с вами делаем это, не осознавая, насколько сложные структуры
требуются для описания языка, который мы без особых проблем освоили в раннем
детстве. И не задумываемся, как много внешней информации мы используем, чтобы
понять
сообщение собеседника или какой-нибудь текст.
В начале основной прикладной задачей матлингвистики был машинный перевод, затем фокус сместился в сторону автоматической обработки языка в информационно-поисковых системах, диалоговых системах и интеллектуального анализа данных. Сейчас в список горячих тем вырвалась разработка когнитивных систем и мультимодальных голосовых интерфейсов — интеллектуальных систем, которые умеют самостоятельно обучаться, общаться с пользователям на естественном языке и искать для него необходимую информацию.
Матлингвист работает, прежде всего, с
текстом. Допустим, к вам поступают
большие данные, собранные из Интернета, и нужно классифицировать их по темам (например, с использованием алгоритмов тематического моделирования). Или ставится задача
автоматического пополнения онтологии, или разработки диалоговой системы,
которая сможет отвечать на вопросы пользователя…Компьютерные технологии и
методы автоматической обработки естественного языка являются лишь частью
матлингвистики, но именно они нужны лингвисту при работе в сфере искусственного интеллекта.
Сфера профессиональных интересов матлингвиста очень разнообразна, но для профпригодности вам нужно будет знать и лингвистику, и математику, и программирование, т.е. быть хорошим специалистом сразу в нескольких предметных областях. Для решения большинства задач в области автоматической обработки естественного языка и интеллектуального анализа текстов сейчас также применяется машинное обучение.