Сергей Марин, основатель «Школы
Данных» о профессии специалиста по машинному обучению:
Первыми машинное обучение стали применять банки в скоринге клиентов: модель изучала имеющийся опыт и предсказывала, вернет ли деньги человек. Потом систему стали применять в маркетинге, дальше это перешло на другие сферы.
Объясню принцип машинного обучения на примере. Рождается ребенок, его учат отличать девочек от мальчиков. Конечно, можно объяснить: такое-то строение тела, значит, перед тобой мальчик. Длина волос такая-то, значит – девочка. Но детям просто говорят, что это Катя, а это Витя, и ребенок сам каким-то образом определяет, кто есть кто.
Точно так и в машинном обучении: мы уходим от конкретных объяснений. Берем клиентов, собираем по ним большое количество данных с множеством параметров, напротив имени каждого выставляем так называемую обучающую выборку. И машина на основе этого сама учится определять, кто из клиентов тоже «оттечёт» или останется.
Чтобы стать специалистом в этой
области, нужно уже в школе изучать математику. Не столько учить, сколько
постоянно ею пользоваться: важно понимать модели и как они работают. Нужно
знать программирование, разбираться и в бизнес-составляющей, чтобы не создавать
модели, которыми невозможно будет пользоваться в
реальной жизни.
До недавнего времени у нас в стране почти не было подготовки в данном направлении: лишь одна кафедра в МГУ и вторая в физтехе. Потом «Яндекс» открыл «Школу анализа данных», куда можно пойти после четырех лет вуза. Уже существуют образовательные курсы, но некоторые из них будут понятны только для людей с техническим образованием. Так что, нужно идти на техническую специальность, где будет математика и программирование, а потом уже на профессиональную кафедру и развиваться дальше.