Машины вместо инженеров (часть 2)

Большая часть значимых результатов по автоматизации работы datascientist’ов получено за последние полгода. Очень трудно предсказать, что именно произойдет через год и тем более через два года.

Зато можно почти наверняка прогнозировать, что в своей массе промышленные datascientist’ы не станут заниматься задачами, подобными тем, которые выше описаны, вручную. Для части из них, которая может заниматься более сложными задачами, это окажется отличным повышением производительности и избавлением от нудной рутинной работы в пользу творческой и более интересной. Для другой части, которая к такой деятельности ещё не способна, чья текущая работа сводится к запуску готовых скриптов и изменению параметров в них (а это на самом деле часто является нишей juniordatascientist’ов), это значит вытеснение из профессии. Именно таким людям и необходимо в первую очередь подумать своим будущим. Вероятно, их роль сведётся к интеграции моделей, созданных компьютером, вероятно, — они попадут в положение подчинённое компьютеру и станут размечать данные для алгоритмов машинного обучения. Но в любом случае сомнительно, что на своей текущей позиции они продержатся довольно долго.

Для такого тренда имеется четкий экономический фундамент: datascientist’ыочень дороги (по оценке компании Paysa, datascientist зарабатывает $167 000 в год, а разработчик — $139 000), их ресурс ограниченный, а обучение не быстрое. Для того, чтобы обучить с нуля подобного специалиста, требуется полноценное многолетнее вузовское образование с сильными программированием и математикой (а ещё хорошо бы обладать экспертизой в той предметной области, где планируется применять машинное обучение). Чтобы переобучить имеющегося математика или программиста, потребуется так или иначе хотя бы полгода на освоение новой для него области.
Существуют различные попытки этот процесс ускорить(с помощью как офлайн-программ, так и онлайн-инструментов), но не стоит от нихждать чудес. На получение так называемого «нанодиплома» в сфере технологий искусственного интеллекта от сервисов онлайн-образования (к примеру, Udacity) уйдет полгода, в машинном обучении — год. Совместная программа МФТИ и «Яндекса» также рассчитана на шесть месяцев. Стартап не может отправить на полгода сотрудника на обучение и не может ждать столько, пока кандидат улучшит свои навыки. Так что далеко не каждая компания может себе позволить держать в штате одного или нескольких неплохих специалистов, а задачи необходимо решать, как это бывает обычно, «уже вчера». Это лишь ускорит проникновение автоматизации в эту область.

Datascientist’ы не станут единственными из ИТ, кого ждёт подобная участь. В программировании тоже много довольно нудных и скучных задач. Среди них — поддержка и создание простых интеграций (научить программу общаться с другой известной программой, использовать программную библиотеку или веб-сервис), проектирование интерфейсов к базам данных (редактирование и добавление записей, стандартные экраны на просмотр,). Возьмем «клепание» типовых сайтов (куда, к примеру, необходимо подключить поддержку авторизации через несколько источников, работу с имеющейся товарной базой данных, приём заказов и т.п.) — это уже умеют делать конструкторы сайтов, но всё равно многие программисты заняты написанием подобных систем с нуля. Компьютеры быстро «умнеют» и вскоре они сумеют на себя взять многие из этих задач. Тем более, что не только в искусственном интеллекте не хватает компьютерных специалистов. В 2015 в США году открытых вакансий оказалось в 9 раз больше, чем выпускников по программам, которые связаны с программированием.

Интеграция двух компьютерных программ требует по-прежнему большого вовлечения человека. К примеру, если вам требуется в вашу программу встроить возможность перевода текста на другой язык, вам необходим программист чтобы 1) найти подходящую реализацию в виде программной библиотеки или облачного сервиса, предоставляющего API, что чаще всего сводится к поиску в Google и не позволяет эффективно сравнить несколько разных вариантов, 2) написать программный код, который станет формировать запрос по стандартам выбранного API (которое, вероятно, даже уже описано в машиночитаемом формате); 3) обеспечить поддержку созданной интеграции: следить за её стабильной работой, переключаться на новые версии и т.п.

Это всё довольно затратные по времени процессы и они как задачи довольно неинтересны. Компьютеры могут на себя взять по крайней мере часть из этих задач и методы искусственного интеллекта могут помочь это сделать. Тем более, что в этой сфере у новых компаний имеется экономический стимул откусить кусок от пирога — рынок системной интеграции огромный (по оценке Forrester, — $35 млрд на программную интеграцию и почти $400 млрд на системную интеграцию), а количество инженеров в штате, которые занимаются интеграциями, может достигать сотен и иногда тысяч.

Существуют и другие области в ИТ, где ручной труд не очень эффективный, плохо масштабируется и является очень важной статьёй расходов. Это сетевое администрирование (автоматизация дата центров — рынок объемом в $7,5 млрд к 2019 году) , управление сетями ($11 млрд к 2019 году), тестирование ($32 млрд. в 2016 году ), системы безопасности ($120 млрд. по итогам 2017 года). В каждой из областей уже имеется какое-то количество стартапов, которые применяют методы искусственного интеллекта. Их продукты почти наверняка станут приносить все более ощутимую пользу, которая измеряется с точки зрения бизнеса и в деньгах.

В принципе,все разговоры про автоматизацию программирования не новы. Мы их слышим уже не одно десятилетие, но до последнего времени все-таки они были не столь близки к реальности. Восторженных прогнозов про развитие искусственного интеллекта за всю его историю тоже было очень много. Сколько уже звучало прогнозов от очень уважаемых людей о том, что искусственный интеллект за одно летонаучится решать задачи, с которыми пока справлялся только человек, или о том, что машины смогут справиться со всеми основными человеческими задачами в течение двадцати лет (прогноз 1965 года). Есть и сейчас признаки «хайпа». Почему же кажется, что в этот раз всё будет по-другому?

Есть важная деталь, которая до сих пор часто ускользает от внимания людей, находящихся чуть в стороне от современного состояния технологий искусственного интеллекта, — компьютеры уже стали лучше человека в некоторых областях, которые ещё недавно считались сугубо человеческой вотчиной. Откройте любую старую (старше 5 лет) книжку по искусственному интеллекту, чтобы увидеть классический пример задачи, которую отлично решает трёхлетний ребёнок, но не способен решить компьютер. Это задача отличить на фотографии кошку от собаки. Уже несколько лет это не так. В ежегодном соревновании ImageNet по распознаванию изображений нейросети отлично справляются с этой задачей, отличая не только кошку от собаки, но и различая между собой более ста пород собак, а также сотни других классов. Более того, они делают это точнее человека.

Это тоже очень важный тренд. В 2011 году задокументировали первый случай распознавания изображений программой с более высоким качеством, чем человек. И это не какая-то далекая от повседневной жизни история, речь шла о распознавании дорожных знаков на фотографиях с реальных дорог. Да, человек ошибается больше, чем компьютер. А компьютер не устаёт, его мощности можно легко масштабировать и так далее. С тех пор в качестве распознавания человек уступал машинам во все новых задачах — в сегментации срезов мозга, в распознавании номеров домов на снимках в GoogleStreetView и других случаях.

Похожее происходит и в распознавании речи — области, долго топтавшейся на месте до прихода в неё глубоких нейросетей. Сервисы перевода текстов и распознавания речи выходят на новые рубежи, сейчас они способны в определённых случаях распознавать речь лучше человека или по крайней мере с сопоставимой точностью. Они научились в реальном времени переводить голосовой поток в Skype с одного языка на другой. Прогресс в области обработки текстов также значителен, нейросетевые переводчики понемногу вытесняют системы предыдущего поколения, основанные на статистическом переводе. Так, недавно Google переключил на нейросети переводы для русского языка, а нейросетевые диалоговые системы хоть ещё и далеко не идеальны, но демонстрируют интересные результаты.

Стоит заметить, что человеческий язык сложнее языков программирования, так что в компьютерных языках результат может быть получен раньше. В работе с языками программирования также существуют любопытные примеры, к примеру, недавно нашумевший результат от Microsoft под названием DeepCoder. Он способен генерировать программы для решения задач, похожих на типичные соревновательные задачи. В реальности СМИ часто некорректно интерпретировали итоги проекта: была информация, что DeepCoder собирает программы из фрагментов кода с сайта StackOverflow (известный сайт для программистов с ответами на вопросы) и т.д., что неверно — в работе DeepCoder используется специальный искусственный язык. Результаты DeepCoder и его обсуждение в СМИ показывает общий интерес к теме. Можно ожидать, что вскоре компьютер победит программистов в их «родном» соревновании — на лучший код. Ведь в игре в го компьютер (программа AlphaGo от DeepMind) уже обошел человека.

Всего за полгода до этой победы большинство прогнозов сообщали, что до такого события ещё около 10 лет. И вот эта сложная задача решена. Более того, компания DeepMind активно продолжает развивать AlphaGo. С одной стороны, система становится все лучше в игре го. В этом она становится настолько лучше человека, что лучшие мастера го после игры с ней задаются вопросами про смысл своих предыдущих достижений. «Я бы сказал, что ни один человек не был близок к познанию смысла игры в го», - сообщил после победы AlphaGo один из китайских мастеров. «Мне не остается ничего, кроме как спросить себя: однажды, много лет спустя, когда ты обнаружишь, что твое сознание, твои восприятия и сделанный тобой выбор оказались неверными, продолжишь ли ты идти тем же путем или отвергнешь себя?» — другая яркая цитата. С другой стороны, DeepMind применяет с успехом алгоритмы в основе AlphaGo и к решению различных бизнес-задач — например, к оптимизации энергопотребления в датацентрах Google (что приносит экономию в 40% на охлаждении). И примеров способности компьютера решать человеческие задачи всё больше.

Чем ещё так хороши ИТ-работы для проникновения машинного интеллекта? Тем, что это родная среда для искусственного интеллекта, в отличие от родного для нас, людей, физического мира. Виртуальная среда позволяет быстрее меняться, с ней проще интегрироваться, не надо разрабатывать сложные инженерные решения для физического взаимодействия с миром, хотя и здесь есть немалый прогресс. Идеи про замену ИТ-работников уже не маргинальны, их разделяют и весьма знаковые люди в венчурной индустрии. Совсем недавно Винод Хосла, известный американский инженер и бизнесмен, заявил на конференции, что до 80% работ в ИТ могут быть заменены автоматизацией. Стоит прислушаться.

Машины вместо инженеров (часть 2)

будущее,

ИТ,

технологии