Аналитик данных, майнер данных, эксперт по машинному обучению, специалист по анализу данных, эксперт по искусственному интеллекту, инженер по данным, эксперт по бизнес-аналитике и так далее… все это перспективные и хорошо оплачиваемые профессии.
Причины просты. Данных становится все больше и больше, и развитие компьютеров предоставляет все новые и новые способы их обработки и, как следствие, получения преимуществ. Так как же стать одним из них?
Наука о данных
Эти профессии связаны, но не одинаковы. Как и в случае с программистами, где есть люди, которые специализируются на фронтенд-разработке, бэкэнд-разработке, программировании распределенных систем и т.д.
В случае науки о данных и искусственном интеллекте можно разделить специализацию на 3 основных направления.
Специалист по отчетности и анализу
Его часто называют экспертом по бизнес-аналитике или программистом SQL.
Человек на этой должности использует данные, существующие в компании, для подготовки ценных для руководства отчетов в виде таблиц или графиков. Это могут быть статические диаграммы или интерактивные информационные панели.
Базовыми инструментами часто является аналитика данных на Python, R и инструменты визуализации данных — от Excel до Tableau или Power BI. Также следует эффективно использовать такие базы данных, как MySQL, Postgres, Oracle и иногда Hadoop.
Важны аналитические навыки и умение «делать» выводы из данных. Умение понимать требования таких отделов, как:
- маркетинг,
- продажи,
- финансы и т.д.
Специалисту этой сферы не нужно быть математиком, а скорее практичным и любознательным человеком.
Специалист по машинному обучению.
Эту должность часто называют экспертом по машинному обучению, майнером данных, а иногда и инженером по ИИ или экспертом по ИИ.
Люди на этих должностях несут ответственность за подготовку и реализацию алгоритмов, которые предсказывают, классифицируют или идентифицируют события. В отличие от специалиста по отчетности и анализу, они должны обладать знаниями и навыками в области алгоритмов, таких как деревья решений, регрессия, нейронные сети, SVM и т.д.
Роль гораздо больше связана с математикой, чем предыдущая, и здесь требуется научный склад ума.
Инженер по данным
Должность, которую часто называют Data Engineer и Big Data Engineer.
Человек на этой должности является специалистом в области обработки данных, который обеспечивает:
- очистку,
- фильтрацию,
- агрегирование данных, представленных в компании, и их размещение в базах данных таким образом, чтобы ранее описанные роли могли основывать на них свою работу.
Ему необходимо понимать структуру хранилища данных и темы Big Data, которые часто связаны с Hadoop и Spark. Основными языками программирования в этой области являются Python и Scala.
По сравнению с работой программиста, это back-end разработка, не требующая каких-либо знаний математики. Также ограничено взаимодействие с бизнес-подразделениями. Однако нужно быть эффективным программистом, который может оптимизировать обработку данных.