Mathematics for Machine Learning

Проглядел мельком очередную книжку «про машинное обучение» — точнее, даже не про само машинное обучение, а что-то вроде учебника по необходимым разделам математики:

https://mml-book.github.io/

Где-то треть книги — изложение стандартного курса линейной алгебры, еще немного — многомерный анализ (всякие там якобианы и тому подобные штуки), основы теории вероятностей и методов оптимизации. Оставшаяся треть — описание «классических» подходов к машинному обучению, заканчивающееся описанием метода опорных векторов (SVM). Впечатление — довольно странное. Для начала, предполагается, что читатель владеет понятиями вроде «производная» и «интеграл», а «вектор» для него — это пара чисел, а не отрезок со стрелочкой на конце. Как утверждается в предисловии, это примерно программа high school — но у нас ВУЗы школам в изучении этих вещей не доверяют (и правильно делают!), поэтому вузовский курс математики начинается с основ анализа.

Если же вы с математикой не соприкасались со школьных времен — то довольно быстро столкнетесь с тем, что некоторые вещи, которые хорошо бы разъяснить, здесь считаются хорошо известными. Классический курс матанализа, хотя бы с изложением теории дифференцирования функций одной переменной, попросту необходим для чтения.

Но говорить, что это книга для изучающих всякие там датасаенсы второкурсников — тоже не совсем правильно. По большому счету, это учебник по линейной алгебре — так как именно эта часть книги снабжена многочисленными заданиями для самостоятельного решения. Но там, где математика изучается на необходимом для чтения этой книги уровне, в первом и втором семестрах тоже читается курс линейной алгебры, при этом вполне полноценный! Единственное, что с моей точки зрения как-то объясняет существование книги — это желание переименовать скучную линейную алгебру в модную «математику для машинного обучения».

Вердикт — под видом датасаенса нам подсовывают замшелую линейную алгебру, протухший товар второго сорта! Заклеймить авторов позором за полное непонимание «практик будущего»! (Это я тут прочитал фейсбучную запись проректора ДВФУ Земцова и пытаюсь несмешно шутить)

Mathematics for Machine Learning: 2 комментария

    1. Нет, они вот тупо считают, что овладевать знаниями из второй категории («например, большая часть профессиональных дата-сайентистов получили компетенции в этой области в сетевых сообществах Kaggle, GitHub, Stack Overflow и подобных им. В сфере биоинформатики, возобновляемой энергетики роль открытых сообществ энтузиастов и единомышленников тоже заметна») можно совершенно независимо от наличия знаний из первой (на самом деле это совсем не так). Ну и комменты жгут, как обычно:

      В моем понимании «образование 1» — это подготовка рабочих кадров. Квалифицированные сотрудники, которые будут уметь пользоваться современными технологиями и инструментами.
      «Образование 2» — это обучение талантов. Те, кто будут эти новые технологии и инструменты изобретать.

      Много там наизобретаешь с образованием по гитхабу и стековерфлоу (интересно, по вопросам или по ответам?).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *