Анализ больших наборов данных
👤 Лесковец Юре
Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining).
В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация.
Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.
Перевод: Слинкин Артем А.Год издания: 2016Формат: pdfЯзык: ruРазмер: 2967 KbСкачиваний: 919
PDF
Подробнее / Серии