Apache Hadoop — платформа с открытым исходным кодом для обработки большого объема данных в кластерной среде. Он использует простую модель программирования MapReduce для надежных, масштабируемых и распределенных вычислений. Хранилище и вычисления распределены в этой структуре. Apache Hadoop обеспечила революцию больших данных, по крайней мере, с точки зрения программного обеспечения.
[Глоссарий распространенных терминов машинного обучения, статистики и науки о данных. (Электронный ресурс). Режим доступа: http:// analyticsvidhya. com›glossary-of-common-statistics-and-machine-learning-term /, свободный.]