صفحه نخستمدل سازی هادسته بندی مدل سازیتحلیل کلان دادهنمایش مطلب

تحلیل کلان داده

ابزارهای زیادی برای تحلیل کلان داده موجود هستند. در این بخش، برخی از روش‌های کنونی موجود برای تحلیل کلان‌داده با تاکید بر سه مورد مهم نگاشت‌کاهش، آپاچی اسپارک و استورم ارائه شده‌اند. تمرکز اغلب ابزارهای کنونی موجود، روی «پردازش دسته‌ای» (batch processing)، «پردازش جریان» (stream processing) و «تحلیل تعاملی» (interactive analysis) است. بیشتر ابزارهای پردازش دسته برپایه زیرساخت «آپاچی هادوپ» (Apache Hadoop) مانند «آپاچی ماهوت» (Mahout) و «دریاد» (Dryad) هستند. برنامه‌های تحلیل داده‌های جریانی اغلب برای تحلیل‌های زمان واقعی مورد استفاده قرار می‌گیرند. استورم و اسپلانک نمونه‌هایی از پلتفرم‌های تحلیل جریان داده‌ها هستند.