Hadoop یک چارچوب نرمافزاری رایگان، منبع باز و مبتنی بر جاوا است که برای ذخیرهسازی و پردازش مجموعهای بزرگ از دادهها برروی چندین دستگاه (خوشه هایی از سرورها) استفاده میشود. این برنامه، از HDFS ( سیستم فایل توزیع شده Hadoop) برای ذخیره دادههای خود و پردازش این دادهها با استفاده از MapReduce استفاده میکند. این نرم افزار، یک اکوسیستم از ابزارهای Big Data است که توسط کمپانی Apache ساخته شده است و در درجه اول برای داده کاوی و یادگیری ماشین مورد استفاده قرار میگیرد. Hadoop معمولاً پردازش ها را به صورت توزیع شده (بر روی چند کامپیوتر مختلف) انجام داده و نتایج را به کامپیوتر مقصد برمیگرداند.