Apache Spark ตัวเลือกของ Big Data ที่มาแรง
Solution Big Data ที่น่าสนใจ นอกจาก Apache Hadoop แล้ว ถัดมาก็ต้องเป็น Apache Spark นี่แหละ ตัวของ Hadoop ดังมาก่อน แล้ว ค่อยพัฒนามาเป็น Spark
ความแตกต่างระหว่าง Hadoop กับ Spark หลัก ๆ แล้วคือระบบการจัดเก็บข้อมูล
- Hadoop ใช้ Hard disk จัดเก็บ
- Spark ใช้ RAM จัดเก็บ
บทสรุปของการจัดเก็บที่ต่างกันก็คือ ความเร็ว ที่ Spark เร็วกว่า เป็น 10-100 เท่าถ้าเทียบกับ Hadoop
โดยเฉพาะการทำงานที่ต้องการประมวลผลแบบ Real time แล้วตัวเลือกที่น่าสนใจสุดก็ต้องเป็น Apache Spark นี่แหละครับ