Big Data คือ
ความหมายตรง ๆ คือ พื้นที่เก็บข้อมูลทุกอย่างที่เรามีอยู่ในบริษัท ทั้งข้อมูลที่มีแหล่งที่มาจากภายในบริษัทเอง และข้อมูลที่มาจากแหล่งที่มาภายนอก อย่าง Social medias ซึ่งทั้งหมดเป็นข้อมูลที่สามารถนำมาวิเคราะห์ได้ ทั้งนี้ข้อมูลเหล่านี้สามารถนำมาวิเคราะห์ได้ด้วยวิธีการหลากหลายวิธีการ ขึ้นอยู่กับว่าคุณต้องการนำข้อมูลเหล่านั้นไปใช้งานด้านไหน ในปัจจุบันนิยมทำ Analysis เพื่อใช้ในการสำหรับการคาดการณ์เหตุการณ์ในอนาคต หรือ ก็คือ เพื่อใช้ดูแนวโน้มสิ่งที่จะเกิดขึ้นนั้นเอง
ตัวอย่าง ข้อมูลที่เอามาเก็บในระบบ
- ข้อมูลติดต่อของผู้ร่วมธุรกิจ
- ลักษณะของผู้บริโภค
- การทำรายการธุรกิจต่างๆ ในแต่ละวัน
- ตัวอักษร ไฟล์เอกสาร รูปภาพ
- รวมถึงข้อมูลอื่นๆ แทบทุกประเภทที่อยู่บนโลกออนไลน์
ใครที่เหมาะกับ Solution นี้
คนที่มีข้อมูลจำนวนมาก และ ต้องการหาประโยชน์จากข้อมูลนั้น ๆ คือ คนที่เหมาะสมที่สุด ตัวอย่าง เช่น บริษัทขายของออนไลน์ ใช้ Big Data ในการวิเคราะห์พฤติกรรมของลูกค้าโดยอาศัยข้อมูลจากการ Tracking (ติดตามพฤติกรรมการใช้งาน) การค้นหาข้อมูลของลูกค้า ว่ามีความต้องการเป็นอย่างไร โดยยังสามารถตรวจสอบราคาของคู่แข่ง จำนวนสินค้า เพื่อนำเสนอให้ตรงกับความต้องการของลูกค้ามากที่สุด แล้วจึงนำข้อมูลเหล่านี้มาเสนอให้กับลูกค้าแบบอัตโนมัติและปรับราคาขึ้นหรือลงโดยอิงจากความต้องการของตลาด
ขั้นตอนการทำงานของระบบ
- จัดเก็บข้อมูล
คือการนำข้อมูลที่เราต้องการทั้งหมดมารวมกันไว้ที่เดียว ซึ่ง อาจจะมีนั้นข้อมูลในรูปแบบตาราง หรือ text ล้วน ๆ ก็ได้ - ประมวลผล
คือ การจัดหมวดหมู่ข้อมูลให้เป็นระเบียบ เอาข้อมูลที่ไม่ถูกต้องออก ให้เหลือเฉพาะส่วนที่สามารถนำไปวิเคราะห์ต่อได้ - วิเคราะห์
คือ การหาประโยชน์จากข้อมูล ซึ่ง อาจจะเป็นมุมมองของการบอกอนาคต หรือ การจัดกลุ่มข้อมูลที่มีความสัมพันธ์ที่ซับซ้อนให้อยู่ในรูปแบบที่ง่ายต่อความเข้าใจ
ระบบ BigData ในการ Implement จริงอาจจะไม่ได้รวมถึงการทำวิเคราะห์ ก็ได้ เพราะอาจจะเป็น Phase แรกของการพัฒนาโครงการ ที่เน้นเรื่องการการวาง Infrastructure ก่อน ซึ่งถ้าการลงทุนในเรื่องนี้มากเกินไป ก็สามารถเลือกใช้บริการ เช่น ใช้บน Cloud ก็ได้
โครงสร้างสำหรับ Big Data
ตัวโครงสร้างของระบบปัจจุบันสามารถแยกออกได้ 2 แนวทาง
- On Cloud : สำหรับการขึ้นระบบใหม่ขอแนะนำให้เลือกใช้แนวทางนี้เพราะทำได้รวดเร็ว และ ประหยัดค่าใช้จ่าย กว่าในการบริการจัดการ
- On Premise : สำหรับกรณีที่ติดขัดเรื่องการขึ้นบน Cloud ก็สามารถทำได้แต่ต้องเลือกอุปกรณ์ และวางแผนเป็นอย่างดี เนื่องจากเป็นการลงทุนที่สูงและไม่สามารถเปลี่ยนแปลงได้ง่าย
On Cloud Solution
ข้อดีของ Solution On Cloud คือ การควบคุมค่าใช้จ่าย ในการบริการงบประมาณให้สอดคล้องกับการใช้งานจริง ซึ่งข้อนี้บางคนมองว่า ไม่สามารถควบคุมได้เพราะขึ้นกับการใช้งาน แต่ในความเป็นจริงพบว่า การทำ Big Data เมื่อเทียบงบประมาณแบบจริงจังแล้ว แบบนี้ถูกกว่ามาก
Solution Microsoft Azure Modern Data Warehouse ที่ช่วยให้การเริ่ม Big Data ทำได้ง่าย ด้วยโครงสร้างที่มีควาามพร้อมรองรับข้อมูลได้ทุกประเภท และมีเครื่องมือในการวิเคราะห์มาให้แล้ว ทำให้แทบไม่มีค่า Implement ถือว่าได้เปรียบ On Premise เป็นอย่างมาก สำหรับการสร้าง DW เรามี DW ที่ถูก Setup มาแล้ว 3 ขนาดสำหรับความต้องการของธุรกิจที่ต่างกัน โดยแบ่งออกเป็น
- Data Warehouse ( Small ) เหมาะกับธุรกิจขนาดเล็ก
- Data Warehouse ( Medium ) เหมาะกับธุรกิจที่มีขนาดข้อมูลที่มากกว่า 10 GB
- Data Warehouse ( Big ) เหมาะกับธุรกิจที่มีขนาดข้อมูลมากกว่า 10 GB และมีปริมาณข้อมูลในระดับวินาที
On Premise
สำหรับโครงการระบบ On Premise ที่ต้องจัดเตรียม ค่อนข้างซับซ้อนและมีรายละเอียดมาก จึงขอลงรายละเอียดไว้ครับ ถ้าสนใจในระบบ Big Data สามารถติดต่อทาง Fusion เพื่อนำเสนอได้
ประโยชน์ของระบบ Big Data
- การวิเคราะห์ข้อมูลเพื่อนำไปใช้ประโยชน์ในการตัดสินใจ
- นำข้อมูลจากสถานะการณ์ต่าง ๆ เพื่อเตรียมตัวในสิ่งที่เกิดขึ้นในอนาคต
- ลดต้นทุนในการบริหารจัดการ
- จัดเตรียมสินค้า หรือ บริการให้เหมาะสมกับความต้องการในตลาด
ความเกี่ยวข้องของ Big Data
โดยทั่วไปโซลูชันข้อมูลขนาดใหญ่เกี่ยวข้องกับภาระงานประเภทใดประเภทหนึ่งต่อไปนี้
- การประมวลผลแหล่งข้อมูลขนาดใหญ่แบบแบตช์ในขณะพัก
- การประมวลผลข้อมูลขนาดใหญ่แบบเรียลไทม์
- การสำรวจข้อมูลขนาดใหญ่แบบโต้ตอบ
- การวิเคราะห์เชิงคาดการณ์และการเรียนรู้ของเครื่อง
DATA WAREHOUSE คือ
การสร้างที่เก็บข้อมูลส่วนกลางสำหรับนำไปวิเคราะห์ต่อไป ดังนั้น สิ่งที่ต้องทำได้ คือ สามารถจัดเก็บข้อมูลจากหลายแหล่ง และสามารถจัดเก็บข้อมูลที่มีความหลากหลาย ทั้งในเรื่องรูปแบบข้อมูล, Format รวมทั้งมีเครื่องมือในการบริหารข้อมูลที่นำเข้า และสามารถกรองข้อมูลที่ไม่ต้องการออกก่อนนำเข้าระบบวิเคราะห์ข้อมูล
พื้นฐานของทุกระบบในอนาคตที่ต้องการข้อมูลทั้งจากภายใน และภายนอกในการวิเคราะห์ข้อมูล
ปัจจุบัน เราสามารถใช้ Power BI ในการ Connect เข้าไปที่ Database Production ได้โดยตรงแล้วนำข้อมูลไปวิเคราะห์ออกมาเป็น Dashboard ได้ทันที แต่ในกรณีที่ข้อมูลเรามีหลายแหล่ง และมีความจำเป็นในการสร้าง Relation หรือ มุมมองใหม่ ๆ นอกจากข้อมูลที่เรามีอยู่ กรณีแบบนี้ทำให้เราจำเป็นต้องทำ DW ขึ้นมาเพื่อให้ข้อมูลมีความพร้อมมากยิ่งขึ้นครับ
รวมถึงความต้องการใหม่ ๆ ที่อาจจะเกิดขึ้น เช่น การทำ Machine Learning การทำ DW ก็เป็นสิ่งที่จำเป็นอย่างยิ่งที่ต้องจัดเตรียมไว้ก่อนเช่นกัน
กรณีที่ควรมี DATA WAREHOUSE
- ต้องการเตรียมข้อมูลให้มีความพร้อมในการนำไปใช้ สำหรับ Application เช่น BI หรือ App อื่น ๆ ที่ต้องการเชื่อมข้อมูลเพื่อการนำไปใช้ หรือ เป็น Reference
- ต้องการปรับแต่งข้อมูล หรือ Clear Data ก่อนการนำไปใช้
- ต้องการทำ Data Analytics ในเชิงลึก และ สามารถปรับแต่งได้เอง
- ไม่ต้องการให้ Application มีการเชื่อมเข้าหา Data Product โดยตรงเพราะอาจจะทำให้ข้อมูลเสียหายได้
- ไม่ต้องการยึดติดกับ เครื่องมือ BI ตัวใดตัวหนึ่ง หรือ ต้องการใช้ BI หลายตัวในการวิเคราะห์