Table of Contents

Big Data คือ

ความหมายตรง ๆ คือ พื้นที่เก็บข้อมูลทุกอย่างที่เรามีอยู่ในบริษัท ทั้งข้อมูลที่มีแหล่งที่มาจากภายในบริษัทเอง และข้อมูลที่มาจากแหล่งที่มาภายนอก อย่าง Social medias ซึ่งทั้งหมดเป็นข้อมูลที่สามารถนำมาวิเคราะห์ได้ ทั้งนี้ข้อมูลเหล่านี้สามารถนำมาวิเคราะห์ได้ด้วยวิธีการหลากหลายวิธีการ ขึ้นอยู่กับว่าคุณต้องการนำข้อมูลเหล่านั้นไปใช้งานด้านไหน ในปัจจุบันนิยมทำ Analysis เพื่อใช้ในการสำหรับการคาดการณ์เหตุการณ์ในอนาคต หรือ ก็คือ เพื่อใช้ดูแนวโน้มสิ่งที่จะเกิดขึ้นนั้นเอง

ตัวอย่าง ข้อมูลที่เอามาเก็บในระบบ

  • ข้อมูลติดต่อของผู้ร่วมธุรกิจ 
  • ลักษณะของผู้บริโภค 
  • การทำรายการธุรกิจต่างๆ ในแต่ละวัน 
  • ตัวอักษร ไฟล์เอกสาร รูปภาพ 
  • รวมถึงข้อมูลอื่นๆ แทบทุกประเภทที่อยู่บนโลกออนไลน์

ใครที่เหมาะกับ Solution นี้

คนที่มีข้อมูลจำนวนมาก และ ต้องการหาประโยชน์จากข้อมูลนั้น ๆ คือ คนที่เหมาะสมที่สุด ตัวอย่าง เช่น บริษัทขายของออนไลน์ ใช้ Big Data ในการวิเคราะห์พฤติกรรมของลูกค้าโดยอาศัยข้อมูลจากการ Tracking (ติดตามพฤติกรรมการใช้งาน) การค้นหาข้อมูลของลูกค้า ว่ามีความต้องการเป็นอย่างไร โดยยังสามารถตรวจสอบราคาของคู่แข่ง จำนวนสินค้า เพื่อนำเสนอให้ตรงกับความต้องการของลูกค้ามากที่สุด แล้วจึงนำข้อมูลเหล่านี้มาเสนอให้กับลูกค้าแบบอัตโนมัติและปรับราคาขึ้นหรือลงโดยอิงจากความต้องการของตลาด

ขั้นตอนการทำงานของระบบ

  1. จัดเก็บข้อมูล
    คือการนำข้อมูลที่เราต้องการทั้งหมดมารวมกันไว้ที่เดียว ซึ่ง อาจจะมีนั้นข้อมูลในรูปแบบตาราง หรือ text ล้วน ๆ ก็ได้
  2. ประมวลผล
    คือ การจัดหมวดหมู่ข้อมูลให้เป็นระเบียบ เอาข้อมูลที่ไม่ถูกต้องออก ให้เหลือเฉพาะส่วนที่สามารถนำไปวิเคราะห์ต่อได้
  3. วิเคราะห์
    คือ การหาประโยชน์จากข้อมูล ซึ่ง อาจจะเป็นมุมมองของการบอกอนาคต หรือ การจัดกลุ่มข้อมูลที่มีความสัมพันธ์ที่ซับซ้อนให้อยู่ในรูปแบบที่ง่ายต่อความเข้าใจ

ระบบ BigData ในการ Implement จริงอาจจะไม่ได้รวมถึงการทำวิเคราะห์ ก็ได้ เพราะอาจจะเป็น Phase แรกของการพัฒนาโครงการ ที่เน้นเรื่องการการวาง Infrastructure ก่อน ซึ่งถ้าการลงทุนในเรื่องนี้มากเกินไป ก็สามารถเลือกใช้บริการ เช่น ใช้บน Cloud ก็ได้


Big Data คือ
https://www.fusionsol.com/blog/%e0%b8%9f%e0%b8%a3%e0%b8%b5-azure/

โครงสร้างสำหรับ Big Data

ตัวโครงสร้างของระบบปัจจุบันสามารถแยกออกได้ 2 แนวทาง

  • On Cloud : สำหรับการขึ้นระบบใหม่ขอแนะนำให้เลือกใช้แนวทางนี้เพราะทำได้รวดเร็ว และ ประหยัดค่าใช้จ่าย กว่าในการบริการจัดการ
  • On Premise : สำหรับกรณีที่ติดขัดเรื่องการขึ้นบน Cloud ก็สามารถทำได้แต่ต้องเลือกอุปกรณ์ และวางแผนเป็นอย่างดี เนื่องจากเป็นการลงทุนที่สูงและไม่สามารถเปลี่ยนแปลงได้ง่าย

On Cloud Solution

ข้อดีของ Solution On Cloud คือ การควบคุมค่าใช้จ่าย ในการบริการงบประมาณให้สอดคล้องกับการใช้งานจริง ซึ่งข้อนี้บางคนมองว่า ไม่สามารถควบคุมได้เพราะขึ้นกับการใช้งาน แต่ในความเป็นจริงพบว่า การทำ Big Data เมื่อเทียบงบประมาณแบบจริงจังแล้ว แบบนี้ถูกกว่ามาก

Solution Microsoft Azure Modern Data Warehouse ที่ช่วยให้การเริ่ม Big Data ทำได้ง่าย ด้วยโครงสร้างที่มีควาามพร้อมรองรับข้อมูลได้ทุกประเภท และมีเครื่องมือในการวิเคราะห์มาให้แล้ว ทำให้แทบไม่มีค่า Implement ถือว่าได้เปรียบ On Premise เป็นอย่างมาก สำหรับการสร้าง DW เรามี DW ที่ถูก Setup มาแล้ว 3 ขนาดสำหรับความต้องการของธุรกิจที่ต่างกัน โดยแบ่งออกเป็น

  • Data Warehouse ( Small ) เหมาะกับธุรกิจขนาดเล็ก
  • Data Warehouse ( Medium ) เหมาะกับธุรกิจที่มีขนาดข้อมูลที่มากกว่า 10 GB
  • Data Warehouse ( Big ) เหมาะกับธุรกิจที่มีขนาดข้อมูลมากกว่า 10 GB และมีปริมาณข้อมูลในระดับวินาที

On Premise

สำหรับโครงการระบบ On Premise ที่ต้องจัดเตรียม ค่อนข้างซับซ้อนและมีรายละเอียดมาก จึงขอลงรายละเอียดไว้ครับ ถ้าสนใจในระบบ Big Data สามารถติดต่อทาง Fusion เพื่อนำเสนอได้


Big Data คือ

ประโยชน์ของระบบ Big Data

  • การวิเคราะห์ข้อมูลเพื่อนำไปใช้ประโยชน์ในการตัดสินใจ
  • นำข้อมูลจากสถานะการณ์ต่าง ๆ เพื่อเตรียมตัวในสิ่งที่เกิดขึ้นในอนาคต
  • ลดต้นทุนในการบริหารจัดการ
  • จัดเตรียมสินค้า หรือ บริการให้เหมาะสมกับความต้องการในตลาด


ความเกี่ยวข้องของ Big Data

โดยทั่วไปโซลูชันข้อมูลขนาดใหญ่เกี่ยวข้องกับภาระงานประเภทใดประเภทหนึ่งต่อไปนี้

  • การประมวลผลแหล่งข้อมูลขนาดใหญ่แบบแบตช์ในขณะพัก
  • การประมวลผลข้อมูลขนาดใหญ่แบบเรียลไทม์
  • การสำรวจข้อมูลขนาดใหญ่แบบโต้ตอบ
  • การวิเคราะห์เชิงคาดการณ์และการเรียนรู้ของเครื่อง

Big Data คือ

DATA WAREHOUSE คือ

การสร้างที่เก็บข้อมูลส่วนกลางสำหรับนำไปวิเคราะห์ต่อไป ดังนั้น สิ่งที่ต้องทำได้ คือ สามารถจัดเก็บข้อมูลจากหลายแหล่ง และสามารถจัดเก็บข้อมูลที่มีความหลากหลาย ทั้งในเรื่องรูปแบบข้อมูล, Format รวมทั้งมีเครื่องมือในการบริหารข้อมูลที่นำเข้า และสามารถกรองข้อมูลที่ไม่ต้องการออกก่อนนำเข้าระบบวิเคราะห์ข้อมูล

พื้นฐานของทุกระบบในอนาคตที่ต้องการข้อมูลทั้งจากภายใน และภายนอกในการวิเคราะห์ข้อมูล

ปัจจุบัน เราสามารถใช้ Power BI ในการ Connect เข้าไปที่ Database Production ได้โดยตรงแล้วนำข้อมูลไปวิเคราะห์ออกมาเป็น Dashboard ได้ทันที แต่ในกรณีที่ข้อมูลเรามีหลายแหล่ง และมีความจำเป็นในการสร้าง Relation หรือ มุมมองใหม่ ๆ นอกจากข้อมูลที่เรามีอยู่ กรณีแบบนี้ทำให้เราจำเป็นต้องทำ DW ขึ้นมาเพื่อให้ข้อมูลมีความพร้อมมากยิ่งขึ้นครับ

รวมถึงความต้องการใหม่ ๆ ที่อาจจะเกิดขึ้น เช่น การทำ Machine Learning การทำ DW ก็เป็นสิ่งที่จำเป็นอย่างยิ่งที่ต้องจัดเตรียมไว้ก่อนเช่นกัน


กรณีที่ควรมี DATA WAREHOUSE

  • ต้องการเตรียมข้อมูลให้มีความพร้อมในการนำไปใช้ สำหรับ Application เช่น BI หรือ App อื่น ๆ ที่ต้องการเชื่อมข้อมูลเพื่อการนำไปใช้ หรือ เป็น Reference
  • ต้องการปรับแต่งข้อมูล หรือ Clear Data ก่อนการนำไปใช้
  • ต้องการทำ Data Analytics ในเชิงลึก และ สามารถปรับแต่งได้เอง
  • ไม่ต้องการให้ Application มีการเชื่อมเข้าหา Data Product โดยตรงเพราะอาจจะทำให้ข้อมูลเสียหายได้
  • ไม่ต้องการยึดติดกับ เครื่องมือ BI ตัวใดตัวหนึ่ง หรือ ต้องการใช้ BI หลายตัวในการวิเคราะห์

Reference

Facebook
X
LinkedIn

Popular Blog posts