Data Lake คืออะไร

What Is a Data Lake?

Data Lake คืออะไร? ความหมายและประโยชน์ที่ธุรกิจควรรู้ ในยุคที่ขับเคลื่อนด้วยข้อมูล องค์กรต่าง ๆ สร้างและจัดการข้อมูลจำนวนมหาศาลในแต่ละวัน การบริหาร จัดเก็บ และวิเคราะห์ข้อมูลอย่างมีประสิทธิภาพกลายเป็น กลยุทธ์สำคัญ สำหรับธุรกิจ Data Lake คืออะไร? คำนี้หมายถึงสถาปัตยกรรมการจัดเก็บข้อมูลสมัยใหม่ที่ช่วยให้ธุรกิจสามารถ จัดเก็บข้อมูลขนาดใหญ่ได้หลากหลายประเภท ทั้งข้อมูลแบบมีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้าง โดยไม่ต้องกำหนดรูปแบบล่วงหน้า  แตกต่างจาก คลังข้อมูลแบบดั้งเดิม (Data Warehouse) ที่ต้องกำหนดโครงสร้างของข้อมูลก่อนจัดเก็บ Data Lake มีความยืดหยุ่นสูง สามารถขยายขนาดได้ และรองรับการใช้งานสำหรับ Big Data Analytics, Machine Learning (ML), ปัญญาประดิษฐ์ (AI) และการประมวลผลข้อมูลแบบเรียลไทม์ แต่โครงสร้างนี้ทำงานอย่างไร? และเหตุใดองค์กรจำนวนมากจึงเริ่มใช้งานระบบนี้? มาดูรายละเอียดกัน  Data Lake คืออะไร และทำงานอย่างไร?  Data Lake เป็นระบบจัดเก็บข้อมูลที่สามารถ รวบรวม จัดเก็บ ประมวลผล และวิเคราะห์ข้อมูลจากแหล่งต่าง…

Big Data – GPS

Big Data – GPS ระบบการทำงานของ GPS จะได้ข้อมูลที่เป็น GIS ที่มาช่วยให้การทำงานของ Big Data ได้ข้อมูลในอีกมิติ ข้อมูลในรูปแบบ ของ GIS ถือว่าเป็นข้อมูลที่มีคุณค่ามาก เพราะช่วยทำให้ธุรกิจสามารถมองเห็นข้อมูลที่ลึกขึ้นในแง่ของสถานที่ ที่เกี่ยวข้องกับสินค้า ซึ่ง Fusion Solution ถือว่าเป็นบริษัทเพียงไม่กี่แห่งที่ให้บริการ จัดเก็บข้อมูล GIS ที่แม่นยำ ซึ่งเรามีทั้งระบบ ตรวจจับสถานที่ ที่รวดเร็วและแม่นยำที่สุด รวมถึง ระบบ Feeder ของรถ Taxi และระบบ Big Data สำหรับวิเคราะห์ข้อมูล โดยอาศัย เทคนิก Math Model ในการวิเคราะห์หาความสัมพันธ์ระหว่าง สินค้า และ GIS เราสามารถเห็น ตัวอย่างที่ใช้งานร่วมกันระหว่าง GIS กับ Big Data เช่นบริษัท วงใน ที่ให้บริการข้อมูลร้านอาหารที่เรารู้จักเป็นอย่างดี ด้วยข้อมูลที่มหาศาล…

การบริหารโครงการพัฒนา บิ๊กดาต้า

การบริหารโครงการพัฒนา บิ๊กดาต้า สำหรับการวิเคราะห์ข้อมูล เพื่อวัตถุประสงค์ต่าง ๆ เช่น เพิ่มยอดขาย ลดต้นทุน หาจุดอ่อน วางแผนการผลิต หรือ อะไรก็แล้วแต่ สิ่งที่ต้องมีการเตรียมความพร้อม ควรมีเรื่องที่ต้องพิจารณาในหลายประเด็น ข้อมูลต้นทุนที่เราควบคุมได้ ที่เป็นข้อมูลของตัวเราเอง ข้อมูลที่เป็นปัจจัยภายนอก ที่เราต้องนำมาประกอบ เป็นข้อมูลที่ต้องขอมาหรือซื้อมา วิธีการวิเคราะห์เพื่อให้ได้ตามเป้าหมาย Technology ที่เราจะต้องการใช้ ระยะเวลาที่คาดว่าจะสำเร็จ แผนรองรับการเปลี่ยนแปลงในอนาคต ข้อมูลต้นทุนที่เราควบคุมได้ เรื่องนี้ถือว่าเป็นเรื่องสำคัญเพราะเป็นจุดเริ่มของทุกสิ่ง ในการวิเคราะห์ข้อมูล เราต้องการข้อมูลที่มีคุณภาพและปริมาณที่มากพอ อย่างน้อยก็ต้อง 3 ปี สำหรับการนำมาวิเคราะห์ สำคัญคุณภาพ ที่ต้องดูก็เช่นความถูกต้อง ข้อมูลที่บันทึกตรงตาม Format มากแค่ไหน ถ้าข้อมูลไม่ตรงเลยการทำงานจะยากมากเพราะต้องมา Clear ข้อมูลออกก่อน หรือไม่ก็ต้องเปลี่ยน format ก็เสียเวลาเข้าไปอีก แล้วกรณีที่แย่ที่สุดเลย ก็ต้องเอาคนเข้าไป Key ใหม่ ผมไม่แน่ะนำให้เอาระบบเข้าไปแก้ไข ถ้าไม่จำเป็นเพราะการเอาระบบเข้าไปแก้ไขเรื่องนี้ นอกจากทำได้ไม่เต็ม 100 แล้ว ยังเสียเวลามากกว่าใช้ คนเข้าไป key…

การบริหารความเสี่ยงของ Big Data

การบริหารความเสี่ยงของ Big Data โครงการ Big Data งบประมาณ หลายสิบล้านบาท มีความเสี่ยงอย่างไร ผมขอ Share ประสบการณ์ที่ Implement มาในหลายโครงการให้ฟังครับ ซึ่งผมหวังว่า คนที่อ่านจะได้รับประโยชน์ และ วางแผนป้องกันความเสี่ยงที่จะเกิดขึ้นในการ Implement ในภายหน้านะครับ มาดูลักษณะของ Big Data ก่อน เป็นโครงการใหญ่ ผู้ใช้งานเป็นผู้บริหาร ผู้ทำงานเป็นระบบปฏิบัติงาน ส่วนสำคัญที่สุดคือ Data Source เพราะโครงการแบบนี้ต้องการข้อมูลจำนวนมาก ต่อมาลองพิจารณาความเสี่ยงบ้าง ความต้องการเรื่องการบริหาร กับ ข้อมูลที่มีอยู่ไม่สอดคล้องกัน ผู้บริหารไม่มีเวลามาให้ รายละเอียด ผู้ Implement ไม่มีประสบการณ์ใน Business คือ ถึงแม้ว่าจะเคยทำ Big Data ก็ไม่ได้หมายความว่า ประสบการณ์ใน Business อื่น จะเอามาใช้ได้ ข้อมูลไม่มีโครงสร้างที่ดี อันนี้เป็นปัญหาในระดับ TOP Management นะครับ…