Data Analysis
ตัวอย่าง Data Analysis ที่ช่วยในเราเห็นข้อมูลที่ไม่เคยเห็นมาก่อน เช่น การวิเคราะห์ข้อมูลทางการตลาด หรือ การตรวจจับสิ่งผิดปกติ โดยใช้ Model Cluster เช่น การเอาช่วยจัดกลุ่มข้อมูลลูกค้า กรณีการตรวจสอบการ Login ที่ผิดปกติ กรณีนี้เราต้องพิจารณาในหลายมิติของข้อมูล เช่น เวลา ตำแหน่ง สถานที่ ความถี่ ระยะเวลาที่ Login โดยตัวแปรที่เราต้องการทราบ คือชื่อของพนักงานที่ login โดย Model Cluster จะทำการจัดกลุ่มข้อมูลที่เป็นธรรมชาติของการใช้งานปกติให้อยู่ในรูปของกลุ่มก้อนเดียวกันและจะแยกข้อมูลที่ผิดปกติให้ออกมาอย่างชัดเจน ทำให้ผู้ตรวจสามารถตรวจพบได้ง่ายกว่าการใช้คำสั่งอื่น ๆ ในการค้นหา
- การวิเคราะห์กลุ่มลูกค้า
- การวิเคราะห์สินค้าขายดี
- การคาดการณ์ยอดขายในอนาคต
- การหาพฤติกรรมลูกค้าของสินค้า
Fusion Service
- Consulting
- ติดตั้งและ Config
- ออกแบบ Design Data Model
- ออกแบบ Design SQL Cube for Data Analysis
- ออกแบบ Model For Marketing Analytic
แบบการวิเคราะห์ ด้วย Cluster
- ตัวอย่าง การจัดกลุ่มข้อมูลที่มีความสัมพันธ์กัน เช่น การวิเคราะห์ยอดขายที่โจทย์ต้องการทราบว่าสิ่งค้าประเภทไหนขายดีกลับคนกลุ่มไหน เพื่อวัตถุประสงค์ที่จะเข้าไป Focus กลุ่มเป้าหมายได้อย่างถูกต้อง
- สำหรับ Cluster Analysis ยังสามารถแยกย่อยออกมาได้เป็นวิธีการอีกหลายรูปแบบดังนี้
- Partitioning criteria
- Separation of clusters
- Similarity measure
- Clustering space
ประโยชน์ของ Data Analysis
- ใช้ให้ระบบสามารถทำงานอัตโนมัติ เช่น การวิเคราะห์ เพื่อหาสิ่งผิดปกติ ด้วยตัวเอง
- การหาคำตอบ เช่นการ คาดเดาอนาคต จากข้อมูลสถิติ
- การหาช่องว่างทางการตลาด
- เป็นข้อมูลในการสร้าง Product เช่น สามารถระบุคุณสมบัติของสินค้าในการขาย ได้ว่าในช่วงเวลา หรือ สถานที่ใด สินค้าต้องมีคุณลักษณะสำคัญเรื่องอะไร
ตัวอย่างการใช้ Cluster Analysis K-Mean สำหรับการวิเคราะห์ข้อมูล การฝากถอนเงิน จากภาพ จะเป็นการจัดกลุ่มข้อมูล ของความถี่ในการถอนเงินมาจับคู่กับมูลค่าการถอนเงิน ซึ่งผลที่ได้รับ เราจะเห็นภาพการจับกลุ่มของข้อมูลอย่างชัดเจน และ เห็นจุดที่กระจายออกมา ทำให้เราสามารถมองเห็นความผิดปกติของงานได้อย่างง่ายได้

การเปลี่ยนมุมมองของ Cluster เป็นแบบ การจำแนกกลุ่มหลังจากการใช้ PCA (Principle Component Analysis) เข้ามาช่วย วิเคราะห์ปัจจัย จากภาพด้านบนที่แสดงการจับกลุ่ม นำมาเปลี่ยนใหม่เพื่อให้เห็นภาพความผิดปกติได้ง่ายขึ้น สามารถสังเกตุได้จาก สีเหลืองที่อยู่ด้านล่าง ทำให้เราสามารถ Export เฉพาะข้อมูลที่เราต้องการพิจารณาเป็นพิเศษได้

แนวทางการพัฒนา
- ตั้งคาดการณ์ผลจากการพัฒนา และ จัดเตรียมข้อมูล
- พิจารณาความเป็นไปได้ของข้อมูล เพื่อสร้าง Data Analysis ( Data Model )
- กำหนด ผลลัพย์ของการพัฒนา เช่น คำตอบที่จะได้จากระบบ รูปแบบคำถามที่สามารถหาคำตอบได้จาก Data Model
- วางแผนพัฒนา ใน Phase 2,3,4 เนื่องจากเป็นงานที่ต้องพัฒนาต่อเนื่อง
Data analysis association rule หมายถึง
การหาความสัมพันธ์ของสิ่งของ ว่ามีความสัมพันธ์อย่างไรกับของอีกสิ่งหนึ่งตัวอย่างการใช้งาน เช่น สิ่งค้าอย่างหนึ่งขายดี จะมีอีกอย่างหนึ่ง ขายดีด้วย เป็นต้น ซึ่งการหาค่าพวกนี้ได้ จะทำให้ เราสามารถจัดการให้เกิดยอดขายที่เพิ่มขึ้นได้ และ มีการจัดการ Stock ได้ด้วย เช่น ถ้าเรารู้ว่าของทั้ง 2 จะมีโอกาสขายคู่กัน การทำ Stock ก็ควรจะมีการคำนึงถึงการคาดการณ์เรื่องนี้เข้าไปด้วย ซึ่งการใช้ ในรูปแบบนี้ นิยมเอาไปวิเคราะห์การขายเป็นอย่างมาก
Regression หมายถึง
การหารูปแบบความสัมพันธ์ของ สิ่งของ เช่น เราอยากรู้ความสัมพันธ์ของตัวแปร 2 ตัว เพื่อที่จะประเมินค่าของตัวแปรใดตัวแปรหนึ่ง เมื่อ อีก 1 ตัวแปร เปลี่ยนไป รูปแบบนี้ เมื่อเราหาความสัมพันธ์ได้ สิ่งที่เราจะได้คือ การประเมินค่าในอนาคต หรือ การทำ Prediction นั้นเอง การหาค่าในแบบ regression นั่น มีข้อที่ต้องระวังคือ ค่าที่ได้เป็นค่าประมาณการ ซึ่งมีโอกาสที่จะผิด มาก หรือ ผิดน้อย ได้
Optimization หมายถึง
คือ Model ที่หาค่าที่เหมาะสม เช่น เส้นทางที่เหมาะสม ในการเดินทาง จำนวนสาขาที่เหมาะสมในการให้บริการ ค่าใช้จ่ายที่เหมาะสมสำหรับการให้บริการ แบบนี้ซึ่งเป็นรูปแบบคำตอบที่ทางธุรกิจต้องการเป็นอย่างมาก
Data Science Model

Deep Solution : Data Analytic
Deep Solution เป็นการพัฒนาของ Fusion Solution ด้านการใช้งานในการวิเคราะห์พฤติกรรม ของสิ่งต่าง ๆ ซึ่งเป็นการนำข้อมูลมาใช้ประโยชน์ ในอีกขั้น ของการทำ Business Intelligence ด้วยการสร้าง Model ในการวิเคราะห์รูปแบบข้อมูล หาความสัมพันธ์ของตัวแปร การจัดกลุ่มข้อมูลที่กระจายอยู่ให้เป็นระเบียบ ให้พร้อมที่จะนำไปใช้ประโยชน์ต่อใน ด้านการหา โอกาสใหม่ ๆ ในธุรกิจ
Deep Solution คือ Data warehouse + Analytic
- Financial Analytics
- Healthcare Analytics
- Retail Analytics
- Insurance Analytics

Data Model
- การพัฒนาระบบเพื่อการหาความสัมพันธ์ของข้อมูลในกลุ่มข้อมูลจำนวนมหาศาล เป็นขั้นกว่า ของการนำข้อมูลมาใช้ นอกเหนือจากการทำรายงานตามปกติ
- รูปแบบการจ้างทำ Model อาจจะอยู่ในรูปแบบของการตั้งโจทย์ที่ต้องการของธุรกิจ ก่อน เช่น การหา สินค้าที่มีกำไรดี ซึ่งจะครอบคลุมถึง การวิเคราะห์ แต่ละประเทภสินค้า กลุ่มของสินค้า ช่วงเวลาที่เกี่ยวข้อง ความสัมพันธ์ของ สินค้าขายดีกับคุณสมบัติประกอบต่าง ๆ ความสัมพันธ์ของ สิ่งที่ต้องการกับสภาวะแวดล้อมและ ช่วงเวลา แบบนี้เป็นต้น
- การพัฒนา Data Model ไม่จำเป็นต้องเริ่มจากการทำ Data Warehouse ก็ได้เนื่องจากสามารถใช้ บริการ Cloud ในการทำ Infrastructure เบื้องต้น ทำให้ลดค่าใช้จ่ายสำหรับการทำ Pilot Project เพื่อพิสูจน์หาความคุ้มค่า ซึ่งถ้าได้ผลเป็นที่น่าพอใจ ขั้นต่อไปก็สามารถขยาย Infrastructure ใน Cloud หรือ ทำแบบ On Premise ในหน่วยงาน ก็ได้
- Scope ของ Data Model จะอยู่ที่วัตถุประสงค์ของการวิเคราะห์ เป็นหลัก เช่น โจทย์การหาโอกาสใน ธุรกิจ จะเป็นคนละโจทย์กับการหาผลกำไร ซึ่งแบบนี้จะต้องพัฒนาเป็น 2 Model
- ผลจากการทำ Data Model อาจจะได้จะมาทั้ง เจอสิ่งที่ต้องการ หรือ ไม่ก็ได้ผลในเชิงที่ระบบไม่สามารถหาความสัมพันธ์ของข้อมูลได้ ซึ่งขึ้นอยู่กับสิ่งที่นำมาวิเคราะห์
คำถามเกี่ยวกับ Data Analysis
- ต้องการทำ Data Analysis ควรเริ่มจากอะไร
- เริ่มจาก คำถามว่า เราอยากรู้อะไรก่อน
- หาปัจจัยที่เกี่ยวกับ คำถามที่เราอยากรู้ เพื่อที่จะได้ศึกษาต่อไปว่าเรามีข้อมูลเก็บไว้หรือไม่
- จะทำ Data Analysis ต้องมี Data Warehouse หรือป่าว
- จำเป็นต้องมีครับ เพราะจะเป็นแหล่งข้อมูลเพื่อนำเข้าสู่การวิเคราะห์