Data Analytics | วิเคราะห์ข้อมูล
บริษัท Fusion Solution บริการ ที่ปรึกษา ติดตั้ง และพัฒนา Data Analytics (การวิเคราะห์ข้อมูล) ตามมาตราฐานของ Microsoft Gold Partner และ CMMi 3 โดยการพัฒนา Model ทางคณิตศาสตร์สำหรับให้ monitor ข้อมูลจำนวนมหาศาล เพื่อมองหาความสัมพันธ์ หรือ ลักษณะที่มีความผิดปกติของการทำงานของข้อมูล
ด้วยรูปแบบของ Data Warehouse ปัจจุบันที่สามารถย้ายขึ้น Cloud ได้เช่น Azure Data Warehouse ทำให้การ Implement สามารถทำได้อย่างรวดเร็วภายใต้งบประมาณที่จำกัด และ จากระบบที่พร้อมอยู่แล้วบน Cloud ก็ช่วยให้ค่า Implement สามารถปรับลดลงได้อีกด้วย
กรณีศึกษาสำหรับ Retail
สำหรับธุรกิจ ที่มีการนำ Big Data ไปใช้มากที่สุดน่าจะไม่มีใครเกิน Retail ไปได้ เพราะระบบของ Retail มีการเก็บข้อมูลที่เป็นระเบียบ มีข้อมูลจำนวนมาก สามารถหาข้อมูลได้ง่าย และ ผลจากการวิเคราะห์ก็สามารถปรับปรุงประสิทธิภาพได้อย่างชัดเจน ซึ่งประเด็นสำหรับการทำ Big Data ก็เช่น
- การจัดร้าน : Cluster Model ในการจัดกลุ่มร้าน ออกมาตามพฤติกรรมของลูกค้า เช่น ร้านค้าที่ขายดีช่วงเช้า ร้านค้าที่มี Profile เรื่องสถานที่ใกล้เคียงกัน ซึ่งผลจากการจัดกลุ่ม ทำให้สามารถ ศึกษาในเชิงลึกของ ร้านค้าแต่ละประเภทได้ง่ายยิ่งขึ้น เช่น สามารถศึกษาต่อ ถึงสาเหตุของร้านที่ขายดี กับขายไม่ดี ได้ชัดเจน
- การสั่งซื้อสินค้า : ระบบสามารถคาดการณ์ การสั่งสินค้าให้กับทางสาขา ได้อัตโนมัติ
- พฤติกรรมลูกค้า : การหาความสัมพันธ์ของลูกค้า กับ สินค้าของเรา
กรณีศึกษาสำหรับ E-Commerce
การค้าขายปัจจุบันคงไม่มีอะไรยิ่งใหญ่กว่า E-Commerce เห็นจากธุรกิจในบ้านเรา ที่มีผล กระทบกับรูปแบบเดิม ๆ ชนิดแทบทำให้ธุรกิจเดิมๆ ไปต่อไม่ได้เลยทีเดียว เราลองมาดูกันว่า ทำไม E-Commerce ถึงสามารถทำในสิ่งที่ไม่น่าเชื่อได้ขนาด เบื้องหลังของ E-Commerce ที่ใช้ Big Data มาช่วย เค้าเอามาทำอะไรกัน
- การแนะนำสินค้า : สามารถทำ Cross Sales สินค้า เพิ่มโอกาสในการขายให้มากขึ้น
- การสร้าง Promotion : ให้เหมาะสมกับแต่ละกลุ่มลูกค้าได้อย่างเหมาะสม
กรณีศึกษาสำหรับ Logistics
ต้นทุนสำคัญของธุรกิจที่เป็นสัดส่วนสำคัญหนีไม่พ้น Logistics และที่สำคัญยิ่งขึ้นไปอีก คือ เราคิดว่ามันเป็นส่วนที่สามารถจะจัดการได้ดีขึ้นกว่าปัจจุบัน ทั้งค่าแรง ค่าน้ำมัน ค่าอุปกรณ์ในการขนส่ง (รถ) เวลา แต่การจะลดต้นทุนในส่วนนี้ก็ทำได้ไม่ง่าย เพราะปัจจัยที่ควบคุมไม่ได้หลายอย่าง แต่ในแง่ของ Big Data ที่ทำเรื่องนี้มีอะไรกันบ้างมา
- การวิเคราะห์ต้นทุน
- การวิเคราะห์เส้นทาง
- การหาตำแหน่งกระจายสินค้า
กรณีศึกษาสำหรับ การบริการ
ธุรกิจให้บริการมีจำนวนมากในบ้านเรา ส่งบริการส่งของ การซ่อมบำรุง เป็นงานที่ต้องใช้คนจำนวนมาก ดังนั้นจึงมีจุดที่รั่วไหล จำนวนมาก เช่นกัน ซึ่งจะใกล้เคียงกับ ธุรกิจขนส่ง สำหรับรูปแบบที่จะนำ Big Data มาใช้
- วิเคราะห์ความหนาแน่นของการให้บริการ
- การมอบหมายงานที่เหมาะสม
กรณีศึกษาสำหรับ Finance และ Bank
คงจะหาใครที่มีข้อมูลมากกว่า กลุ่ม Finance และ Bank ได้ยาก ณ. ขณะนี้ จากลูกค้านับล้านราย Transaction อีกมหาศาล การให้บริการที่หลากหลาย และ ช่องโหว่ใน ธุรกิจที่มีมากมาย ที่ทำให้เกิด lost ดังนั้น การนำ Big Data มาทำการวิเคราะห์ข้อมูล เพื่อนำไปปฏิบัติงาน จึงน่าสนใจมาก มาดูกันว่า เค้าเอา Big Data ไปทำอะไร
- บริหารเงินสด
- วิเคราะห์กลุ่มลูกค้า
- วิเคราะห์สินเชื่อ
- วิเคราะห์โกง
- โอกาสการเกิดหนี้เสีย
ตัวอย่างของงาน การวิเคราะห์ข้อมูล ที่ช่วยในเราเห็นข้อมูลที่ไม่เคยเห็นมาก่อน เช่น การตรวจจับสิ่งผิดปกติ โดยใช้ Model Cluster เช่น กรณีการตรวจสอบการ Login ที่ผิดปกติ กรณีนี้เราต้องพิจารณาในหลายมิติของข้อมูล เช่น เวลา ตำแหน่ง สถานที่ ความถี่ ระยะเวลาที่ Login โดยตัวแปรที่เราต้องการทราบ คือ ชื่อของพนักงานที่ login โดย Model Cluster Data Analytics จะทำการจัดกลุ่มข้อมูลที่เป็นธรรมชาติของการใช้งานปกติให้อยู่ในรูปของกลุ่มก้อนเดียวกันและจะแยกข้อมูลที่ผิดปกติให้ออกมาอย่างชัดเจน ทำให้ผู้ตรวจสามารถตรวจพบได้ง่ายกว่าการใช้คำสั่งอื่น ๆ ในการค้นหา
Data Analytics Service
- ติดตั้งและ Config
- ออกแบบ Design
- ออกแบบ Design SQL Cube
- ออกแบบ Data Analytics ( Cluster Analytics )
- Training
- Implement R Server
รูปแบบการวิเคราะห์ ด้วย Cluster Data Analytics
- ตัวอย่าง การจัดกลุ่มข้อมูลที่มีความสัมพันธ์กัน เช่น การวิเคราะห์ยอดขายที่โจทย์ต้องการทราบว่าสิ่งค้าประเภทไหน ขายดีกลับ คนกลุ่มไหน เพื่อวัตถุประสงค์ที่จะเข้าไป Focus กลุ่มเป้าหมายได้อย่างถูกต้อง
- สำหรับ Cluster Analytics ยังสามารถแยกย่อยออกมาได้เป็นวิธีการอีกหลายรูปแบบดังนี้
- Partitioning criteria
- Separation of clusters
- Similarity measure
- Clustering space
- ตัวอย่างการใช้ Cluster Analytic K-Mean สำหรับการวิเคราะห์ข้อมูลการฝากถอนเงิน จากภาพ จะเป็นการจัดกลุ่มข้อมูล ของความถี่ในการถอนเงินมาจับคู่กับ มูลค่าการถอนเงิน ซึ่งผลที่ได้รับ เราจะเห็นภาพการจับกลุ่มของข้อมูลอย่างชัดเจน และ เห็นจุดที่กระจายออกมา ทำให้เราสามารถมองเห็นความผิดปกติของงานได้อย่างง่ายได้การเปลี่ยนมุมมองของ Cluster เป็นแบบ การจำแนกกลุ่มหลังจากการใช้ PCA (Principle Component Analytics) เข้ามาช่วย วิเคราะห์ปัจจัย จากภาพด้านบนที่แสดงการจับกลุ่ม นำมาเปลี่ยนใหม่เพื่อให้เห็นภาพความผิดปกติได้ง่ายขึ้น สามารถสังเกตุได้จาก สีเหลืองที่อยู่ด้านล่าง ทำให้เราสามารถ Export เฉพาะข้อมูลที่เราต้องการพิจารณาเป็นพิเศษ
ประโยชน์ของ (การวิเคราะห์ข้อมูล)
- ใช่ให้ระบบสามารถทำงานอัตโนมัติ เช่น การวิเคราะห์ เพื่อหาสิ่งผิดปกติ ด้วยตัวเอง
- การหาคำตอบ เช่นการ คาดเดาอนาคต จากข้อมูลสถิติ
- การหาช่องว่างทางการตลาด
- เป็นข้อมูลในการสร้าง Product
- การเปรียบเทียบข้อมูลเพื่อหาช่องว่าง และแนวทางการพัฒนา
แนวทางการพัฒนา (การวิเคราะห์ข้อมูล)
- ตั้งคาดการณ์ผลจากการพัฒนา Data Analytics และ จัดเตรียมข้อมูล
- พิจารณาความเป็นไปได้ของข้อมูล เพื่อสร้าง Data Model
- กำหนด ผลลัพย์ของการพัฒนา เช่น คำตอบที่จะได้จากระบบ รูปแบบคำถามที่สามารถหาคำตอบได้จาก Data Model
- วางแผนพัฒนา ระบบใน Phase 2,3,4 เนื่องจากเป็นงานที่ต้องพัฒนาต่อเนื่อง
System Diagram for Data Analytics
การติดตั้งระบบ Data Analytics มีเครื่องมือที่หลากหลาย แต่ตัวอย่างที่นำเสนอเป็นแบบการใช้ ภาษา R ในการพัฒนา และแยกเครื่องมือด้าน Math ออกมาอีก 1 เครื่องโดยใช้ SPSS ในการพัฒนา Data Model
Data analytics association rule หมายถึง
การหาความสัมพันธ์ของสิ่งของ ว่ามีความสัมพันธ์อย่างไรกับของอีกสิ่งหนึ่ง ตัวอย่างการใช้งาน เช่น สิ่งค้าอย่างหนึ่งขายดี จะมีอีกอย่างหนึ่ง ขายดีด้วย เป็นต้น ซึ่งการหาค่าพวกนี้ได้ จะทำให้ เราสามารถจัดการให้เกิดยอดขายที่เพิ่มขึ้นได้ และ มีการจัดการ Stock ได้ด้วย เช่น ถ้าเรารู้ว่าของทั้ง 2 จะมีโอกาสขายคู่กัน การทำ Stock ก็ควรจะมีการคำนึงถึงการคาดการณ์เรื่องนี้เข้าไปด้วย ซึ่งการใช้ Data Analytics ในรูปแบบนี้ นิยมเอาไปวิเคราะห์การขายเป็นอย่างมาก
Regression หมายถึง
การหารูปแบบความสัมพันธ์ของ สิ่งของ เช่น เราอยากรู้ความสัมพันธ์ของตัวแปร 2 ตัว เพื่อที่จะประเมินค่าของตัวแปรใดตัวแปรหนึ่ง เมื่อ อีก 1 ตัวแปร เปลี่ยนไป รูปแบบนี้ เมื่อเราหาความสัมพันธ์ได้ สิ่งที่เราจะได้คือ การประเมินค่าในอนาคต หรือ การทำ Prediction นั้นเอง
An Introduction to Data Science
Data Science Model
Deep Solution
Deep Solution เป็นการพัฒนาของ Fusion Solution ด้านการใช้งาน Data Analytics ในการวิเคราะห์พฤติกรรม ของสิ่งต่าง ๆ ซึ่งเป็นการนำข้อมูลมาใช้ประโยชน์ ในอีกขั้น ของการทำ Business Intelligence ด้วยการสร้าง Model ในการวิเคราะห์รูปแบบข้อมูล หาความสัมพันธ์ของตัวแปร การจัดกลุ่มข้อมูลที่กระจายอยู่ให้เป็นระเบียบ ให้พร้อมที่จะนำไปใช้ประโยชน์ต่อใน ด้านการหา โอกาสใหม่ ๆ ในธุรกิจ
Deep Solution คือ Data warehouse + Analytic
- Financial Analytics
- Healthcare Analytics
- Retail Analytics
- Insurance Analytics
กระบวนการในการทำ Customer Segmentation แบบง่าย
- Define Problem — ตั้งเป้าก่อนเลยครับ ว่าจะแบ่งกลุ่มไปทำอะไร เอาไปใช้อะไร อยากแบ่งไปเพื่ออะไร
- Feature Engineering — กำหนดตัวแปรที่อยากจะใช้ในการวิเคราะห์
- Data Preparation — เตรียมข้อมูลสำหรับการวิเคราะห์
- Clustering — แบ่งกลุ่มเลย
- Result Interpretation — แปลผล ถ้าไม่พอใจ หรือเกิดไอเดียใหม่ ก็ย้อนกลับไปเพิ่มหรือปรับตัวแปร
- Action ! — เอาผลที่ได้ ไปใช้ในการทำการตลาด หรือ ไปวางแผนทำอย่างอื่นต่อ