Decision Forest Regression

บทที่ 20-Decision Forest Regression วิธีการทำนายราคารถยนต์ด้วยโมเดล Decision Forest Regression ง่าย ๆ แค่ใช้ AzureML Decision tree และ Random Forest เป็นโมเดลในการทำ Classification ที่หลาย ๆ คนคงคุ้นเคยเป็นอย่างดีแต่ตัว Decision tree และ Random Forest ไม่ได้ทำได้แค่การทำ Classification เพียงเท่านั้นยังสามารถทำ Regression หรือการทำนายผลลัพธ์ในเชิงตัวเลขได้อีกด้วย โดยการแบ่งต้นไม้สามารถทำได้ดังรูป ผลลัพธ์ของ Decision Tree Regression จากมาจากค่าเฉลี่ยของแต่ละพื้นที่ในทุก ๆ พื้นที่หรือทุก ๆ ใบของ tree อาจเส้นการถดถอบสำหรับ data points ในแต่ละพื้นที่ และการนำ Decision tree หลาย ๆ ต้นมาวิเคราะห์แล้วหาค่าเฉลี่ยกันเราจะเรียกว่า  Random Forest…

Two-Class Decision Forest

บทที่ 19-Two-Class Decision Forest วิธีการ Classification รายได้ด้วยโมเดล Two-Class Decision Forest โดย AzureML วิธีการ Classification ข้อมูลนั้นมีหลากหลายวิธีการให้เราได้เลือกมาใช้ในการแยกข้อมูลของเราและหนึ่งในวิธีการที่นิยมถูกนำมาใช้ในการ Classification คือ Random Forest หรือ Decision Forest โมเดลที่เกิดจากการนำ Decision tree หลาย ๆ ต้นในการ Classify ข้อมูลของเราจากนั้นจะทำการโหวตผลลัพธ์ที่ได้มากที่สุดจากต้นไม้ทุกต้น ข้อมูลที่เราต้องการจะทำการ  Classify วันนี้คือชุดข้อมูลที่ชื่อว่า Adult Census Income ที่มี 32561 แถว และ 15 คอลัมน์โดยมีเป้าหมายคือต้องการแยกประเภทของรายได้ของประชากร โดยการแยกเป็น 2 ประเภทคือ ผู้ที่มีรายได้น้อยกว่าหรือเท่ากับ 50000 และผู้ที่มีรายได้มากกว่า 50000 บาท โดยข้อมูลของเรามี feature ที่ช่วยในการทำ Classification ทั้งหมด…

Two-Class Boosted Decision Tree

บทที่ 18-Two-Class Boosted Decision Tree Boosted Decision Tree เป็นโมเดลแบบ Supervised Learning method และเป็นโมเดลแบบ Ensamble แบบ Boosting หรือการนำ Weak Classifier (แม่นยำต่ำ) มาทำนายข้อมูลที่เรามีจากนั้นให้ weak ตัวใหม่แก้ไข error เรื่อย ๆ เป็น Decision Tree ต่อกันเป็นลำดับหลาย ๆ ต้น ซึ่งวิธีการนี้จะทำนายความซับซ้อนได้ดีกว่าแบบ Bagging ที่นำผลจาก Decision Tree มาโหวตกัน แต่มีข้อเสียคือใช้เวลานานกว่านั้นเองค่ะ Dataset ที่เราต้องการจะทำ Classification ในวันนี้คือ Bank Telemarketing หรือการทำการตลาดทางโทรศัพท์ของธนาคาร ซึ่งข้อมูลมีจำนวน 41188 แถว 21 คอลัมน์ และเป้าหมายที่เราต้องการคาดการณ์หรือ Classify คือลูกค้าที่ทางธนาคารโทรไปเสนอขายสินค้าทางโทรศัพท์จะสมัครรับสินค้าหรือไม่ นั้นคือ…