[WEKA] ทำให้มันรองรับภาษาไทย

ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8
ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8
ในระหว่างที่ทำตาม Workshop: Neural Network with WEKA หลายๆคนอาจจะประสบปัญหาในระหว่างการทำงาน ผมเลยได้รวมรวมข้อมูลไว้ ดังนี้ครับ 1.ปัญหา Train and test set are not compatible สาเหตุ: เกิดจากไฟล์ .arff ของเรามีส่วนการประกาศ attribute ที่ไม่เหมือนกัน หรืออาจะมี Character บางตัวแปลกปลอมอยู่ในไฟล์ฉบับภาษาอังกฤษ ฉบับภาษาอังกฤษ 1.Make sure that the train and test sets have EXACTLY the same attributes…
เมื่อเราได้ Model แล้ว ขั้นตอนต่อไป คือ นำ Model ของเราไปใช้กับข้อมูลจริงๆ ที่อาจจะมาจากแบบสอบถาม, ข้อมูลการรายการซื้อ-ขาย เป็นต้น โดยในที่นี้เราจะมีข้อมูลของกลุ่มตัวอย่างที่ได้จากแบบสอบถาม เพื่อนำมาทำนายว่าพวกเขาเหล่านั้นซื้อจักรยาน หรือไม่ครับ เอกสารประกอบการทำ Workshop นะครับ ข้้นตอนการทดสอบง่ายๆ ดังนี้ครับ
หลังจากได้ Model มาแล้วสิ่งที่เราต้องทำต่อไป คือ การนำโมเดลที่ได้นั้นมาตรวจสอบความถูกต้อง และนำไปผลที่ได้ไปปรับแต่ง Model ของเราจนได้ผลลัพธ์ออกมาเป็นที่น่าพอใจแล้วนำไปทดสอบกับข้อมูลจริงๆ การ Verified Model ที่ได้มานั้นมีขั้นตอน ดังนี้ การทำ Neural Network คือ การ Generate and test หรือ tried and error ซึ่งหมายถึง การลองผิดลองถูก จนกว่าจะได้เป้าหมายตรงตามต้องการ และท้ายที่สุดผมหวังว่าข้อมูลชุดนี้จะเป็นประโยชน์ในการทำความเข้าใจกับโปรแกรม WEKA มากขึ้น และผมแนบวิดีโอสรุปการทำมาด้วยครับ แต่อาจจะมีจุดที่แตกในเรื่องของชุดข้อมูลที่ผมแบ่งไว้นะครับ (เสียงช่วง 1 นาทีแรกอาจจะมีเสียงแทรกนะครับ เพราะผมไม่เก่งในการตัดต่อวิดีโอ ^__^) และ Blog…
หลังจากเรา เตรียมข้อมูล เรียบร้อยแล้ว ขั้นตอนต่อมา คือ การสร้าง Model โดยทำต่อไปตามขั้นตอนเลยครับ หลังจากที่ได้ลองทำตามขั้นตอนเรียบร้อยแล้ว งานถัดไปของเรา คือ การตรวจสอบโมเดล ซึ่งผมเขียนเป็น Blog ถัดไปนะครับ ^____^
ก่อนอื่นเลยบทความนี่ผมเขียนไว้ในเว็บบอร์ด COMSWU นะครับ แต่ติดปัญหาเรื่องสิทธิ์ที่ให้คนนอกเข้ามาดู ผมจึง Rewrite เขียนใหม เพื่อให้คนอื่นๆที่เคยใช้งาน หรือเรียนโปรแกรม WEKA ในการทำ Neural Network แต่ยังไม่มี idea ในการนำไปใช้งานจริงเข้าใจมากยิ่งขึ้นครับ เอกสารประกอบการทำ Workshop นะครับ ขั้นตอนการทำงาน 1. ตรวจสอบข้อมูลก่อนเลย ใน Column ที่เป็น Nominal/Ordinal มันมีข้อมูลกี่ตัวเลือกกี่แบบ 2. สร้าง Sheet ใหม่ใน Excel ขึ้นมา และทำการ copy ข้อมูลจาก Sheet เก่า เพื่อ เอา Format…
ข้อมูลต้นทางหลายอัน 404 ตามกาลเวลานะครับ อย่างพวก pentaho 2025 เข้าไม่ได้แล้วนะครับ วันนี้ผมได้ทำวิดีโอสรุปการใช้งาน WEKA Scoring กับ Pentaho Data Intregration ครับ โดยมีแหล่งข้อมูล และตัวอย่างการทำ ดังนี้ หมายเหตุ: ใช้ WEKA ให้ถูกเวอร์ชั่นด้วย เพราะไฟล์ Model มันจะขึ้นกับ Version ของ WEKA ถ้าผิด version ไฟล์ Model จะเปิดขึ้นมาไม่ได้ หมายเหตุ