[WEKA] ทำให้มันรองรับภาษาไทย

ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8
AI / Data Mining / Data Science / Machine Learning
ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8
ถ้า Search Google ภาษาไทย เราพบว่า Random Walk มันจะไปโยงกับตลาดหุ้นนะ มาดูกันดีกว่าว่า Random Walk คือ อะไร ผมว่า Video นี้อธิบายได้ง่ายดีครับ
Blog นี้ดองไว้นานเหมือนกัน ขึ้นโครงไปเรื่อยๆ ค่อยเติมมาเกือบเดือน ถึงเสร็จครับ มาเขียน Blog เก็บไว้ เพราะผมงงครับ 55555 กับวิชา SNA ครับ ติดมาอยู่ 2 Week และก็ไม่มีเวลามาหาว่าผิดตรงไหน การบ้านท่วมตัวครับ เข้าเรื่องกันดีกว่าครับ สิ่งที่ต้องมี เก็บข้อมูล มาลอง Visualize กัน
หลังจากใช้เจ้า Gephi มาสักพักหลังๆ พบปัญหา 2 เรื่องนี้ครับ เลยมา Blog ไว้ดีกว่าครับ เพราะ 2 ปัญหานี้มันเป็นลูกโซ่กันครับ โดยเกิดปัญหาแรกก่อน เมื่อทำงานไปสักพัก ตัว Gephi มันแจ้งว่า “Increase memory and restart Gephi ?” ถ้ากดตอบรับไป ตัว Gephi มันแอบไปแก้ Config ที่ไฟล์ gephi.conf ในโพลเดอร์ C:\Program Files (x86)\Gephi-0.9.1\etc ในส่วนของ -Xmx ครับ ซึ่งตอนนี้แหละ มันจะเกิดปัญหา JVM creation failed ต่อครับ โดยสาเหตุหลักเลย…
การลงตัว Gephi บน Ubuntu มีขั้นตอน ดังนี้
ยุคนี้อะไรก็ Big Data ครับ สำหรับ Session โดย อ เอกสิทธิ์ พัชรวงศ์ศักดา แห่ง Data Cube ซึ่งเน้นไปในส่วนของ Data Mining ผมเข้าใจว่าเป็นส่วนหนึ่งของ Data Science ครับ (ก่อนอ่านต่อไป หากใครเข้า Session นี้กับผม ผมมีการจัดเรียงเนื้อหาใหม่ตามความเข้าใจผมนะครับ อาจจะมีการสลับลำดับ) ทุกอย่างเริ่มต้นที่ Data ซึ่งพอมันมีปริมาณมองพอ เรียกเป็น Big Data โดยดู 3V เดิม + 2V ใหม่ครับ โดยเจ้า 3V…
วันก่อนผมได้คุยกับหัวหน้าถึงงานที่จะให้น้องฝึกงานทำเกี่ยวกับ Recommendation System ครับ ไล่จาก Weka มาเรื่อยๆ จนมาถึงภาษา R กับ Python มันใช่มวยที่ถูกคู่ในการเปรียบเทียบ หรือป่าว ? เลยมาสรุปแปะไว้ดีกว่าครับ เพราะคนส่วนใหญ่ชอบดูเปรียบ 2 ตัวนี้ในการเลือกสายการทำงาน A Few day ago. I discussed with my boss about trainee project’s “The Recommendation System”.Weka .. so many R vs Python are…
สำหรับ Blog นี้เป็นการสรุปจากที่ได้ฟัง ได้อ่านมาจากหลายๆที่นะครับ และเนื่องด้วย ผมไม่เก่ง Math ฉะนั้นบางอย่างจะมีอธิบายผิดพลาดได้ครับ คำว่า Artificial Intelligence(AI) และ Machine Learning(ML) มันเหมือน หรือต่างกันอย่างไร แล้ว Programming กับ Machine Learning(ML) และตัวสุดท้าย พอดีถามอากู๋แล้วคนถามเยอะ Data Mining(DM) กับ Machine Learning(ML) Data Mining Machine Learning Association rules Supervised Learning Clustering Unsupervised Learning Classification Reinforcement Learning…
เมื่อวันเสาร์ที่ผ่านมาครับ 3 ก.ย. 59 ผมได้ไปงานอบรมเกี่ยวกับ Ontology ครับ จัดที่คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือครับ (เพิ่งรู้ว่าถ้านั่ง Taxi มาห่างจากบ้านไม่ถึง 10 km นั่งรถเมล์นี่อ้อมโลก) สอนโดย ดร. มารุต บูรณรัช ครับ Ontology คือ อะไร ? สร้าง Ontology ได้อย่างไร นำ Ontology ไปใช้ทำอะไรได้บ้าง Semantic Search HOZO Ontology Editor คั่นด้วยอาหารกลางวันครับ อร่อย แต่จากที่คุยกับคนที่มาอบรมส่วนใหญ่เป็นอาจารย์ กับนิสิตปริญญาโท-เอก ทั้งนั้นเลย มีมุนษย์เงินเดือนงงๆ อย่างผมคนเดียวเข้าไปเรียนครับ OAM…
เมื่อวันเสาร์ อาทิตย์ที่ผ่านมา (20-21 สิงหาคม 2559) ผมได้ไปงานสัมมนา Young Data Scientist ครับ โดยงานนี้เป็น Course เริ่มต้นสำหรับผู้ที่สนใจในเรื่อง Data Science ครับ อ๋องานนี่จัดเป็นครั้งที่ 2 แล้วนะ สำหรับงานนี้จะเน้นในเรื่อง Python กับ Hadoop ครับ สำหรับผมที่เป็นสาย Developer อยู่แล้ว ขอเลือก Python ครับ (ตัว Hadoop เคยลอง Set up เล่นๆใน vm แล้ว แต่ถ้าในงานนี้เป็นการเล่นบน MS…