Category Data Science

AI /  Data Mining / Data Science / Machine Learning

[WEKA] ทำให้มันรองรับภาษาไทย

ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8

Random Walk

ถ้า Search Google ภาษาไทย เราพบว่า Random Walk มันจะไปโยงกับตลาดหุ้นนะ มาดูกันดีกว่าว่า Random Walk คือ อะไร ผมว่า Video นี้อธิบายได้ง่ายดีครับ  

ลอง Visualize Data จาก Social Network กัล

Blog นี้ดองไว้นานเหมือนกัน ขึ้นโครงไปเรื่อยๆ ค่อยเติมมาเกือบเดือน ถึงเสร็จครับ มาเขียน Blog เก็บไว้ เพราะผมงงครับ 55555 กับวิชา SNA ครับ ติดมาอยู่ 2 Week และก็ไม่มีเวลามาหาว่าผิดตรงไหน การบ้านท่วมตัวครับ เข้าเรื่องกันดีกว่าครับ สิ่งที่ต้องมี เก็บข้อมูล มาลอง Visualize กัน

[Gephi] Memory ไม่พอ และ JVM creation failed

หลังจากใช้เจ้า Gephi มาสักพักหลังๆ พบปัญหา 2 เรื่องนี้ครับ เลยมา Blog ไว้ดีกว่าครับ เพราะ 2 ปัญหานี้มันเป็นลูกโซ่กันครับ โดยเกิดปัญหาแรกก่อน เมื่อทำงานไปสักพัก ตัว Gephi มันแจ้งว่า “Increase memory and restart Gephi ?” ถ้ากดตอบรับไป ตัว Gephi มันแอบไปแก้ Config ที่ไฟล์ gephi.conf ในโพลเดอร์ C:\Program Files (x86)\Gephi-0.9.1\etc ในส่วนของ -Xmx ครับ ซึ่งตอนนี้แหละ มันจะเกิดปัญหา JVM creation failed ต่อครับ โดยสาเหตุหลักเลย…

[CodeMania101] Predictive Modelling based on Small Data

ยุคนี้อะไรก็ Big Data ครับ สำหรับ Session โดย อ เอกสิทธิ์ พัชรวงศ์ศักดา แห่ง Data Cube ซึ่งเน้นไปในส่วนของ Data Mining ผมเข้าใจว่าเป็นส่วนหนึ่งของ Data Science ครับ (ก่อนอ่านต่อไป หากใครเข้า Session นี้กับผม ผมมีการจัดเรียงเนื้อหาใหม่ตามความเข้าใจผมนะครับ อาจจะมีการสลับลำดับ) ทุกอย่างเริ่มต้นที่ Data ซึ่งพอมันมีปริมาณมองพอ เรียกเป็น Big Data โดยดู 3V เดิม + 2V ใหม่ครับ โดยเจ้า 3V…

R vs Python are well-matched ?

วันก่อนผมได้คุยกับหัวหน้าถึงงานที่จะให้น้องฝึกงานทำเกี่ยวกับ Recommendation System ครับ ไล่จาก Weka มาเรื่อยๆ จนมาถึงภาษา R กับ Python มันใช่มวยที่ถูกคู่ในการเปรียบเทียบ หรือป่าว ? เลยมาสรุปแปะไว้ดีกว่าครับ เพราะคนส่วนใหญ่ชอบดูเปรียบ 2 ตัวนี้ในการเลือกสายการทำงาน A Few day ago. I discussed with my boss about trainee project’s “The Recommendation System”.Weka .. so many R vs Python are…

Introduction to Machine Learning

ภาพจากเว็บ https://pixabay.com/p-503588/?no_redirect

สำหรับ Blog นี้เป็นการสรุปจากที่ได้ฟัง ได้อ่านมาจากหลายๆที่นะครับ และเนื่องด้วย ผมไม่เก่ง Math ฉะนั้นบางอย่างจะมีอธิบายผิดพลาดได้ครับ คำว่า Artificial Intelligence(AI) และ Machine Learning(ML) มันเหมือน หรือต่างกันอย่างไร แล้ว Programming กับ Machine Learning(ML) และตัวสุดท้าย พอดีถามอากู๋แล้วคนถามเยอะ Data Mining(DM) กับ Machine Learning(ML) Data Mining Machine Learning Association rules Supervised Learning Clustering Unsupervised Learning Classification Reinforcement Learning…

สรุปการอบรม A Tool Development for Ontology-Based Applications

เมื่อวันเสาร์ที่ผ่านมาครับ 3 ก.ย. 59 ผมได้ไปงานอบรมเกี่ยวกับ Ontology ครับ จัดที่คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือครับ (เพิ่งรู้ว่าถ้านั่ง Taxi มาห่างจากบ้านไม่ถึง 10 km นั่งรถเมล์นี่อ้อมโลก) สอนโดย ดร. มารุต บูรณรัช ครับ Ontology คือ อะไร ? สร้าง Ontology ได้อย่างไร นำ Ontology ไปใช้ทำอะไรได้บ้าง Semantic Search HOZO Ontology Editor คั่นด้วยอาหารกลางวันครับ อร่อย แต่จากที่คุยกับคนที่มาอบรมส่วนใหญ่เป็นอาจารย์ กับนิสิตปริญญาโท-เอก ทั้งนั้นเลย มีมุนษย์เงินเดือนงงๆ อย่างผมคนเดียวเข้าไปเรียนครับ OAM…

สรุปงาน Python/Hadoop for Young Data Scientist

ภาพจากเพจ Data Science Thailand https://www.facebook.com/DataScienceTh/photos/a.876705342372714.1073741831.869639369745978/1145673978809181/?type=1&theater

เมื่อวันเสาร์ อาทิตย์ที่ผ่านมา (20-21 สิงหาคม 2559) ผมได้ไปงานสัมมนา Young Data Scientist ครับ โดยงานนี้เป็น Course เริ่มต้นสำหรับผู้ที่สนใจในเรื่อง Data Science ครับ อ๋องานนี่จัดเป็นครั้งที่ 2 แล้วนะ สำหรับงานนี้จะเน้นในเรื่อง Python กับ Hadoop ครับ สำหรับผมที่เป็นสาย Developer อยู่แล้ว ขอเลือก Python ครับ (ตัว Hadoop เคยลอง Set up เล่นๆใน vm แล้ว แต่ถ้าในงานนี้เป็นการเล่นบน MS…