Category Data Science

[Tableau] มาจัดการกับข้อมูลเวลากันเถอะ

ตอนนี้กำลังเผา Term Project ของวิชา Social Network ครับ ลองเอา json ที่ได้จาก Graph API ของ Facebook มาแสดงผลด้วย Tableau โดยกำหนดโจทย์ขึ้นมาว่า อยากรู้ว่า Post ที่ถูกแชร์มากที่สุดเนี่ย มันถูก Post ในช่วงเวลาไหนกันนะ โดยข้อมูลที่ได้จาก Facebook อยู่ในรูปแบบ ปี-เดือน-วัน เวลา แต่เวลาอย่าลืม + 7 กลับเข้าไปด้วย เพราะข้อมูลที่ได้จาก Graph API มันมีลักษณะอยู่รูปแบบเวลาสากลครับ สำหรับใน Tableau สามารถแก้ได้โดย ใน…

[WEKA] ทำให้มันรองรับภาษาไทย

ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข หาไฟล์ RunWeka.ini ซึ่งอยู่ใน Path C:\Program Files\Weka-3-8 เปิด Text Editor อะไรก็ได้ แต่ต้อง Run as Administrator เปิดไฟล์ RunWeka.ini หาบรรทัด แก้ไขเป็น Save ไฟล์จากนั้นลองเปิด WEKA เพื่อลองทดสอบอีกครั้งครับ

Random Walk

ถ้า Search Google ภาษาไทย เราพบว่า Random Walk มันจะไปโยงกับตลาดหุ้นนะ มาดูกันดีกว่าว่า Random Walk คือ อะไร ผมว่า Video นี้อธิบายได้ง่ายดีครับ  

ลอง Visualize Data จาก Social Network กัล

Blog นี้ดองไว้นานเหมือนกัน ขึ้นโครงไปเรื่อยๆ ค่อยเติมมาเกือบเดือน ถึงเสร็จครับ มาเขียน Blog เก็บไว้ เพราะผมงงครับ 55555 กับวิชา SNA ครับ ติดมาอยู่ 2 Week และก็ไม่มีเวลามาหาว่าผิดตรงไหน การบ้านท่วมตัวครับ เข้าเรื่องกันดีกว่าครับ สิ่งที่ต้องมี Python – ผมใช้ Python 3 ครับ Editor – ผมใช้ VSCode (จริงๆ  ใช้ Jupyter ใน Anaconda ก็ได้นะครับ ครบครันดี) Internet – เอาไว้เก็บข้อมูลจาก…

[Gephi] Memory ไม่พอ และ JVM creation failed

หลังจากใช้เจ้า Gephi มาสักพักลังๆ พบปัญหา 2 เรื่องนี้ครับ Increase memory and restart Gephi ? JVM creation failed เลยมา Blog ไว้ดีกว่าครับ เพราะ 2 ปัญหานี้มันเป็นลูกโซ่กันครับ โดยเกิดปัญหาแรกก่อน เมื่อทำงานไปสักพัก ตัว Gephi มันแจ้งว่า “Increase memory and restart Gephi ?” ถ้ากดตอบรับไป ตัว Gephi มันแอบไปแก้ Config ที่ไฟล์ gephi.conf ในโพลเดอร์ C:\Program Files (x86)\Gephi-0.9.1\etc…

ลง Gephi on Ubuntu

การลงตัว Gephi  บน Ubuntu มีขั้นตอน ดังนี้ Download ตัว Setup กันก่อน แตกไฟล์ tar มาตรวจสอบ ว่ามี Java ยัง ถ้าไม่มีลงเลยครับ sudo add-apt-repository ppa:webupd8team/java sudo apt-get update sudo apt-get install oracle-java8-installer oracle-java8-set-default ลง NetBean (ตอนแรกผม Download มาแล้วทำยังไง ก็ Run ไม่ขึ้นครับ เลยลง NetBean เลย เพราะตัว Gephi มัน…

[CodeMania101] Predictive Modelling based on Small Data

ยุคนี้อะไรก็ Big Data ครับ สำหรับ Session โดย อ เอกสิทธิ์ พัชรวงศ์ศักดา แห่ง Data Cube ซึ่งเน้นไปในส่วนของ Data Mining ผมเข้าใจว่าเป็นส่วนหนึ่งของ Data Science ครับ (ก่อนอ่านต่อไป หากใครเข้า Session นี้กับผม ผมมีการจัดเรียงเนื้อหาใหม่ตามความเข้าใจผมนะครับ อาจจะมีการสลับลำดับ) ทุกอย่างเริ่มต้นที่ Data ซึ่งพอมันมีปริมาณมองพอ เรียกเป็น Big Data โดยดู 3V เดิม + 2V ใหม่ครับ โดยเจ้า 3V…

R vs Python are well-matched ?

วันก่อนผมได้คุยกับหัวหน้าถึงงานที่จะให้น้องฝึกงานทำเกี่ยวกับ Recommendation System ครับ ไล่จาก Weka มาเรื่อยๆ จนมาถึงภาษา R กับ Python มันใช่มวยที่ถูกคู่ในการเปรียบเทียบ หรือป่าว ? เลยมาสรุปแปะไว้ดีกว่าครับ เพราะคนส่วนใหญ่ชอบดูเปรียบ 2 ตัวนี้ในการเลือกสายการทำงาน A Few day ago. I discussed with my boss about trainee project’s “The Recommendation System”.Weka .. so many R vs Python are…

Introduction to Machine Learning

ภาพจากเว็บ https://pixabay.com/p-503588/?no_redirect

สำหรับ Blog นี้เป็นการสรุปจากที่ได้ฟัง ได้อ่านมาจากหลายๆที่นะครับ และเนื่องด้วย ผมไม่เก่ง Math ฉะนั้นบางอย่างจะมีอธิบายผิดพลาดได้ครับ คำว่า Artificial Intelligence(AI) และ Machine Learning(ML) มันเหมือน หรือต่างกันอย่างไร Artificial Intelligence(AL) – ระบบอะไรก็ได้ที่มันดูฉลาด ตอบสนองได้ตรงความความต้องการ ไม่ได้มองว่ามันฉลาดมาจากอะไร ฉลาด เพราะ มีการเก็บช้อมูลดี พอ Search มา Query where แล้วเจอ มีตรรกะตรงไป ตรงมา หรือ มันฉลาดจากการให้เครื่องเรียนรู้ข้อมูลที่ส่งเข้าไป  (AI – ดูเป็นคำว่ากว้างๆเน้อ) Machine Learning(ML) -…

สรุปการอบรม A Tool Development for Ontology-Based Applications

เมื่อวันเสาร์ที่ผ่านมาครับ 3 ก.ย. 59 ผมได้ไปงานอบรมเกี่ยวกับ Ontology ครับ จัดที่คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือครับ (เพิ่งรู้ว่าถ้านั่ง Taxi มาห่างจากบ้านไม่ถึง 10 km นั่งรถเมล์นี่อ้อมโลก) สอนโดย ดร. มารุต บูรณรัช ครับ Ontology คือ อะไร ? แผนผังความรู้ (Mind Mapping) ที่มีการกฏเกณฑ์เข้ามาครับ ถ้าเข้าใจว่า OOP มาระดับนึง ผมว่าไปได้เร็วครับ Concept มีความคล้ายคลึงกันในระดับนึงนะ ที่เน้นการจัดหมวดหมู่ ใช้งานการในทุกสายงานเลยนะ ไม่ใช่เฉพาะ IT ทางฟากสังคม หรือแพทย์ก็มีใช้นะ (Ontology…