Category Data Science

AI /  Data Mining / Data Science / Machine Learning

สรุปงาน Data Science Talk Chill #1

สำหรับวันนี ผมมาแบบ + 1 ครับ ตอนที่พี่ที่บริษัทชวนมา ไอ้เราก็บอกว่าไปด้วย แถมลืมจ่ายตังค์ให้พี่เค้าอีก ดองค่างานข้ามปีกันเลยทีเดียวครับ สำหรับงานวันที่สถานที่จัดงาน คือ ที่ LINK Collaboration Space @ MRT หัวลำโพง มันอยู่แถวอุทยานจุฬา 100 ปีครับ ฝั่งถนนบรรทัดทองครับ ทางเข้าก็ซ่อนแอบอยู่ข้างโรงเรียนครับ เดินหลงไปเหมือนกัน NLP – Natural Language of Passion โดย ดร.อาร์ม [ NECTEC ] ทุกปัญหา ทุกเรื่อง มันมี Pattern อย่าง…

[ML] Setup Python สำหรับ Machine Learning ใน Anaconda

บทความนี้ ทดสอบบน Windows นะครับ โดยตอนนี้เป็นการ Setup Python ใช้พร้อมกับการทำ Machine Learning ใน Anaconda ครับ สิ่งที่ต้องเตรียม ทดสอบ Conda Update Conda และ Anaconda Tip: ถ้าหากลิมเปิด Anaconda Prompt โดยลืม Run As Administrator มันจะด่าเรา ดังรูป Update Machine Learning Library scikit-learn Tip: หากต้องการระบุ Version เฉพาะเจาะจงลงไป สามารถใช้คำสั่ง ดังนี้ Testing:…

[ML] SOM-Machine Learning

แล้ว SOM มัน คือ อะไร คนคิดวิธีการนี้ชื่อส้ม หรือป่าว ? ตอบเลยว่ามันไม่ใช่ครับ SOM เป็นตัวย่อมาจาก Self-Organizing Map ครับ โดยสามารถเรียกอีกชื่อนึงด้นะว่าเป็น Kohonen Map (Network) คิดค้นโดย Dr.Teuvo Kohonen และ Dr. Timo Honkela ส่วนตัวผมคุ้นชื่อหลังมากกว่านะ เพราะเคยเรียน AI มาตอนปริญญาตรี พอมันมี Network และ AI เช้ามาเกี่ยวข้องแล้ว อ่าช่ายใช่แล้วครับ มันเป็นมันเป็น AI ดูตอบแบบกำปั้นทุบดินมากๆ โดยเจ้า SOM…

[Tableau] มาจัดการกับข้อมูลเวลากันเถอะ

ตอนนี้กำลังเผา Term Project ของวิชา Social Network ครับ ลองเอา json ที่ได้จาก Graph API ของ Facebook มาแสดงผลด้วย Tableau โดยกำหนดโจทย์ขึ้นมาว่า อยากรู้ว่า Post ที่ถูกแชร์มากที่สุดเนี่ย มันถูก Post ในช่วงเวลาไหนกันนะ โดยข้อมูลที่ได้จาก Facebook อยู่ในรูปแบบ ปี-เดือน-วัน เวลา แต่เวลาอย่าลืม + 7 กลับเข้าไปด้วย เพราะข้อมูลที่ได้จาก Graph API มันมีลักษณะอยู่รูปแบบเวลาสากลครับ สำหรับใน Tableau สามารถแก้ได้โดย ถัดมาอยากได้อีกว่า…

[WEKA] ทำให้มันรองรับภาษาไทย

ตอนทำ Lab เจอปัญหาที่ว่า ลองเอาข้อมูล CSV ที่เข้าไป พอเลือก Filter แล้วปรับแต่งข้อมูล ปรากฏว่าบึ้มครับ WEKA ไม่รองรับภาษาไทยครับ การแก้ไข – กำหนดเป็น utf-8

Random Walk

ถ้า Search Google ภาษาไทย เราพบว่า Random Walk มันจะไปโยงกับตลาดหุ้นนะ มาดูกันดีกว่าว่า Random Walk คือ อะไร ผมว่า Video นี้อธิบายได้ง่ายดีครับ  

ลอง Visualize Data จาก Social Network กัล

Blog นี้ดองไว้นานเหมือนกัน ขึ้นโครงไปเรื่อยๆ ค่อยเติมมาเกือบเดือน ถึงเสร็จครับ มาเขียน Blog เก็บไว้ เพราะผมงงครับ 55555 กับวิชา SNA ครับ ติดมาอยู่ 2 Week และก็ไม่มีเวลามาหาว่าผิดตรงไหน การบ้านท่วมตัวครับ เข้าเรื่องกันดีกว่าครับ สิ่งที่ต้องมี เก็บข้อมูล มาลอง Visualize กัน

[Gephi] Memory ไม่พอ และ JVM creation failed

หลังจากใช้เจ้า Gephi มาสักพักหลังๆ พบปัญหา 2 เรื่องนี้ครับ เลยมา Blog ไว้ดีกว่าครับ เพราะ 2 ปัญหานี้มันเป็นลูกโซ่กันครับ โดยเกิดปัญหาแรกก่อน เมื่อทำงานไปสักพัก ตัว Gephi มันแจ้งว่า “Increase memory and restart Gephi ?” ถ้ากดตอบรับไป ตัว Gephi มันแอบไปแก้ Config ที่ไฟล์ gephi.conf ในโพลเดอร์ C:\Program Files (x86)\Gephi-0.9.1\etc ในส่วนของ -Xmx ครับ ซึ่งตอนนี้แหละ มันจะเกิดปัญหา JVM creation failed ต่อครับ โดยสาเหตุหลักเลย…

[CodeMania101] Predictive Modelling based on Small Data

ยุคนี้อะไรก็ Big Data ครับ สำหรับ Session โดย อ เอกสิทธิ์ พัชรวงศ์ศักดา แห่ง Data Cube ซึ่งเน้นไปในส่วนของ Data Mining ผมเข้าใจว่าเป็นส่วนหนึ่งของ Data Science ครับ (ก่อนอ่านต่อไป หากใครเข้า Session นี้กับผม ผมมีการจัดเรียงเนื้อหาใหม่ตามความเข้าใจผมนะครับ อาจจะมีการสลับลำดับ) ทุกอย่างเริ่มต้นที่ Data ซึ่งพอมันมีปริมาณมองพอ เรียกเป็น Big Data โดยดู 3V เดิม + 2V ใหม่ครับ โดยเจ้า 3V…