Category Data Science

AI /  Data Mining / Data Science / Machine Learning

R vs Python are well-matched ?

วันก่อนผมได้คุยกับหัวหน้าถึงงานที่จะให้น้องฝึกงานทำเกี่ยวกับ Recommendation System ครับ ไล่จาก Weka มาเรื่อยๆ จนมาถึงภาษา R กับ Python มันใช่มวยที่ถูกคู่ในการเปรียบเทียบ หรือป่าว ? เลยมาสรุปแปะไว้ดีกว่าครับ เพราะคนส่วนใหญ่ชอบดูเปรียบ 2 ตัวนี้ในการเลือกสายการทำงาน A Few day ago. I discussed with my boss about trainee project’s “The Recommendation System”.Weka .. so many R vs Python are…

Introduction to Machine Learning

ภาพจากเว็บ https://pixabay.com/p-503588/?no_redirect

สำหรับ Blog นี้เป็นการสรุปจากที่ได้ฟัง ได้อ่านมาจากหลายๆที่นะครับ และเนื่องด้วย ผมไม่เก่ง Math ฉะนั้นบางอย่างจะมีอธิบายผิดพลาดได้ครับ คำว่า Artificial Intelligence(AI) และ Machine Learning(ML) มันเหมือน หรือต่างกันอย่างไร แล้ว Programming กับ Machine Learning(ML) และตัวสุดท้าย พอดีถามอากู๋แล้วคนถามเยอะ Data Mining(DM) กับ Machine Learning(ML) Data Mining Machine Learning Association rules Supervised Learning Clustering Unsupervised Learning Classification Reinforcement Learning…

สรุปการอบรม A Tool Development for Ontology-Based Applications

เมื่อวันเสาร์ที่ผ่านมาครับ 3 ก.ย. 59 ผมได้ไปงานอบรมเกี่ยวกับ Ontology ครับ จัดที่คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือครับ (เพิ่งรู้ว่าถ้านั่ง Taxi มาห่างจากบ้านไม่ถึง 10 km นั่งรถเมล์นี่อ้อมโลก) สอนโดย ดร. มารุต บูรณรัช ครับ Ontology คือ อะไร ? สร้าง Ontology ได้อย่างไร นำ Ontology ไปใช้ทำอะไรได้บ้าง Semantic Search HOZO Ontology Editor คั่นด้วยอาหารกลางวันครับ อร่อย แต่จากที่คุยกับคนที่มาอบรมส่วนใหญ่เป็นอาจารย์ กับนิสิตปริญญาโท-เอก ทั้งนั้นเลย มีมุนษย์เงินเดือนงงๆ อย่างผมคนเดียวเข้าไปเรียนครับ OAM…

สรุปงาน Python/Hadoop for Young Data Scientist

ภาพจากเพจ Data Science Thailand https://www.facebook.com/DataScienceTh/photos/a.876705342372714.1073741831.869639369745978/1145673978809181/?type=1&theater

เมื่อวันเสาร์ อาทิตย์ที่ผ่านมา (20-21 สิงหาคม 2559) ผมได้ไปงานสัมมนา Young Data Scientist ครับ โดยงานนี้เป็น Course เริ่มต้นสำหรับผู้ที่สนใจในเรื่อง Data Science ครับ อ๋องานนี่จัดเป็นครั้งที่ 2 แล้วนะ สำหรับงานนี้จะเน้นในเรื่อง Python กับ Hadoop ครับ สำหรับผมที่เป็นสาย Developer อยู่แล้ว ขอเลือก Python ครับ (ตัว Hadoop เคยลอง Set up เล่นๆใน vm แล้ว แต่ถ้าในงานนี้เป็นการเล่นบน MS…

Data Science 0.121

Data = ข้อมูลดิบ ทำอะไรได้บ้าง ? ภาพนี้คงตอบได้หมดครับ ถ้าเรามีการจัดการกับข้อมูลที่ดี เราสามารถใช้ประโยชน์จากมันได้เต็มที่ครับ ถ้า Data เป็นวัตถุดิบที่ป้อนเข้าโรงงาน Information, knowledge, Insight และ Wisdom เป็นผลิตภัณฑ์ (Product) ที่ได้จากกระบวนการในขั้นตอนต่างๆครับ แล้วข้อมูลแต่ละแบบ บอกอะไรเราบ้าง ? ลองมาดูอีกมุม – Mind Map vs Mega Mind Map – Transaction Processing vs Event-Based Processing – อะไรที่ทำให้ Data Science ดัง…

[Digital Thailand] Big Data in Business

บทความนี้ก็แตกออกมาจาก Blog “สรุปจากงาน Digital Thailand 2016 ครับ”  ขอสรุปสิ่งที่ได้จากการฟังสัมมนาในงาน Digital Thailand วันที่ 28-May-2016 ครับ Turning Big Data Into Personalized User Journeys ใน Section แรกมาจาก “Turning Big Data Into Personalized User Journeys” โดย Mr. Kevin Jackson, Global Sales Director of Gravity R&D Digital…

Small Data vs Big Data

บทความตอนนี้จะขยายมาจากที่ไปฟังสรุปงาน Big Data Conference ครับ จากที่ผมเคยได้บินคำว่า Big Dataมาตั้งแต่ตอนสมัยเรียนปี 4 ผ่านมาแล้ว 3 ปี เห็นคนพูดว่า Big Data อะไรอะไรก็ใหญ่ไปหมด แต่เราไม่รู้มันใหญ่แค่ไหน ถ้ามันไม่ได้เริ่มจากสิ่งเล็กๆ ใช่ครับ Big Data มันใหญ่ได้ ก็ เพราะ มี Small Data แล้ว Small Data มัน คือ อะไร ไม่เคยได้ยินเลยยย จริงๆแล้วมันอยู่รอบๆตัวเรา เจ้า Small Data เนี่ย มันมาตั้งแต่ที่มีฐานข้อมูลในยุคที่ระบบไฟล์ มาจนถึง…

สรุปงาน Big Data Conference 2016

เมื่อวาน ผมได้ไปหางาน Big Data Conference ไปหา Idea ใหม่ และหาคำตอบให้กับตัวเอง ด้วยว่าเราเรียน ป โท Computer Science ที่จุฬา ดีไหม ? มาเข้าเรื่องกันเลยดีกว่าครับ Section 1: Going Intersteller?: The Truth Behind the Cloud โดยคุณ Rawitat Pulum อะไร คือ big data เราสนใจอะไร ทาง อ มองต่างจาก 3V มาเป็น 4S ย้อนกลับไปในยุคแรกๆ ของ…

Neural Network with WEKA รวมปัญหาที่เกิดขึ้น

ในระหว่างที่ทำตาม Workshop: Neural Network with WEKA หลายๆคนอาจจะประสบปัญหาในระหว่างการทำงาน ผมเลยได้รวมรวมข้อมูลไว้ ดังนี้ครับ 1.ปัญหา Train and test set are not compatible สาเหตุ: เกิดจากไฟล์ .arff ของเรามีส่วนการประกาศ attribute ที่ไม่เหมือนกัน หรืออาจะมี Character บางตัวแปลกปลอมอยู่ในไฟล์ฉบับภาษาอังกฤษ ฉบับภาษาอังกฤษ 1.Make sure that the train and test sets have EXACTLY the same attributes…