Data Sci Boot Camp Batch#11: Python for Data Analyst 2

สำหรับใน Live นี้มา Recap Python for Data Analyst 2 และ Intro to Data Sci (ตอนอรกเขียนไว้ เดียวกลัวมันยาว แยกอีกอีนน่าจะดีกว่า ส่วนแรก Python for Data Analyst ส่วนนี้เรียกว่าเป็นการรวม Blog เหมือนเดิมครับ โดยมีส่วนที่แรก และมีหัวข้อ Blog เก่าๆในส่วน Python ส่วนสุดท้ายแนะนำการทำ Machine Learning แนะนำการทำ Machine Learning โดยใช้ sklearn ครับ เหมือนเคยจะมีแตะไว้นานแล้ว แต่ไม่ได้ Blog ไว้รอบนี้ได้มา Blog แล้ว โดยมี Recap กันก่อน โดยจากที่เรียนใน R ตัว Python ทำได้ โดยใช้ Workflow เดียวกัน ตาม Code ตรงนี้ สามารถไล้ตาม Comment ได้นะ คิดว่าคล้ายกับใน live อยู่ เพราะใช้ DataSet เดียวกัน หรือจะลอง Run ใน Google Colab ก็ได้

Data Sci Boot Camp Batch#11: Python for Data Analyst

📌Python OOP อันนี้ขอแชร์ตัว List ที่เคยไปเรียนมาเมื่อหลายปีก่อนแทนครับ 📌Numpy 101 ตาม Blog เลยครับ 📌Pandas 101 อันนี้มี Blog เขียนไว้แล้วครับ 📌Request 101 สำหรับ Python แล้ว เวลายิง Request ไปดึงข้อมูลจะมี Package มาตรฐานมาให้แล้ว ดังนี้ การดึงข้อมูลมี Public API หลายตัว เอาจากใน Repo นี้ก็ได้ มันจะบอกหมด เปิด Free หรือ ต้องขอ Token มุมของ Data Analyst การ Get ข้อมูลมาประกอบกัน แล้วไปหา Insight ต่อ อย่างตัวนี้ใช้ Panda ครับ สำหรับ Verb อื่นๆ Post / Put ลองดูหัวข้อแรกใน Blog นี้ได้ครับ [KBTG-GO#04] API Design

ตั้งค่า Synology NAS กับ Cloudflare tunnel

ปกติแล้ว synology nas มันจะมี service ที่ให้เชื่อมต่อจากภายนอกผ่านตัว quick connect อยู่แล้ว แต่ข้อเสียของมันช้ามาก เวลา download ไฟลฺ์ ทางแก้จะมีหลายแบบตั้งแต่ สิ่งที่ต้องเตรียม หลังจากมีของพร้อมแล้ว มาตั้งค่ากันครับ สมัครใช้งาน Cloudflare ZeroTrust ถ้าดูจาก doc ของ Cloudflare การจะเปิด Cloudflare Tunnel ต้องเปิดตัว Cloudflare ZeroTrust ก่อน สำหรับใครที่มีแล้วข้ามไปเลยนะ ถ้าใครไม่มีตามขั้นตอนเลยครับ จริงมีจุดที่สนใจน่าจะเรื่องของการจ่ายเงินครับ อย่าลืมเลือก Free Plan Create Cloudflare Tunnel ในส่วนของ Cloudflare ZeroTrust ให้เข้ามาในส่วน Cloudflare Zero Trust > Tunnel > Add a Tunnel ที่นี้มันมีทางเลือก 2 แบบ Cloudflared กับ WARP Connector (ของใหม่ เหมือนจะ By Pass Limit 100 MB ได้ แต่ผมยังไม่ได้ลอง) ตั้งชื่อ tunnel มันมีการเชื่อมต่อหลายแบบเลย เลือก docker มันจะ default คำสั่งมาให้ รูปแบบคำสั่งจะประมาณนี้ ปกติเราเอาคำสั่งไปรันเลย แต่ไหนใช้ของ Synology แล้วก็ไปทำในขั้นตอนถัดไปเลย Link NAS ของเรากับตัว Cloudflare Tunnel ติดตั้ง Container ของ Cloudflare Tunnel โดยเข้าที่ Container Manager > Registry หา Container จาก…

ฮาวทู Pandas

สำหรับ Pandas ผมชอบเรียก panda เป็น library ที่ช่วยให้หมุน Data ออกมา สำหรับหา insight หรือ จะเอาไปแสดงผลก็ได้นะ โดย Pandas เป็นอีก Library ที่ต่อยอดจาก NumPy ที่ผมเขียนไว้ใน Blog ตอนก่อนครับ มุมมองข้อมูลใน Pandas Get Pandas *️⃣ Install *️⃣ Using Sample Usecase – Create DataFrame from a dictionary – Explore the DataFrame 📌 Display the x Rows 📌 summary statistics 📌 get data frame information 📌 shape บอกจำนวน Rows / Columns – Data Manipulation (Basic) 📌 Select By Column Name 📌 Select By Index ( .iloc[]) 📌 df[condition] เพื่อกรองข้อมูล ตาม Column 📌 query – กรองแบบ SQL ถ้าเทียบ Syntax จะดูง่ายกว่า df[condition 📌 .Filter() กรองข้อมูลตามเงื่อนไข มันจะไปหาจาก Index Label ปกติจะเป็นตัวเลข แต่แก้ตัวหนังสือได้ มีจุดเด่นที่เหนื่อกว่าแบบ df[condition] มันเลือกตามแกนได้ด้วย…

Starbucks Reward 2025

ปีนี้ได้ผ้าห่มครับ ต่อยอดจากปีที่แล้วที่เป็นกล่องใส่ของ และปีก่อนหน้าที่เป็นเก้าอี้สนามที่กลายเป็นที่นอนแมวแล้ว ผ้าห่มเป็นผ้าเย็นๆ นอนแล้วสบายดีครับ

บันทึกไว้ก่อน แผ่นดินไหวทางโน้นสะเทือนถึง กทม 28-03-2568

จดไว้ มันวันนั้นเป็นวันที่วุ่นวายวันนึงเลย เพราะตอนเช้ามาช่วงน้องดูเคส และแก้ App Server โน่นนี่นั่น รวมถึงมา Resolve Requirement Conflict เพราะมันแยก Branch กันนะ หลังคุยจบบ่ายประมาณ 13:30 จะมาแก้ Code ต่อ เพราะลองทำ Unit Test มันใช้ได้ เลยมาลองทำ Test จริงสักรอบก่อน Commit ระหว่างที่ทดสอบรู้สึกโลกหมุน ตอนแรกคิดว่านอนน้อย หรือ เพราะปัญหาทางหู (เมื่อวานไปหาหมอหูมา) จนมาเห็นว่าพวกของที่ห้อยๆ อย่างไฟ ของตกแต่งมันสั่น แต่เราทำงานชั้น 3 เองนะ พอเห็นข่าวในทวิตว่าแผ่นดินไหว เลยรีบ git commit / push แล้วรีบคว้าคอม กับมือถือออกมาเลย //ถ้ายังเป็นเมื่อก่อนที่ใช้คอมส่วนตัวมาทำงานคงคว้าออกมาด้วย เดินวนๆข้างนอก แล้วติดต่อน้อง แม่ น้องติดต่อได้ แต่แม่ติดต่อไม่ได้เลย โทรศัพท์ระบบมันล่มไปช่วงนึงเลยมือถือ เบอร์บ้าน เปิดกล้องเห็นแบบกระจกตู้โชวสั่นๆ ทางตึกให้กลับเข้าไปตอน 13:50 นะ แล้วมีแจ้งให้กลับบ้าน เพราะเด๊๋ยวจะมี Aftershock ตามมาอีกรอบ ตอนนี้รีบไล่ปิดปลั๊กไฟ คอมทุกคนหมดเลย บางคนชิ่งก่อนจะมีคำสั่งแล้ว กว่าจะออกจาก บ จริง เกือบๆ บ่าย 3 รอรถเมล์สาย 57 ตอนแรกดูใน App ติดแถว รพ ตากสิน นานมาก (สรุป เค้ากันที่แล้วเอาคนไข้ทยอยออกมา แต่แอบเสียวจริง ตรง รพ เอง มีสร้างตึกด้วย) และรถติดแบบเรื่อยๆจนถึงช่วงศิริราชมีเหมือนกัน อันนี้ติดนานหน่อย คนอัดกันขึ้นรถเมล์จะออก เราจะออกไปเดินไม่ได้ จำได้ว่าติดแถวนั้นนานเหมือนกัน ชม นิดๆเลย กว่าจะหลุดมาพาต้าได้ และมีเรื่อง peak อีกเรื่อยคนขับบอกว่าแบตจะหมดแล้ว จะส่งแถวสายใต้เก่า แล้วจะเอารถไปแอบก่อน เลยได้ลง…

ฮาวทู numpy

จดไว้ก่อน เจ้า lib numpy เป็น Lib ที่ทำให้ตัว Python ทำการกับตัว Numerical เก่งขึ้น ทำงานกับพวกตัวเลขได้ดีขึ้น โดย NumPy ชื่อเต็ม Numerical Python เหมือนได้ฟังจากตัวงาน Global AI Bootcamp Bangkok 2025 เหมือน Lib นี้เป็นตัวเปิดให้ Python เข้ามาทำงานด้าน AI ได้ง่ายขึ้น และแบบเป็นฐานให้หลาย Lib เอาไปใช้งานต่อยอด อย่างตัว Pandas / PyTorch เป็นต้น Get NumPy Sample Usecase – Create Array / Vector – Resize Array / Vector – Create Matrix – Basic Operations – Statistic Operations จริงๆมีอีกหลายตัว ดูเพิ่มเติมจาก doc > – Where – Save Object ในกรณีที่ Python ต้อง Read RData ใช้ตัว pyreadr ตัวอย่างตามนี้ //เคยเจอเคสคนทำเดิมออก Code R ยังเป็นตำนานที่ไม่มีคนแก้ต่อ 555 แถมเคสที่ R Read RData ต้องลง RcppCNPy จริงๆมีอีกหลายเคสนะ ลองดูได้จาก

Data Sci Boot Camp Batch#11: Essential Statistics #3 (Hypothesis Testing / AB Test / Linear Regression)

Inferential Statistics Inferential Statistics – ภาษาไทย สถิติเชิงอนุมาน เป็นเอาข้อมูลที่เก็บมาเข้า Framework เพื่อทดสอบสมมติฐาน โดยขั้นตอนหลักดังนี้ 🎯กำหนด Hypothesis ตั้งสมมติฐาน มาถึงตัวแรกก่อน กำหนด Hypothesis ตั้งสมมติฐาน โดยมีกำหนด 2 ตัว One-Tail vs Two-tail 🫙Collect Data เก็บข้อมูล อาจจะตามที่ได้วางแผนว่า ว่าจะมี Sample เท่าไหร่ กลุ่มตัวอย่างแบบไหน ตามบทก่อนๆหน้าได้เลย 🧮 Calculate Stat เอาข้อมูลมาคำนวณ Decriptive statistics พวก mean mediam mode และเอาข้อมูลมา plot และมาตอบ Hypothesis ที่ตั้งไว้ ปัญหาตอนแรก ถ้าตัวเลขมันตกไป 24999 หรือ 30000 เราจะตัดสินใจยังไงว่ามันเข้าข่ายว่าผ่าน H0 หรือ ไม่ผ่าน มีหลายแบบ 🎲 Conclusion – 🎲ตัดสินใจยังไงว่า H0 ผ่าน หรือ H0 ไม่ผ่าน 🎲 🚩- วิธีแรก Critical Region อันนี้นักสถิติเค้าแก้ปัญหา โดยกำหนด Critical Region (่ช่วงวิกฤติ) เหมือนพวกเลยไปจาก 2 sd ถ้าตกไป reject H0 เลย โดยตรวจทั้งฝั่งซ้าย และขวา 2 tail Test 🚩- วิธีที่สอง เอา p value เทียบกับ alpha 🚩- วิธีที่สาม ใช้ตัว…