สรุปงาน Global AI Bootcamp – Thailand 2022

สรุประหว่างที่ผมทำงานไป และฟัง FB Live ครับ (แอบอู้ 555) โดย Keyword งานนี้เหมือนจะไปทาง Citizen Data Scientist

09:45 Becoming a Citizen Data Scientist on Azure ML/AI Ecosystem

  • Role
    • ML Engineer - คนที่ Expert เฉพาะด้านมากๆ
    • Data Scientist
    • Citizen Data Scientist (Non-Pro Data Scientist) - คนอาจจะไม่เก่ง Technical และรู้จัก Business ดีพอสมควร
  • ความสัมพันธ์ของแต่ละ Role
  • สำหรับ Session นี้ เน้นไปทาง Citizen Data Scientist เราทำอย่างไร ให้ใช้งานได้สะดวกหละ ต้องใช้อะไรที่ง่าย และที่มี Pre-defined มาระดับนึง เพื่อลดเวลา และ Effort ที่ใช้ โดย Trend ตอนนี้ Service บน Cloud ซึ่งลดเวลาในการทำความเข้าใจ + train โดย Azure มีตัว Azure AI Platform มาช่วย
  • ในมุมของ Citizen Data Scientist นอกจาก Azure (Auto ML / ML Designer) มีพวก Data Platform ต่างๆ อย่างกลุ่ม Power BI / Power platform มาใช้งานได้ด้วยครับ

10:30 AI Builder with Power Platform

  • Sample Flow (คุม Flow ผ่านตัว Power Automate - สร้าง Ap p แบบ Low-Code)
    • ถ้ามี Email มาเข้าที่ Outlook
    • AI Builder ให้ AI มา Extract ข้อมูลจากใบเสร็จ / Invoice ได้ครับ
    • และเอาข้อมูลที่ได้ไปใส่ Excel (ถ้ามี Excel ต่อยอดต่อให้อีก Node เปิด Power BI ทำ Data Visualize ได้เลย)
  • มันดูง่ายเวอร์ กำหนด Area บอก AI ให้เรียนรู้ แล้ว Extract ได้
  • ตอนทำ Workflow ใน Power Automate ดูผ่านๆ นึกว่า Azure Logic App จริงๆนะ (UI คล้ายกัน)

11:15 GitHub Actions for MLOps

  • MLOps คือ อะไร
    • Exploratory Data Analysis (EDA) - วิเคราะห์ข้อมูลเบื้องต้น เพื่อเอามาตั้งสมมติฐาน หรือ ทำความเข้าใจกับ data ก่อน
    • Data Prep - เตรียมข้อมูล ทำ Feature Engineering
    • Develop - Train & Test Model
    • Re-Train - ปรับจูน Model
    • Review - ผลที่ได้จาก Model
    • Deploy - นำ Model + App ที่ครอบไปติดตั้ง
    • Inference - ลองเอา Model ไปใช้จริง
    • Monitor - ติดตามผล และเข้า Feedback Loop
  • GitHub Action คือ อะไร
    • Automate Tools ทำ CI/CD ในที่นี้อาจจะเป็นการ Build App เช่น ถ้าเรามีปรับจูน Code ของ Model ให้เข้าตาม Flow CI เพื่อ Build Model ออกมา และทดสอบ / Flow CD เอา Model ของเราไป Deploy / ตัวฟรีใช้ได้ 2,000 นาที ต่อเดือน
    • มี API สามารถเขียน Code มาครอบอีกทีได้ หรือไปผูกกับ Azure Function App ให้มันทำงานแบบ Automate เป็นต้น
  • Resource : ninefyi/global-ai-bootcamp-thailand-2022: Global AI Bootcamp Thailand 2022 (github.com)

13:00 Train a classification model with no-code AutoML in the Azure Machine Learning studio

  • Session นี้ เหมือนส่วนขยายอธิบาย Session แรกสุด เพิ่มในส่วนของ Azure (Auto ML / ML Designer) เป็น Demo การทำ Auto ML กับ Data Set Bank Data โดยตัว Auto ML มันเป็นแนว Wizard
    • กำหนด Data Set
    • Prepare Data Set - เอาไว้กำหนด Field ที่สนใจ
    • เลือกหมวดของ Algorithm -
      • ตรงนี้ Auto ML มันจะเอาหลายๆ Algorithm มาทำงานพร้อมๆกัน โดยเรามาดูผลจาก Accuracy / Confusion Matrix เป็นต้น
      • เลือกเครื่องที่ใช้ประมวลผล ถ้าใช้งานที่ข้อมูลเยอะๆ สามารถใช้ GPU ได้ แต่ราคาจะแพงกว่า
    • กำหนด Validation Rule
    • ตรวจผล - เลือก Model ไป Publish Inference Pipeline เพื่อสร้าง REST API ให้กับ App ของเราครับ
  • Resource :
  • เอาขายของมี สรุป AI-900 เผื่อไปอ่านต่อยอดกันครับ

13:30 Introduction to Azure Cognitive Services for Speech

  • Session นี้ตรงอย่างนึง แบบที่น้องแมวบอกเลย ไม่ค่อยมีใครมาพูดกัน
  • Azure Speech Service มีสิ่งที่ MS เตรียมให้ ดังนี้
    • Speech-to-text - แปลงเสียงเป็นข้อความ
    • Text-to-speech - แปลงข้อความเป็นเสียง เอาไว้ช่วยอ่าน ^__^
    • Speech translation - แปลงภาษา
    • Voice Assistance - Javis
    • Speaker Recognition - บอกว่าใครเป็นคนพูด ข้อความนี้

14:15 Building the real-case business solution using big data and AI for geo-location problem

  • Trend
    • Traditional Data Collection and Processing - ระบบ OTLP / Database แบบดังเดิม
    • BIG DATA collection and processing - มี Keyword ใหม่มาเพิ่ม Data Warehouse
    • Business Intelligence - เอาข้อมูลจาก Data Warehouse มานำเสนอ (Visualize)
    • Advance Analytic
    • Machine Learning / Artificial Intelligence
  • AI กับ Big Data มีความเกี่ยวข้องอย่างมีนัยยะสำคัญ เพราะ ว่า AI จะแม่นได้ ต้องมี Data ที่จัดเก็บมาอย่างดี ยกตัวอย่างเช่น ประเทศจีน ที่มีการเก็บข้อมูลมาก่อน รอจนเทคโนโลยีมันพร้อม แล้วค่อยมาทำระบบ AI พวกที่ทำ Social Credit เป็นต้น
  • ภาพด้านบน DATA FLOW / Concept Diagram ส่วนตัวงงว่า Data Lake เอาไว้ทำอะไร ตอนแรกผมคิดว่าไม่ต่างกับ Data Warehouse เห็นภาพนี้แล้วชัดเจนดีครับ จากภาพด้านบนนี้ ถ้างานมันเร่ง เราสามารถใช้ Cloud เพื่อมาสร้าง IT Infrastructure ขึ้นมา
  • DATA Expert Team
    • Data Management - Data Engineering - ทำข้อมูลให้พร้อมใช้เป็นระบบ
    • Data Analytic - Data Scientist / Data Analyst / Data Virtualize - ทำ Model สร้าง Dashboard
    • Application - งาน Dev + QA ขึ้นกับตัว Requirement ด้วยว่าต้องมี App ที่ต้องเรียกใข้ AI เพื่อเอาผลลัพธ์ไปใช้งานต่อไหม
    • Business - Business Analyst ให้ข้อมูล Business / Project Manager ดูแผนโครงการภาพรวม
  • Analytic Level เพราะทุกงานไม่จำเป็นต้องใช้ ML มาแก้ปัญหาเสมอไป จัดปัญหา/Requirement เข้าหมวดก่อน แล้วเลือก Analytic Solution
  • ML Algorithm
- DATA SCIENCE PROCESS CYCLE (การเลือก Location ปั๊ม)
  • Business Understanding -
    • เข้าใจธุรกิจ และสัมภาษณ์ user ที่เกี่ยวข้อง
    • เรื่อง Location ปั๊มน้ำมัน ต้องรู้โจทย์ว่าสร้างแล้ว มีปัจจัยอะไรบ้าง สร้างแล้วมีรายได้เท่าไหร่ มีโอกาศกำไรไหม หรือมีผลกระทบอะไรกับสาขาเดิมที่อยู่ข้างเคียง (Cannibalization)
  • Data Understanding
    • จาก Business Understanding มาหา Feature ที่สนใจจริงๆ จาก Location ปั๊มน้ำมันอาจจะมี Feature แปลกๆ เช่น จำนวนเลน ระยะระหว่างแยก เกาะกลาง เป็นต้น ทำให้ได้ Data Flow (ภาพรวม) เพื่อเอาไปทำต่อใน Step ถัดไป
  • Data Preparation
    • วาง Data Pipeline Flow การเก็บข้อมูล
    • จาก Feature ที่วางมา เวลามาทำระบบมันได้มาง่ายๆ หรือป่าว หรือ ต้องมา Process สักนิด เพื่อให้ได้ตัว Data ที่ตรงกับที่ User พูดจริงๆ
  • Modeling & Evaluate - ต้องเข้าใจโจทย์ก่อน ว่าจะทำอะไร เช่น ทำ Recommendation โดยมีรูปแบบ Data แบบไหน มันทำให้เลือก Algorithm ได้
    • ถ้าเป็น Model อะไรที่เป็นมาตรฐานจะใช้ Library ที่มีคนทำเตรียมไว้ให้ได้
    • และมีปัญหาที่อาจจะต้องทำ Model ขึ้นมาเอง ตรงนี้ตัว Data Scientist ต้องมาสร้าง Model เอง มี Coding เข้ามาตรงนี้และ
  • ผมชอบ Quote อันนี้มาก มันเหมือนเราต้องเรียนรู้ เพิ่มเติมไปตลอดชีวิต เพื่อให้ได้โอกาสใหม่ๆ

15:00 Let's see how LaLiga uses Azure AI to help fans analyze a game

  • อยู่มาจะ 30 ปีและ คนเขียน Blog เพื่อรู้ว่า LaLiga มัน คือ ฟุตบอล 555 จากเดิมที่เข้าใจว่าวงการนี้ มันต้องเน้นกำลังกาย มีนักวิทย์การกีฬา มีกุนซือ เก่งๆ ตอนนี้มี AI มาด้วย เช่น
    • วางแผน ช่วยกุนซือวาง Location ของนักเตะ หรือมาปรับกลยุทธ์
    • Chat Bot - ช่วยเพิ่ม Engagement จากแฟนๆ
  • Reference : Microsoft Customer Story-LaLiga boosts fan engagement with multiple digital channels and conversational AI

สำหรับ VDO ย้อนหลังดูใน FB Live ของทาง Page Spark Tech Thailand ครับ

สำหรับงานนี้เท่าที่ฟังมานะครับ ตอนเช้าจะเน้นภาพรวม และบ่ายเจาะบาง Service ของ Microsoft + Use Case ครับผม เขียน Blog นี้ไปเหมือนกับขายของให้ Microsoft // Sponsor เข้า Blog นี้ก็ดีนะ 555

Reference


Discover more from naiwaen@DebuggingSoft

Subscribe to get the latest posts sent to your email.