สรุประหว่างที่ผมทำงานไป และฟัง FB Live ครับ (แอบอู้ 555) โดย Keyword งานนี้เหมือนจะไปทาง Citizen Data Scientist
09:45 Becoming a Citizen Data Scientist on Azure ML/AI Ecosystem
- Role
- ML Engineer - คนที่ Expert เฉพาะด้านมากๆ
- Data Scientist
- Citizen Data Scientist (Non-Pro Data Scientist) - คนอาจจะไม่เก่ง Technical และรู้จัก Business ดีพอสมควร
- ความสัมพันธ์ของแต่ละ Role
- สำหรับ Session นี้ เน้นไปทาง Citizen Data Scientist เราทำอย่างไร ให้ใช้งานได้สะดวกหละ ต้องใช้อะไรที่ง่าย และที่มี Pre-defined มาระดับนึง เพื่อลดเวลา และ Effort ที่ใช้ โดย Trend ตอนนี้ Service บน Cloud ซึ่งลดเวลาในการทำความเข้าใจ + train โดย Azure มีตัว Azure AI Platform มาช่วย
- ในมุมของ Citizen Data Scientist นอกจาก Azure (Auto ML / ML Designer) มีพวก Data Platform ต่างๆ อย่างกลุ่ม Power BI / Power platform มาใช้งานได้ด้วยครับ
10:30 AI Builder with Power Platform
- Sample Flow (คุม Flow ผ่านตัว Power Automate - สร้าง Ap p แบบ Low-Code)
- ถ้ามี Email มาเข้าที่ Outlook
- AI Builder ให้ AI มา Extract ข้อมูลจากใบเสร็จ / Invoice ได้ครับ
- และเอาข้อมูลที่ได้ไปใส่ Excel (ถ้ามี Excel ต่อยอดต่อให้อีก Node เปิด Power BI ทำ Data Visualize ได้เลย)
- มันดูง่ายเวอร์ กำหนด Area บอก AI ให้เรียนรู้ แล้ว Extract ได้
- ตอนทำ Workflow ใน Power Automate ดูผ่านๆ นึกว่า Azure Logic App จริงๆนะ (UI คล้ายกัน)
11:15 GitHub Actions for MLOps
- MLOps คือ อะไร
- Exploratory Data Analysis (EDA) - วิเคราะห์ข้อมูลเบื้องต้น เพื่อเอามาตั้งสมมติฐาน หรือ ทำความเข้าใจกับ data ก่อน
- Data Prep - เตรียมข้อมูล ทำ Feature Engineering
- Develop - Train & Test Model
- Re-Train - ปรับจูน Model
- Review - ผลที่ได้จาก Model
- Deploy - นำ Model + App ที่ครอบไปติดตั้ง
- Inference - ลองเอา Model ไปใช้จริง
- Monitor - ติดตามผล และเข้า Feedback Loop
- GitHub Action คือ อะไร
- Automate Tools ทำ CI/CD ในที่นี้อาจจะเป็นการ Build App เช่น ถ้าเรามีปรับจูน Code ของ Model ให้เข้าตาม Flow CI เพื่อ Build Model ออกมา และทดสอบ / Flow CD เอา Model ของเราไป Deploy / ตัวฟรีใช้ได้ 2,000 นาที ต่อเดือน
- มี API สามารถเขียน Code มาครอบอีกทีได้ หรือไปผูกกับ Azure Function App ให้มันทำงานแบบ Automate เป็นต้น
- Resource : ninefyi/global-ai-bootcamp-thailand-2022: Global AI Bootcamp Thailand 2022 (github.com)
13:00 Train a classification model with no-code AutoML in the Azure Machine Learning studio
- Session นี้ เหมือนส่วนขยายอธิบาย Session แรกสุด เพิ่มในส่วนของ Azure (Auto ML / ML Designer) เป็น Demo การทำ Auto ML กับ Data Set Bank Data โดยตัว Auto ML มันเป็นแนว Wizard
- กำหนด Data Set
- Prepare Data Set - เอาไว้กำหนด Field ที่สนใจ
- เลือกหมวดของ Algorithm -
- ตรงนี้ Auto ML มันจะเอาหลายๆ Algorithm มาทำงานพร้อมๆกัน โดยเรามาดูผลจาก Accuracy / Confusion Matrix เป็นต้น
- เลือกเครื่องที่ใช้ประมวลผล ถ้าใช้งานที่ข้อมูลเยอะๆ สามารถใช้ GPU ได้ แต่ราคาจะแพงกว่า
- กำหนด Validation Rule
- ตรวจผล - เลือก Model ไป Publish Inference Pipeline เพื่อสร้าง REST API ให้กับ App ของเราครับ
- Resource :
- เอาขายของมี สรุป AI-900 เผื่อไปอ่านต่อยอดกันครับ
13:30 Introduction to Azure Cognitive Services for Speech
- Session นี้ตรงอย่างนึง แบบที่น้องแมวบอกเลย ไม่ค่อยมีใครมาพูดกัน
- Azure Speech Service มีสิ่งที่ MS เตรียมให้ ดังนี้
- Speech-to-text - แปลงเสียงเป็นข้อความ
- Text-to-speech - แปลงข้อความเป็นเสียง เอาไว้ช่วยอ่าน ^__^
- Speech translation - แปลงภาษา
- Voice Assistance - Javis
- Speaker Recognition - บอกว่าใครเป็นคนพูด ข้อความนี้
14:15 Building the real-case business solution using big data and AI for geo-location problem
- Trend
- Traditional Data Collection and Processing - ระบบ OTLP / Database แบบดังเดิม
- BIG DATA collection and processing - มี Keyword ใหม่มาเพิ่ม Data Warehouse
- Business Intelligence - เอาข้อมูลจาก Data Warehouse มานำเสนอ (Visualize)
- Advance Analytic
- Machine Learning / Artificial Intelligence
- AI กับ Big Data มีความเกี่ยวข้องอย่างมีนัยยะสำคัญ เพราะ ว่า AI จะแม่นได้ ต้องมี Data ที่จัดเก็บมาอย่างดี ยกตัวอย่างเช่น ประเทศจีน ที่มีการเก็บข้อมูลมาก่อน รอจนเทคโนโลยีมันพร้อม แล้วค่อยมาทำระบบ AI พวกที่ทำ Social Credit เป็นต้น
- ภาพด้านบน DATA FLOW / Concept Diagram ส่วนตัวงงว่า Data Lake เอาไว้ทำอะไร ตอนแรกผมคิดว่าไม่ต่างกับ Data Warehouse เห็นภาพนี้แล้วชัดเจนดีครับ จากภาพด้านบนนี้ ถ้างานมันเร่ง เราสามารถใช้ Cloud เพื่อมาสร้าง IT Infrastructure ขึ้นมา
- DATA Expert Team
- Data Management - Data Engineering - ทำข้อมูลให้พร้อมใช้เป็นระบบ
- Data Analytic - Data Scientist / Data Analyst / Data Virtualize - ทำ Model สร้าง Dashboard
- Application - งาน Dev + QA ขึ้นกับตัว Requirement ด้วยว่าต้องมี App ที่ต้องเรียกใข้ AI เพื่อเอาผลลัพธ์ไปใช้งานต่อไหม
- Business - Business Analyst ให้ข้อมูล Business / Project Manager ดูแผนโครงการภาพรวม
- Analytic Level เพราะทุกงานไม่จำเป็นต้องใช้ ML มาแก้ปัญหาเสมอไป จัดปัญหา/Requirement เข้าหมวดก่อน แล้วเลือก Analytic Solution
- ML Algorithm
- DATA SCIENCE PROCESS CYCLE (การเลือก Location ปั๊ม)
- Business Understanding -
- เข้าใจธุรกิจ และสัมภาษณ์ user ที่เกี่ยวข้อง
- เรื่อง Location ปั๊มน้ำมัน ต้องรู้โจทย์ว่าสร้างแล้ว มีปัจจัยอะไรบ้าง สร้างแล้วมีรายได้เท่าไหร่ มีโอกาศกำไรไหม หรือมีผลกระทบอะไรกับสาขาเดิมที่อยู่ข้างเคียง (Cannibalization)
- Data Understanding
- จาก Business Understanding มาหา Feature ที่สนใจจริงๆ จาก Location ปั๊มน้ำมันอาจจะมี Feature แปลกๆ เช่น จำนวนเลน ระยะระหว่างแยก เกาะกลาง เป็นต้น ทำให้ได้ Data Flow (ภาพรวม) เพื่อเอาไปทำต่อใน Step ถัดไป
- Data Preparation
- วาง Data Pipeline Flow การเก็บข้อมูล
- จาก Feature ที่วางมา เวลามาทำระบบมันได้มาง่ายๆ หรือป่าว หรือ ต้องมา Process สักนิด เพื่อให้ได้ตัว Data ที่ตรงกับที่ User พูดจริงๆ
- Modeling & Evaluate - ต้องเข้าใจโจทย์ก่อน ว่าจะทำอะไร เช่น ทำ Recommendation โดยมีรูปแบบ Data แบบไหน มันทำให้เลือก Algorithm ได้
- ถ้าเป็น Model อะไรที่เป็นมาตรฐานจะใช้ Library ที่มีคนทำเตรียมไว้ให้ได้
- และมีปัญหาที่อาจจะต้องทำ Model ขึ้นมาเอง ตรงนี้ตัว Data Scientist ต้องมาสร้าง Model เอง มี Coding เข้ามาตรงนี้และ
- ผมชอบ Quote อันนี้มาก มันเหมือนเราต้องเรียนรู้ เพิ่มเติมไปตลอดชีวิต เพื่อให้ได้โอกาสใหม่ๆ
15:00 Let's see how LaLiga uses Azure AI to help fans analyze a game
- อยู่มาจะ 30 ปีและ คนเขียน Blog เพื่อรู้ว่า LaLiga มัน คือ ฟุตบอล 555 จากเดิมที่เข้าใจว่าวงการนี้ มันต้องเน้นกำลังกาย มีนักวิทย์การกีฬา มีกุนซือ เก่งๆ ตอนนี้มี AI มาด้วย เช่น
- วางแผน ช่วยกุนซือวาง Location ของนักเตะ หรือมาปรับกลยุทธ์
- Chat Bot - ช่วยเพิ่ม Engagement จากแฟนๆ
- Reference : Microsoft Customer Story-LaLiga boosts fan engagement with multiple digital channels and conversational AI
สำหรับ VDO ย้อนหลังดูใน FB Live ของทาง Page Spark Tech Thailand ครับ
สำหรับงานนี้เท่าที่ฟังมานะครับ ตอนเช้าจะเน้นภาพรวม และบ่ายเจาะบาง Service ของ Microsoft + Use Case ครับผม เขียน Blog นี้ไปเหมือนกับขายของให้ Microsoft // Sponsor เข้า Blog นี้ก็ดีนะ 555
Reference
- Global AI Bootcamp - Thailand | Eventpop อีเว้นท์ป็อป
- ขายของ สรุป AI-900 เผื่อไปอ่านต่อยอดกันครับ 555
Discover more from naiwaen@DebuggingSoft
Subscribe to get the latest posts sent to your email.