Welcome to Code Mania 1011 and TPA 2024
สำหรับ Session นี้เป็นการแนะนำสมาคมโปรแกรมเมอร์โดยคุณเซฟ นายกสมาคมคนปัจจุบันครับ โดยตัวงาน Code Mania จัดตั้งแต่ปี 2014 เลยนะ ปีนี้เป็นที่ 10 และ ของผมเอารู้จักงานนี้น่าจะตอน CodeMania11 มี Blog จดไว้ 555 ส่วน Blog อื่นๆ ดูจาก Tag CodeMania นะ
หน้าที่หลักของสมาคม: Contribute / Facilitator สำหรับการจัดงานต่างๆ / Goal อยากทำให้เป็นฐานของ Programmer ของ ASEAN โดยเน้น Local กระจายความรู้สู่ภูมิภาคต่างๆครับ และมาดู Stat การจัดงานของปีนี้กันครับ
งานของสมาคมจะเน้นไปด้านต่างๆ ตาม 4C ดังนี้
- Community - Local และให้เชิญ Open Source เข้ามาแนะนำในไทย / Diversity + Inclusion ทุกคน Code ได้ / Go Regional ปีหน้ามี FOSSASIA Submit ในปีหน้า Think Global Act Local เอางานใหญ่ๆมาในไทยนะ
- Connection - เชื่อมงานในหลายส่วน Partner / Community และ Tech Talent เข้ามาด้วยกันครับ งานด้านอื่นๆ เช่น มาร่วมด้วยนะ Data AI มีแกนเป็น Code และร่วมประชาสัมพันธ์กิจกรรมต่างๆ และงานด้วย
- Contribution - เน้นสร้าง Internal Evangelist สร้างการปรับ Culture เกิดการส่งต่อ KM ออกไป และตอนนี้มี Project TPA Roadmap นะครับ ใน GitHub เลย
- Communication - การสื่อสาร สร้าง Soft skill + Hard skill เพื่อให้เกิด Opportunity ใหม่ๆ ทั้งเกิด Value ในด้านต่างๆ
และมีเปิดให้สมัคร Member ด้วยนะ
ปลายปีมีงาน National Coding Day ถ้าใครจะฝึกงานมี TPA Internship Timeline ตามรูปเลย
Next generation Al for developers
by Teerasej Jiraphatchandej
คุณพลเน้นว่าจากงาน Tech ของฝั่ง Microsoft Build / Ignite จะมี Quote ที่สำคัญเกี่ยวกับ AI ดังนี้
Every App will be reinvited with AI - AI เข้ามาช่วยในการสร้าง App มากขึ้น
New App Will be built that weren’t possible before - ตัวอย่าง ChatGPT เมื่อก่อนเราไม่คิดว่าจะมีนะ จาก impossible ลดมานะ ทำได้ แต่ยากขึ้นนิดนึง
AI Transforming our developer life
4 Tech ของ Microsoft ที่ "AI Transforming our developer life" จะอยู่ในภาพ Copilot Stack โดยจะไล่ลงไป จาก 4-1 ดังนี้
4. “AI is transforming our work today” Git จาก Source Control อย่างตัว GitHub มีอะไรด้าน AI บ้าง
- GitHub Copilot มาช่วยเขียน Code
- นอกจากนี้มีตัว GitHub Workspace ที่เอา AI มาช่วย Workflow การพัฒนา SDLC ตั้งแต่ Issue (Requirement) / Plan / Specification / Code Suggestion ส่วน Dev มา Review + Refactor + Test / Merge เปิด PR นั้นแหละ มีสรุปให้ด้วยนะ แต่ค่ายอื่นๆ ไม่ต้องน้อยใจนะ GitLab เค้ามีเพิ่ม Feature AI เข้ามานะ
- ตอนนี้ ตัว GitHub Copilot มี Specific ขึ้นมาแล้ว อย่างตัว Azure
3. ”AI Models that transform what application we can build”
เมื่อก้่อนเลือก Lib ตอนนี้จะเป้น service ให้เลือกใช้ API ทั้งฟรี และไม่ฟรี ของขา MS เองจะมีตัว Azure AI รวมหลาย Model ให้เลือกใช้ ตอนนี้มีถึง GPT-4o ส่วนที่เหลือตามรูปเลย
นอกจากนี้แล้ว AI จะไปแนวๆ LLM ใช้ไหม ส่วนนึง แต่ตอนนี้เน้น Edge Process ทำที่ Local อย่างตัว SLM ของ MS จะมีตัว Phi-3 นะ
และ ถ้าอยากเริ่ม AI แบบง่ายๆ เราสามารถใช่้ Ollama เอา Model มาให้แบบ Docker Image เลย และมี API Server ให้ใช้ได้เลย ง่ายสุดๆ //ส่วนตัวเคยส่องท่าอื่นแล้ว Ollama สบายสุดแล้ว
ถ้าอยากเริ่มสร้าง App ขา MS มี Lib Sematic Kernal (C# / Python) + การใช้ Model จาก Ollama มาเสริมได้ครับ
2 ”Azure Service that support what you can build tomorrow” - Azure AI Studio งาน AI ให้ Flow การทำงานอยู่ที่เดียวเลย ตั้งแต่เลือก Model > Train > Evaluate > Deploy ได้ API ให้ App ไปใช้งานครับ
นอกจากนี้เราทำแบบ Low Code ก็ได้นะ โดยใช้ตัว Prompt Flow เพื่อมากำหนด Flow และปรับ AI ที่เหมาะสมกับ Use-Case ต่างๆได้ ถ้าอยากเขียน Code ตัว Prompt Flow ทำได้นะ รวมถึงลองกับ Local Model ก็ได้นะ
1 ”Responsible AI Innovation” - เอา แนวคิด Responsible AI มาในตัว Product AI เลย Azure AI Studio คุมครบ
และอนาคต AI จะมีขนาด Compute ใช้ขึ้นจากฉลาม / วาฟ (GPT-4o) และ วาฟที่ใช้ที่สุดในโลก ใหญ่มากกก
Blog ที่เกี่ยวข้อง สรุปงาน MS Build 2024 After Party-Thailand @SCBX NEXT TECH / สรุปงาน Global Azure 2024 – Thailand
Software engineering beyond the Al hype
by Phoomparin Mano
ช่วงนี้ AI อะไรก็ AI ช่วงนี้คุณภูมิ ลองดูความเห็นของโพสจาก The Secret Source "AI มันจะแทนที่คนได้ไหม" ก็ได้คำตอบที่หลายแบบ
แต่เราอยากให้ย้อนกลับมาดูก่อน ก่อนจะ AI จะบูมขึ้นมา 3-4 ปีก่อน เอ๊ะอะไรก็ blockchain มันอยู่ช่วงเห่อ / กาวเลย (Hype) แล้วตอนนี้แหละ มันก็เงียบไปนะ จะมีเรื่องเดียวที่ไม่เงียบ Digital Wallet ยังมีคำถามว่า เราควรใช้ blockchain ไหม ?
การเอาอะไรมา Adapt ใช้ สิ่งที่เราต้องรู้
- nature ของมัน
- แต่หลายคนเข้าใจผิด มองทุกอย่างเป็นตะปู เอาค้อนไปตี (Law of the Instrument)
- ปัญหา คือ เราไม่เข้าใจปัญหา ว่าอะไรเป็นปัญหาที่เราจะแก้ เลยได้ Solution แปลกไป ไปสักพักเกิดปัญหาตามมาอาจจะเข้าข่ายฟ้องร้องกันอีก - Theoretical Limits - ข้อจำกัดของ Technology นั้น อย่างเช่น Arrays มันเหมาะกับทุกเรื่องไหมนะ ?
Hype Cycle Gartner เป็น model ที่บอกกระแส เรื่องที่เราสนใจว่าอยู่จุดไหนแล้ว และมีส่วนรอด / ที่ไม่รอด ตรง What lie มันหลุดกระแสไปแล้ว หลายได้คำตอบแล้วว่าเหมาะ หรือไม่เหมาะกันนะ ซึ่งวันนี้บอกได้ระดับนึง Blockchain ไม่มีใครบอกว่าใช้ได้กับทุกอย่างแล้ว
กลับมาที่เรื่อง AI
อะไร คือ nature ของมัน / Theoretical Limits
AI คือ อะไร
- Probabilistic (ถามแล้วตอบตาม Prob)
- Optimization-based แต่ตั่งค่าไม่ดีก็เละนะ
- Learning & Generalization - ยิ่งเรียน มัน fit กับเรื่องนั้นๆ เก่งมากขึ้น อย่างตัว LLM มันมีการทำงานของมัน โดยอธิบาย
- ดูจาก Code
- Visualize - LLM Visualization (bbycroft.net)
พอมัน Hype มาก คนก็กาวกับมัน ทุกอย่างจัดการได้ด้วย AI ผมนึกถึงภาพนี้เลย
แต่คนไม่ได้คิดถึงผลที่ตามไง บางอย่างก็ร้ายแรงนะ เช่น
- Air Canada Case Chatbot มโม ตอบลูกค้ามั่ว ลูกค้าฟ้อง สุดท้ายสร้างความเสียหายให้บริษัท
- ด้านกฏหมาย ทนาย หาคดีให้เอาไปต่อสู่ในศาล นึกไม่ออกให้ AI Generate AI มันสร้างมโนเองเลย ทนายก็เชื่ออีก ปรากฏมันไม่มีจริงในโลก โดนยึดใบอนุญาตไป
- Coding on Copilot - พอมี AI มาช่วย Code เยอะ งานไว แต่ Quality ตกลง
ตอนนี้ LLM มาแรงเลย ทุกคนกาวสุด เขียนอย่างนี้และกัน จากภาพ มันเลยเป็นว่า
never use what you cannot verify
คนที่ใช้ AI หรือ อะไรก็ตาม คุณมี
- fundamental ต้องดี
- เข้าใจปัญหา รู้ว่ามัน คือ อะไร ตรวจยังไง
ตัว LLM จะช่วยได้เยอะ ปรับ Prompt เสริม Domain เพื่อให้คำตอบดีขึ้น แต่เราเอ๊ะนะ //ส่วนตัวผมโดน AI ตบหัวบ่อย 55
- Today Implementation - Nature ของมันที่มันทำได้ มีคนทำอยู่แล้ว
- ซู๊ดดดดดด - เอามันไปใช่กับทุกอย่าง แล้วถ้าเอ๊ะๆ ก็ดี จะกลับมาตรง Active Research
- Active Research - เราจะขยับไปได้ไหม อาจจะเป็นความรู้ใหม่ หรือ กาวอันถัดไป
- Know Theoretical Limits
Active Research
mechanistic interpretability - พยายามเข้าใจว่าในแต่ละ Neural ใน LLM มันคิดอะไร แล้วผลอะไรออกมา ในแต่ละ Step โดยงานวิจัยเด่นๆ
- Mechanistic Interpretability — Neel Nanda
- A Mathematical Framework for Transformer Circuits (transformer-circuits.pub) - พยายามแปลงเป็น math //ผมขอ bye แต่รูปสวย
- Google Penzai - ผ่าดูว่า Model คิดอะไร / Debug AI
LLM ยังไม่ให้เหตุผลได้ขนาดนั้น ถ้าถึงข้อจำกัดแล้ว เราจะไปต่อยังไง โดยคุณ yann lecun (คนที่ตบกับ elon ใน x นี้เอง ช่วงนั้นมันขึ้น trend) มีเสนอ paper A path towards autonomous machine intelligence
ตอนน่าจะตอบได้แล้วว่า AI มันจะมาแย่งงานเราไหม
ผมเองมีคำตอบและ
Software Engineering Next 10 Year ?
- Junior Engineers & Quality Problems?
- คนที่มาสายนี้เยอะ แต่ Quality / ต้องมา Training ให้ใช้ได้ - Automation Low Code / No Code
- มันจะแทนเราได้ระดับ เขียนโปรแกรมต่อ DB ได้ / Debug เป็นแล้ว หรือยัง จริงๆ ผมมองว่ากลับมาที่ fundamental การเข้าใจปัญหา
สรุป หลายอย่าง AI มันทำไม่ได้นะ
- Fundamental ยังสำคัญนะ ทุกอย่างเปลี่ยนไป แค่เปลือกนอก แต่แนวคิด หรือ Core ของสิ่งที่สนใจ ยังเหมือนเดิม ถ้าเป็นหนังจีนอารมณ์กระบี่อยู่ที่ใจ
ตรงนี้คุณภูมิ ยกตัวอย่างภาษา Bend (A parallel language) ซึ่งมาจากแนวคิด papar ใน 20 ปี ++ ที่มีคนวางแนวคิดไว้
- AI ยังแทนไม่ได้ ถ้าหยุดทุกอย่างจากนี้ก็จะหยุด AI ตัว LLM ก็หยุดเหมือนกันนะ
- curiosity & learning
- problem-solving
- data structures & algorithms
- architecture & design
- domain modeling
- communication
สำหรับผมเอง Session นี้เป็น Session ที่ทำให้ผมตัดสินใจกดบัตรงานนี้นครับ ถึงว่าคุ้มค่ามากๆกัยบการฟัง Talk นี้ 30 นาทีครับ น่าจะสักชัวโมง ยังเหลือ Slide ตาม Follow ได้ต่ออีกนะ
Resource: Software Engineering Beyond the AI Hype (Slide)
Update Clip เต็ม Speaker มีอัดเสริมขยายความเป็น 1.30 ชั่วโมงครับ Software Engineering beyond the AI hype - YouTube
TiDB in the era of GenAl
by Wink Yao PingCAP
TiDB คือ อะไร
TiDB เป็น DB ที่ใช้ MySQL Driver และ Scale ได้ดีกว่าเป็น Distribute Database รองรับ Load เยอะได้นะ ใช้ SQL เข้ามา ใช้ได้นะ สำหรับ Architecture ลองจาก Blog สรุปงาน สรุป DevClub#2: Databases (Session 3 -Large Scale with TiDB)
ตอนนี้ TiDB มีตัว Vector Search เพิ่มเข้ามา โดยให้เราสามารถใช้ SQL จัดการได้เหมือนเดิม ตัว Vector เป็น Native Type ข้างในนั้น ตอนนี้มี Serverless ให้ลองด้วยนะ
The journey of AI Application
เรามาทำ AI App กัน โดยเอา LLM มาช่วยแปลง Text ที่เราถามๆ ออกมาเป็น SQL เพื่อดึงข้อมูล GitHub Event ที่เก็บไว้แล้วใน TiDB
- Prompt Engineering
- Prompt Engineering แนวคิดแรกเอามาใช้กับ App Text2SQL โดยเราต้องเขียนคำสั่ง Prompt ให้ดี เพื่อให้ LLM มันให้คำตอบที่แม่นยำขึ้น แต่ Accuray ยังไม่ได้ดีพอ เกิด Bottlenecks
- ปัจจัยที่มีผลกับ Accuray
- Model Parameter
- Few-Shot เป็นเทคนิคการสอน LLM จากตัวอย่าง - อะไร เกิด Bottlenecks
- Token Limitation เพราะแต่ละ Model รับได้มากน้อยต่างกัน ตัว Limit นี้ จะทำให้เราส่ง prompt ได้ไม่ครบ มันจะขาดช่วง ถ้าถามตอบเยอะ
- Hallucinations หลอน มันมโนคำตอบออกมาเอง
- Next Step RAG (Baseline RAG)
- เราต้องแปลงข้อมูลทุกอย่าง Text / รูป / VDO มาเป็น Vector ก่อน แล้วมาใช้ Distance Function เหมือนหาความคล้ายกัน
- จากนั้นเอาแนวคิด RAG สมองเดิม แต่ใช้ข้อมูลตัวเอง เพิ่ม Accuray จาก 51.48% > 75.46% ตอนนี้จะแก้เรื่อง Hallucinations
- จากการเอา RAG มาใช้ ทาง TiDB มีทำอีก App TiDB Q&A Bot
- แต่ RAG มีข้อจำกัดเหมือนกันนะ ผมมันจะแย่ลง ถ้าข้อมูลใหญ่ขึ้น และต้องมีความสัมพันธ์ด้วย ของไทยตัวอย่างง่ายๆ พวกชื่อเดียวกัน แต่ความหมายมันคนละอย่าง แวร์ซายส์ เป็นไปได้ทั้งวัง และสัญญาสันติภาพ ใน Session Speaker ชื่อเมืองของรัสเซียนะ
- Graph Knowledge RAG
- เอา LLM มาช่วยสร้าง Graph Knowledge และยังมี RAG เหมือนเดิมนะ
- ผลที่ได้เปรียบเทียบ
แล้ว Database สำหรับ AI ต้องมีอะไรบ้าง ?
- Store ข้อมูลจำนวนมาก และเป็น Original ด้วย ข้อมูลมันหลายแบบ SQL / NoSQL / Vector อีก
- ทำ Vector / Sematic Search ได้ และสามารถจัดความสัมพันธ์เป็น Graph ได้ เหมือนจะมี AI Integration กับ LangChain / llama ai
TiDB เค้ามี Solution ให้นี้เอง รวมความซับซ้อนด้าน Data / Database ไว้ที่ DB เลย
ความเห็นส่วนตัว เราโดน Vendor Lock แล้วนะ แต่ต้องเลือกตามทรัพยกรทีมี เงิน คน บราๆ เคสนี้มันคอดขวดที่ DB ต้องไป Scale ที่ TiDB
Data in the age of Al
by Kittipong Ruksa
Session นี้ ทำ AI ต้องวางแผนที่ดี AI ที่ดี มาจาก Data + Technology ที่มาช่วยเกิดนวัตกรรมใหม่ๆ
Densu - Generative AI Research 2024
- คนยัง Curious / Skeptical กลุ่มที่สงสัยที่สุด Gen Z นี่แหละ กับ Generative AI
- คนยังใช้ AI ในมุมผู้ช่วยนะ ยังไม่วางใจให้ทำ 100% นะ
- ตอนนี้ AI Assist อนาคต AI Driven
AI Driven มันอีกยาวไกลนะ การทำแบบนั้นได้ ต้องมี Data ที่มี มี Quality ที่ดี โดยสรุปได้ตามรูป ดังนี้ เพื่อให้ได้ Customer Experience ที่ดี โดย Flow มันจะเป็น Continuous Improve สังเกตุว่าวงตรงกลางเป็น Cycle
แต่การใช้ AI ต้องระวังนะ Idea ลูกค้า / Data ลูกค้า AI ต้องไม่แชร์ ลูกค้าเจ้าอื่นๆนะ ทาง Densu มีตัว Generative AI Guideline
Data Strategy
ทำเพื่อใคร เอาไปใช้อะไร ได้ Value ยังไง
data ที่มีทำอะไรได้ ทำอะไรไม่ได้
Robust Enterprise Data Management
- Evaluate - ต้องการ Business Value อะไร
- Design - As of >> to Be ว่ามีลักษณะแบบไหน
- Understand you data
- Owned - ดูว่า Data ใครต้องจัดการตาม business
- Measured - วัดอะไร ตาม Busines Value
- Controlled - คุมตาม Security / Governance พวก PDPA
- Used - เอามาใช้ สกัดให้เกิดประโยชน์สูงสุด ลด Cost
- Enhanced - ขยายผลต่อ
การจัดรู่ว่าเราอยู่ระดับมี Data & AI Strategy House บอกว่าเรามี Capability ในด้านไง
มี Check List Guideline ด้วยนะ
Governance
- Data Quality Framework - ทำให้เรารู้และ ว่า Data อยู่ที่ไหน ใครเป็น Owner และต้องทำอย่างไร อยู่ใน Domain ไหน เช่น Customer / Finance จะมี process จัดการที่ต่างกันนะ ต้อง Approval ยังไง
- โดยมี Check List ย่อยๆ ในทำ Data Quality Management Resolution
- ภาพ Final นะ
CX Technology Stack ตอนแรกงงมาตั้งนั้น CX = Customer eXperience
แล้ว AI อยู่ที่ไหน
- Embeded
- Own Model
- LKM
Challenge เหมือนพวก Digital Transformation People / Process / Tech พยายามให้ได้ feedback ที่ไว้ โดย key การ Share จุดลงตัวของ Tech + Biz การสื่อสารที่ดี + fast feedback (Agile)
Use-Case: Mugen AI มาช่วยลด Cost วัดจาก CPA ลดลง และ Conversion Rate สูงขึ้น
Keyword B2C > B2C (Now) > M2C > M2M
Data Exchange Value Index ดูภาพแล้ว น่าจะ Apply ได้ทุกเรื่องเลย แต่อย่าลืมว่าเราเข้าใจ และลองทำกับมันแล้ว หรือยัง
Building applications with generative Al
by Prame BorntoDev
รอบตัวเราตอนนี้มี AI ช่วยงานแล้ว มี AI หลายค่ายมาช่วย และยัง Integrate เข้าไปใน App ของเราเลย เช่น Office / Meeting Summary อันนี้สำหรับ End User นะ
Dev เองมี GitHub Copilot / JetBrains AI Assistant มาช่วยนะ เอามาช่วยได้หลายอย่างเลย เช่น Code / Gen Test Case / Refactor ทำได้ รวมถึงถามมัน จาก Code ตรงนี้ อาจจะ Smell เกิดขึ้นตรงไหนบ้างนะ
ทั้งหมดมัน Base On generative Al ซึ่งไม่จำเป็นต้องบริษัทใหญ่นะ มี Idea ทำได้ โดยคุณเปรมแนนะช่อง Starter Story
- Castmagic เปลี่ยน chat / meeting / podcase ออกมาเป็น Content นอกจากนี้ APP นี้ยังทำอะไรที่ Simple ทำ Transcript จาก VDO / เสียง
- Formula Bot - แปลง Text ที่เราคุยๆกัน ให้เป็น Specific ขึ้น เช่น สูตร Excel / SQL / RegEx / App Script แต่ว่ามันเสียเวลา //เจ้าใหญ่ตัวนี้เริ่มีเข้ามาเล่นแล้วนะ ที่เหลือขึ้นกับความสามารถ + ราคา
- Afforai - AI มาช่วยจัดการ paper ให้ง่ายขึ้น เช่น แนะนำศัพท์ หา Cited หรือ paper ที่เกี่ยวข้อง และให้ AI มา Review Format เนื่อหาของ Paper ที่เราเขียน ย้ำว่าไม่ได้ให้มันเขียนให้นะ
- FlutterFlow - ให้ AI ช่วยสร้าง App อยากได้อะไร Chat ถามมันเลย ให้มันลอง ออกแบบให้ และมี Code มาให้เราให้งานต่อ ทำ Test รวมถึงการ Deploy
Born2Dev AI Use-Case
Solution: ทำ ChatBot ตามบริบทในเนื่อเรื่องของ VDO นั้นๆ มาตอบ หรือ เป็นคำถามที่อาจจะนอกเหรือบทเรียนที่ทำไว้นะ (Alternative Flow)
และคำตอบที่ AI ตอบ ยังมีคนมาตรวจสอบนะว่า AI ทำถูกต้องนะ (Active Learning) จะได้ให้ตัว Generative AI เรียนรู้เพิ่มนะ
แล้วถ้าเราอยากทำเองหละ พวก AI Chatbot? โดยสิ่งที่ต้องสนใจ
- เราเข้าใจปัญหา Pain ของ User แล้ว หรือยังนะ ?
- และก็แรงจูงใจ ที่ user ต้องมาลง App เราเพิ่มด้วยนะ
ในไทยเรา App Chat ที่นิยม line นี่แหละ user ใช้เยอะนะ แล้วตัว Line เอง มี Line OA อยู่แล้ว ต่อกับ ChatGPT / Gemini ได้นะ มี Course ฟรี ด้วยนะ ต้องตามไปเรียนและ //เห็นที่บริษัทกลัว Line Notify กัน เผื่อ AI มาช่วยได้
Streamlining Data Extraction with Generative Al
by Sittisak Chumpreecha - Krungsri Nimble
เราปฏิเสธลูกค้ายากนะ อยากให้เข้าใช้ API แต่ลูกค้ามี กระดาษ / pdf อันนี้เอา AI มาช่วย ปฏิเสธไปอาจะเสียโอกาศทางธุรกิจได้ครับ
Why Data Extraction in Importance
- Streamlined Workflow - เดิม ใช้คน แต่ก็ Scale ยาก / ใหม่ เอา AI มาช่วย ทำได้ทันทีไม่ต้องรอคนกรอก
- Efficiency+ Productivity - ความถูกต้องข้อมูลมูล ทัน Time To Market ขึ้นด้วย
- Inform Decision Making - ข้อมูลมาไว และถูกต้อง ตัดสินใจได้ทันที
- Cost Saving - ได้หลายมุมนะ จาก Insight Data ที่ได้ หรือตัวงาน Automation มากขึ้น
AI In Data Extraction
- Azure Document Intelligent (Form Recognizer เดิม) ให้มันเรียนรู้ Template / Pattern แล้ว Extract Data ออกมา
- Generative AI - โยนเอกสารเข้าไปเลย ให้มัน Extract ออกมา โดยมี Challenge เหมือนกันเอง ถ้าเอกสารมันซับว้อน รวมถึง Data Security ด้วยนะ
AI Solution ของ Nimble
- Data Accuracy - ทำให้ถูกต้องแม่นยำ
- Security ตาม pdpa / Data อยู่ถูกที
- Transaction Cost ต้องน้อย
โดยมี Workflow ดังนี้
- Input - เอกสารเขียนมือ / pdf / pdf scan / json
- Preprocessing
- ทำ Classification ก่อน เช่น เอกสารเขียนมือ / pdf / pdf scan เป็นต้น จะได้ใช้ model ให้ถูก และคุม Cost ด้วย
- Text Extraction
- รวมถึงการ Verify เอกสาร เป็นเอกสารที่ถูกต้องใช่ไหม จัดชั้นเอกสารตาม metadata - Data Cleaning ก่อนส่งให้ Generative AI จัดการ เช่น ไม่มีแถวเกิน
- Gen AI
- เลือกวิธีการ - Chat / File Search
- เลือก Model ที่เหมาะกับ Data นั้นๆ เช่น มี Data Table เอา Model ที่เหมากับมัน หรือ ลายมือ เอา OCI มาช่วย
- Prompt Preparation เตรียม prompt ตามรูปแบบเอกสาร ทำเป็น Config - Processing - พวก Gen AI มันมี Limit คือ Token ซึ่ง Model แต่ละแบบมีข้อขำกัดต่างกัน รวมถึงเรื่อง Cost ด้วย และรูปแบบ output format ด้วยเอกสารหลายที ต้องทำ json ในแบบเดียวกันนะ มุมซ้ายล่างของรูป
- Transformation & Verification
- Transformation แปลง JSON มาเป็น Object เพื่อให้ได้รู้ว่า Data มันผิดไหม
- Verification ระบบตรวจสอบ จากนั้นให้คน Review และสุดท้ายมี Editor ให้ปรับแก้ไข เพื่อให้ได้ Output ตามที่ปลายทางอยากได้ Json / excel เป็นต้น
สุดท้าย เข้าใจก่อนใช้ AI นะ มันมี model ใหม่มาๆมาย แต่การใช้เราควรรู้ว่ามันเหมาะกับอะไร และเข้าใจมันด้วย
The Secret Weapon To Transform Your Business
by Thaweesap Rawan - Bitkub
ยุคของ AI
- ตอน 1950 มันเริ่มจาก if-else เล็ก โดยคุณ Alan Turing และมีเสนอ Turing Test (ถ้าแยกไม่ได้ว่าเครื่องมือตอบ) กับคุณ John McCarthy's ให้แนวคิดของ Machine Learning / AI นะ
Tools ยุคนั้นก็มีนะ ชื่อ ELIZA สำหรับช่วยบำบัดจิตใจของผู้ป่วย - AI Winter - AI มัน Hype แต่ไม่เป็นไปตามคาดหวัง เงินทุน การวิจัยน้อยลงไป
- Expert System
- 2nd AI winter - จุดนึงที่ AI ถึงข้อจำกัด อย่าง HW เรียกว่า
- 1997 IBM Deep Blue
- 2000 ML + Big Data
- 2010 Deep Learning
- 2016 AlphaGo
- 2020 Generation AI Chat GPT
อะไรที่ทำให้ AI มันเกิดอีกรอบในยุคนี้
- Data
- HW - CPU/GPU/TPU Processing ตอนนนี้ NVIDIA Blackwell //ถ้ามองยุค AI Winter HW มีส่วนนะ
- Algorithm - neural network แล้วขยายใหญ่มาเรื่อยๆ จุดสำคัญ adaptive function ทำหน้าที่เหมือน if ในยุคแรก แต่มันเยอะมาก
AI From World Economic Forum
มีอะไรบ้าง
- ต้นทุนส่วนแรก = เงินลงทุนที่ให้คน มา Download APP หรือ เป็นเทคโนโลยีที่เกิดสำเร็จแล้ว AI ที่ทำสำเร็จ
- ต้นทุนส่วนเพิ่ม = คนทีสอง สาม สี่ ที่มาต่อใช้ระบบ
การนำไปใช้มี 2 มุม
- Augmentation ช่วยเรา เช่น ChatBot มาช่วย Support ตอบ แล้วพอคนมีเวลามากขึ้น Rotate ไปทำงานอื่นด้วย เช่น การขาย
- Automation แทนที่เรา เช่น ตัว Figma
ทางคุณ Satya CEO ของ Microsoft มีบอกไว้ในงานว่า ต่อไปบริษัททีมีคน 50 + AI จะมี productivity พอกับบริษัทที่มีคน 500 คน
AI Infra
- Infrastructure Layer
- Model Layer
- Application Layer / Agent Layer
ถ้าเรามี Idea เจ๋งๆ เอามาทำ App ได้ เกิด Unicorn ใหม่ uber
เอา AI มาใช้มี pain point อะไรบ้าง
- Individual - ตาม Tech / AI ไม่ทัน , ไม่มีเวลาเรียน, ทำได้ แต่ใช้หลายเครื่องมือ มันมีผลเรื่อง Cost ด้วย
- Organization - Data Security / Accessibility / เอาไป Integrate กับระบบเดิมยังไง ? / ประเด็นด้านจริยธรรมด้วย
ปัญหาของ Organization ทาง Bitkub เลยตั้งทีม AI เพื่อศึกษา และทำความเข้าใจ แก้ Pain Point ที่เจอ คุม Data Flow / Security / ตามเทรนให้ทัน โดย Roadmap ดังนี้
- ตอนแรกเน้นทำใช้ภายในองค์กรก่อน โดยมี Platform กลางมาให้พนักงานใช้เลย
- Q&A จากข้อมูลในองค์กร ทำ RAG
- Knowledge Sharing
- Writer - CS Template / Blog Template / Email
- Data Governance ควรอยู่ในระดับทีม หรือ Level ผู้บริหาร คุม Data Flow ไม่ให้หลุดออกไป pdpa / gdpr - ถัดมาลองทำเป็น Enterprise Grade ขายกับภายนอก
Block Chain meets AI
ทำหลายอย่างเลย
- ทำ Digital footprint เพื่อบอกว่า AI นั้นต้องไปสร้างเสียงไปละเมิดสิทธิ์ หรือ ตกลง Share รายได้
- Supplier Chain
- Health Care
สุดท้าย AI มันสำเร็จใจตัวมันเองแล้วนะ ผู้นำองค์กรควรศึกษาเข้าใจ และเอามาปรับใช้ในแง่ Augmentation / Automation จะได้ปรับองค์กรได้ และต้องลงมาดูเองด้วย สั่งอย่างเดียวไม่ได้แล้วนะ
Panel: Building and using Al models responsibly
by: Dr. Tiranee Achalakul - BDI, Kobkrit Viriyayudhakorn - AIEAT/OpenThaiGPT Athisa Laungvarunyoo (Moderator)
1) Data Eng / Data Analyst / Developer ใช้ประโยชน์จาก AI ได้อย่างไร ?
Dr. Kobkrit
- AI มาช่วยพวกกลุ่ม GPT ที่มาช่วยให้เราเข้าใจ Code มากขึ้น อย่างเช่น พวก Copilot ที่เราถามได้
- โดยตอนนี้สมัยก่อน เราจำ Function / Syntax ได้แค่ไหน ตอนนี้ Shift ขึ้นมา เราเข้าใจ Business มากขึ้น
- และปรับมุมมอง จากผู้สร้าง มาเป็นผู้ตรวจสอบ และต้องมี Fundamental ด้วยนะ
- AI ช่วยทำให้เราเห็น Coverage เพิ่มขึ้น
Dr. Tiranee
- AI เอามาใช้ในการ Search เดิม เช่น ใช้ Google / Stack overflow ตอนนี้น้องวในทีมในมุม prompt ถามปัญหาด้านความรู้ / หรือ วาง Scope TOR แต่ยังใช้ตัวถาม Code น้อย เพราะบางทีเอามาแล้ว ต้องปรับแก้เยอะอยู่
2) มุมผู้สร้าง/ user ตัว AI เราควร Aware อะไรบ้าง ?
Dr. Tiranee
- ต้องระวังการเลือกข้อมูลที่ไปเทรน อาทิ เช่น ให้มันช่วยตอบกฏหมายไทย มันไม่ควรไปหากฏหมายที่อื่นๆมาตอบ หรือ ไปคิดเอง
- และต้องระวัง Bias ของ Data ด้วยนะ เดิมใช้คน ต้องเพิ่มหลายๆคนมา แล้วเอามา Average
- ที่มาของ Data ตัวลูกค้าในที่นี้ เป็นหน่วยงานรัฐต้องเตรียมข้อมูลให้เรียบร้อย ก่อนทำ Label ก่อนใช้งาน
Dr. Kobkrit
- อยากให้ AI หา Reference ข้อมูล และเราตรวจสอบด้วยนะ มาจากไหน
- AI GPT ที่เอามาทำ RAG จะช่วยงานนอกจาก Simple Query ที่ไม่เก่ง
- ทำข้อมูลกลางขององค์กรก่อน และถึงมาทำ RAG จะช่วยให้ AI เก่งขึ้นนอกจากตัว Simple Query
3) AI มีผลกับอาชีพสายเทคยังไง มันทดแทนได้ไหม จะครองโลกไหม ?
Dr. Kobkrit
- AI มันไม่ใช่มนุษย์นั้น ยังมีหลายอย่างที่ขาด เช่น สติ จุดมุ่งหมาย ยังอีกยาวไทย ให้มองในมุมของ Powerful Tools ที่ช่วยให้เรา เราขึ้นไว่่ขึ้น แต่ที่ควรระวัง คนเรากันเองนี้แหละที่ใช้ไปในทางที่ผิด
- ตัว AI.
- Centralize AI - อ้นนี้มีความเสี่ยงอยู่นะ มันจะไปอยู่ในคนกลุ่มเล็กๆ
- Decentralize AI - ทำให้โลกเราพัฒนาได้เร็วขึ้น ทุกคนมีเครื่องมืที่ก้าวไว้ขึ้น - ในมุมของการทำงานมีการลองวัดแล้วจะเร็วขึ้นประมาณ 2-3 เท่านะ ดังนั้น
- คนที่ขาด Skill ด้านนี้จะลำบากมาก ควรมาศึกษา และใช้ประโยชน์จาก AI ให้สูงสุด
- พอมี AI หลายคนปรับ Expectation ด้วยนะ มองในมุมลูกค้า นอกจากความสามารถแล้ว ในมุมนี้คาดหวังด้วยว่า AI ทำให้งานไว้ขึ้นนะ ดีขึ้น
Dr. Tiranee
- ตอนนี้คนยังไม่พอให้ใช้งานนะ AI มาช่วยงานให้ไวขึ้น และช่วงนี้คนเกิดน้อยลงนะ แต่งานเท่าเดิม ถ้าไม่เอา AI มาใช่ มุมเล็กๆ ทำงานไม่ทัน จนระดับประเทศตามไม่ทันนะ
- พยายามปรับตัวให้ทัน
4) เราควรมีทักษะอะไรที่ทำให้ใช้ AI เกิดประโยชน์สูงสุด ?
Dr. Kobkrit
- Tech Skill + Prompt Skill แม้ว่าใช้ AI แบบเดียวกันนะ แต่ถ้าทำ Prompt Engineering ไม่ดี ผลลัพธ์ที่ได้ อาจจะช้าลงกว่าเดิมได้
- พวก AI Code Gen บางที Code Compile ไม่ผ่านนะ
Dr. Tiranee
- ตรวจให้เก่ง และมี fundamental ทีา่ดีด้วย อยู่ AI Gen SQL แล้วมี Delete SQL ขึ้นมา เราต้องเอ๊ะๆ แล้วนะ มันวางยาเราไหม
- AI ไม่ได้แทนเราหมดนะ เราต้องมาปรับ DataSet ให้เหมาะกับแต่ละเรื่อง และคำถามในการตรวจสอบมัน รวมถึงการ improve คำตอบด้วยนะ
5) ให้ คุณ Kobkrit แนะนำ OpenThaiGPT
OpenThaiGPT เป็น LLM เน้นภาษาไทยโดยมีขนาด 7, 13 และ 70 พันล้านพารามิเตอร์พัฒนาต่อ LLaMA v2 ของทาง Facebook โดยข้อมูลที่ได้รับความร่วมมือจากหลายฝ่าย อาทิ
- Pantip ได้ให้ Data ที่ดีระดับนึง มีการ Label Tag
- ใช้ Super Computer Nectec เข้ามา Train ไม่รู้่ว่าเครื่องเดียวกับที่ 9arm เล่าไหม
นอกจาก OpenThaiGPT ยังมี LLM ภาษาไทยอีก 2 ตัว Typhoon (SCBX) / THaLLE (KBTG)
ความท้าทาย
- หลายๆ Model ตอนนี้ยังไม่ได้ Open จริงๆ บางตัวเปิดใช้ แต่ไม่ได้ให้เรามาแก้ต่อ บางตัวเปิดให้ปรับต่อได้ อย่าง LLaMA มีให้ Parameter / Weight เลย
- ภาษาไทย ตอนนี้คนใช้อันดับ 35 ของโลกนะ อาจจะไม่ใหญ่พอจนค่ายใหญ่ๆจะมาทำ Model เฉพาะทาง
- Demand การใช้ LLM ตอนนี้ไม่ได้เน้นตอบคำถามทั่วไปนะ โดยคุณ Kobkrit ไปงานที่จีนมา บริษัท fivetech (ไม่แน่ใจว่าเขียนถูกไหมนะ) มี release model
- General Model
- Domain Specific เช่น โมเดลสำหรับการศึกษา ตอบแบบฝึกวิธีคิด ไม่ได้ให้คำตอบเลย เดวเด็กรุ่นใหม่ๆจะไม่มี Skill เป็น Coaching LLM - OpenThaiGPT จะมี Finetune Model ในมุม Domain Specific
ตอนนี้มีน้อง ทนอย | LINE Official Account ปรึกษากฏหมายผ่าน Line ใช้เทคนิต Reinforcement Learning from Human Feedback (RLHF) แบบ Direct Preference Optimization (DPO) //น่าจะถูกนะ
ถ้าเราเรียนรู้ และตาม Tech ทัน จะได้ปรับตัวตามได้เร็ว อย่างตัว OpenThaiGPT พอเรามี Base จาก Llama1 และ พอออกไป 2 ปรับตาม Pipeline ในการ Fine Tune ให้ทัน
นอกจากนี้ SLM ยังเป็นอีกเทรนที่ช่วย Data Privacy ด้วยนะ และเหมาะกับ Device เล็ก ลด Cost / ลด Response Time
6) นอกจากมุม OpenThaiGPT + Domain Specific มีอะไรเสริมไหม
Dr. Tiranee
- นอกจาก LLM ยังมี SLM ด้วยนะ ให้ทำงานที่ Local ด้วย
- Domain Specific เช่น กฏหมาย อาจจะให้ประชาขนทั่วไปลองมาถามก่อน เรื่องนี้มันฟ้องได้ไหม มีเคสที่ใกล้เคียงไหมด้วย
- ปัญหานึง การศึกษา บางทีเด็กไปถาม ChatGPT มาตอบ ทำให้ยากกับการให้คะแนน ทางผู้ใหญ่ ควรปรับลองใช้ Tools ด้วย และปรับการบ้าน ให้ตัว AI เสริมการเรียนยรู้ได้ด้วยนะ
- Digital Soverity อาจะต้องระวังด้วยนะ ให้รัฐมาลงทุน infra กลาง ให้แต่ละหน่วยงานองค์กรมาใช้งานได้ ไม่งั้น เราจะ platform specific
7) โอกาศความท้าทาย Big Data ยุค AI
Dr. Tiranee
- Quality of Data เป็นสิ่งสำคัญ การ Label Data และความเป็น Silo ของภาครัฐ ทำให้การขอ Data มา Cross ยาก
- การสร้างความตระหนักรู้ของข้อมูล PDPA มา Block Big Data จากความเข้าใจที่ไม่ Clear พอ Data ไม่มี AI จะยาก
- Data Awareness ด้วย ที่ต้องฝึก
8) BDI มีคำแนะนำด้าน Responsible AI ยังไง
Dr. Tiranee
- BDI ยังไม่ได้เป็นตัว regulator ตรงๆนะ แต่ทาง etda+ ผู้เชี่ยวชาญจากมหาวิทยาลัยต่างๆ ได้มีร่าง Guideline + Risk Assessment การใช้ AI
สวทช: มีเอกสาร แนวปฏิบัติจริยธรรมด้านปัญญาประดิษฐ์ จัดทำโดย คณะกรรมการจริยธรรมปัญญาประดิษฐ์
- ถ้ามี Guideline + Risk Assessment จะได้ช่วยให้คนที่ทำ Product มาตรวจสอบตรงนี้ได้่
- ภาครัฐมีกรรมาธิการด้าน AI มาด้วยนะช่วยกันร่างเรื่องนี้ Dr. Tiranee / คุณ Kobkrit มีอยู่ในนี้นะ
9) ลองให้ คุณ Kobkrit ยกตัวอย่าง Responsible AI ในไทย
- จริงตอนนี้มีกฏหมายไทยในปัจจุบัน Cover AI หลายส่วน เช่น ปลอมเสียง / Deepfake อันนี้จะเข้าข่าย พรบ คอม / ตามกฏหมาย PDPA มีนะ
- ความปลูกผังแนวคิดการใช้ AI ที่ดีก่อน
- การออกกฏหมายเฉพาะด้าน AI ควรมีจุดที่ลงตัวนะ ถ้าบีบมากไป จะทำให้ Startup เกิดลำบากในไทย
10) AI อนาคตมีผลอะไรกับเรา บ้างใน เศรษฐกิจ และสังคม
Dr. Kobkrit
- เพิ่มการสร้างความตระหนักรู้ให้ทุกคน ไม่ใช่สาย IT นะ และปรับตัวใช้งานกับมัน
Dr. Tiranee
- AI เป็น platform ใหม่ ที่มาเป็น Big Change แบบยุค Smart Phone ตอนนี้ Generative AI แบบนั้น ทุก Industry จะถูก Disrupt นะ ตอนนี้ที่จีน Printer ตอน scan มันตรวจข้อมูลเลยนะ ปรินถูกผิด แนะนำคำตอบวัน Strengh / Weak
- หามุม Domain ที่เราจะได้โยช์น์จาก Generative AI ให้ทัน สร้าง Value ก่อนกระแสมันจะลดลง
Q&A
1. เราจะป้องกัน Content ที่ผิด แล้วทำให้ AI หลอน ?
- Dr. Kobkrit: ต้องมี Domain Expert มาช่วยนะ แต่ตัว AI หลายตัวมีการ Track ไปถึงแหล่งข้อมูล แล้วบอกได้ว่าถูกผิดนะ
- Dr. Tiranee ตอนที่เราให้ Train AI ตอนนี้ตรวจสอบ Source ให้มันบอกเลยว่ามาจาก URL ไหน ถ้าเข้าไม่ได้ อาจจะต้องลดความน่าเชื่อผิด และก็มนุษย์ยังอยู่นะ เอามาตรวจสอบ
2. แล้วถ้าเราเป็น Developer หละ เราจะตรวจสอบคำตอบ Domain อื่นยังไง เช่น การแพทย์ บัญชี อะไรอย่างงี้
- Dr. Kobkrit: เพิ่มการ Peer Review ตรวจ + หา Second Opinion
3. AI ใน printer ที่ตรวจสอบสอบมีข้อผิดพลาดอะไรบ้างนะ
- Dr. Kobkrit: ยังมีครูตรวจสอบอยู่นะ เพราะการตรวจ มันง่ายกว่านะ และถึงว่าเป็นกลยุทธ์ที่ดีในการพัฒนาคนด้วยนะ
4. AI ถ้าถูกมิจฉาชีพไปใช้ ทำ Call Center Deepfake / Voice fake เรามีแนวทางการป้องกันยังไง ?
- Dr. Kobkrit: ตอนนี้หลาย บ ที่ทำ Model มีทำตัวตรวจสอบแล้วนะ ว่าที่ได้ fake มาไหม แต่ที่สำคัญสร้างความตระหนักรู้ หลายที่อยากให้ออกกฏหมายให้ AI ออก Signature ด้วยว่ามาจาก Model ที่ Sign แล้ว แต่ในแง่ปฏิบัติยังยาก Open Source เต็มไปหมด
- Dr. Tiranee สร้างความตระหนักรู้ก่อน แต่ตอนนี้ภาครัฐมีหน่วยงานเฉพาะกิจเรื่องนี้ Integrate ระหว่าง Bank แล้ว
แนะนำ Community ต่างๆ
- pyconthailand นะ ปีหน้าน่าจะมีงาน อาจจะเชิญคนดังจาก ตปท มาอีกนะ เช่น ทำ Core Python มาพูด
- Creators Garten - จัดหลาย Event เลยนะ หลัก BKK.js รอบหน้า 31-Aug-2024 / JavaScript Bangkok 2.0.0
- fossasia - 13-15 mar 2025 จัดที่ไทยนะ คนดังๆที่มาเจ้าพ่อ Linux Linus Torvalds มานะ
- Global AI Thailand
- Azure Community Thailand
- .NET Thailand + .NET Conf Thailand โดยจะมีงานช่วงปลายปีนี้เป็นประจำ ปีที่แล้วผมเองไม่ได้มาฟังด้วย ปีนี้ต้องหาเวลา
- Digital Night 2024 | Zipevent - ให้ผู้ประกอบการมาคุยกัน / Networking
- Ctrll+Alt+Love - รัก "เลือกได้ " ของสาย ไอที 20.07.2024
Blog ท่านอื่นๆ
ของแจกในงานเยอะนะ มีบัตร NFC จาก PingCap / จาก JetBrain ด้วย พวกเสื้อด้วย ^__^
Reference
Discover more from naiwaen@DebuggingSoft
Subscribe to get the latest posts sent to your email.