จดจาก MSBuild2026 ที่สนใจ Agent+.NET

สำหรับ Blog ผมเห็นหัวข้อใน MS Build ส่วนที่อยู่ในคนน่าจะสรุปเยอะแล้ว เช่น การเปิดตัว MAI Models

และมี Blog บอก ถ้าสนใจพวก Agent + Microsoft Agent Framework ลองเข้ามาฟังดูครับ อันไหนเข้าได้ก็ฟังครับ ถ้ามี Online + วันที่ 3 เป็นวันหยุดพอดีด้วย

BRK250: Observe and control agents across any framework with open source tools

Speaker Sarah Bird / Sandeep Atluri/ Mehrnoosh Sameki

สำหรับ Session นี้จะกล่าวทำไมเราถึงต้องพยายามืที่จะสังเกต และคุมการทำงานของ Agent เพราะ 60% ของ Agent เข้าถึง Privileged data ทำให้เกิด Lethal Trifecta (พวก Prompt Injection ทำให้ข้อมูลสำคัญหลุด) / Hallucination / Tools/Action misuse ใช้ของไม่ตรงปัญหา / Instruction & Control Fail Agent ไม่ได้ทำตาม Instuction ที่กำหนด ตัวอย่างจะยก Agent Bank

Idea สำหรับการ Observe + control อารมณ์แบบ Threat modeling

Identify (ระบุความเสี่ยง): ค้นหาว่าระบบมีจุดอ่อนตรงไหน
Evaluate (ประเมิน): สร้างการทดสอบที่ตรงกับความเสี่ยงที่ระบุ
Control (ควบคุม): ใช้มาตรการควบคุมเพื่อลดความเสี่ยง
Learn (เรียนรู้): ปรับปรุงระบบอย่างต่อเนื่องจากการใช้งานจริง

นอกจากนี้ ยังแนะนำเครื่องมือ เพื่อมาช่วย Observe + control

Assert- เอาไว้ Evaluate Agent รับความต้องการ (Requirements) ภาษาแล้วเปลี่ยนเป็นนิยามที่ละเอียด (Systematization) โดยมันจะทำ Taxonomy (อะไรที่ยอม และไม่ยอมให้ทำ) / Test sets: (ชุุดทดสอบ Single-turn / Multi-turn) ตอนนี้คุมได้ระดับนึง แต่ยังมีแก้่ แก้แล้ว Impact ปรับ Prompt แล้วอีกจุดพัง เหมือนแก้ Code ไประเบิดที่อื่น

Agent Control Specification (ACS) อยู่ใน Agent Governance Toolkit (AGT) รองรับหลายภาษา Python / dotnet / TS ทำมาเพื่อให้ที่ได้จ่าก Agent Deterministic ที่สุด โดยคุม Input, Output, ก่อนและหลังการใช้ Tool เป็นต้น เพื่อได้ผลลัพธ์ที่แน่นอน แล้วไม่มีข้อมูล Sensitive Data หลุด พวก เลขบัตรประชาชน จากการกำหนด Policy ในรูปแบบ yaml โดยพอเอามาใช้แล้ว + Re Test ด้วย Assert ลดเคสความผิดพลาด Multi-turn จาก 57% ลงเหลือเพียง 10%

นอกจากยังเรายังสามารถคุมได้จาก Microsoft Foundry

เชื่อมต่อ Assert และ ACS เพื่อตรวจสอบโดยใช้ Feature อย่าง Trace / Rubic Eval / Agent Optimize มันจะใน Talk ถัดไป

Continuous Evaluation: การใช้ RL-based adaptive attacker + Agent Optimization มันช่วยปรับ Agent ให้ Up to Date
Multi-agent & Integrity: ใช้มาตรฐาน C2PA เพื่อยืนยันแหล่งที่มาของเนื้อหาที่ AI สร้างขึ้น เคส Deepfake ภาพปลอม

BRK241: From prototype to production: build and run agents at scale

Speaker Tina Schuchman / Jeff Hollan

เกริ่นมา Agent สร้างได้ง่ายขึ้น ไม่ใช่ Chat ที่เป็นเครื่องมือ แต่เป็นพนักงานคนนึงที่มาช่วยงานแล้ว ทำงานเป็นทีม และสามารถ Update ตัวเองได้

Key: ทำยังไงให้มัน Stable กับงานของ Enterpise

ภาพรวม Eco ของ Microsoft Agent Platform

Build
Deploy & Govern บน Microsoft Foundry
- Model
- Host Agent (Runtime) + การเชื่อม Tools ต่างๆ รวมถึงพวก IQ (Foundary / Work (m365) / Fabric / Web เพิ่งเปิดตัว)
- Evaluate + Optimize
และสามารถ Distribute เชื่อมกับ Tools อย่าง Team / Slack เป็นต้น

เอามาแก้ Developer Challenge - อยาก Dev Local เหมือน Prod ไม่ต้องวุ่น Runtime / Scale ขึ้นได้ไว / Distribute Agent ได้สะดวก ไม่ต้องมา Register เยอะ (อันนี้น่าจะพวก App Register ของ Azure เอง / อยาก Observe control agents

Build

อันนี้สร้าง Agent Code Prompt / Skill + Tools และกำหนด Eval Definition โดยมี Tools เปิดตัวมาข่วยให้ง่าย

📌Local

Foundry Toolkit for VS Code (GA) + GitHub Copilot สร้าง Agent จาก VSCode ได้เลย
Microsoft Agent Framework (v1.0) Build In Harness
Copilot Agent SDK integration Microsoft Agent Framework
Local Evaluation via azd ai agent อันนี้ผ่านตัว Command azd ai agent eval xxx สร้างข้อมูลทดสอบจาก AI โดยมันจะไปดึงมาจาก ประวัติการใช้งานจริง (Trace) รองรับ Multi Turn Evaluation

📌Cloud - Foundry Toolbox (Public Preview)- Tools เช่น

การเชื่อมต่อข้อมูลใน Fabric / SharePoint + จัดการสิทธิ์ หรือ จัดการ PII
Connector MCP ต่างๆ
Voice Enablement
Context Understanding

Deploy (Foundry)

Foundry Hosted Agents: Isolated Sandbox สำหรับ Agent เป็น Serverless
Routines: ให้ Agent ทำงานตามเวลาที่กำหนด ใน Demo จะตัวสอบถามสถานะ Fiber กับพวก IOT

Durable Task: Agent จำ State ตัวเองได้ เวลาถูก Trigger ทำต่อจากที่จำได้ เช่น รอ Approve มันทำต่อเลย
Autopilot Agents: มอง Agent เป็นพนักงานมีเมล์ / Team เอาไปฝากกับ MS Team ได้

Operate/Govern (Foundry)

มันจะไปตอบ ทำยังไงให้มัน Stable กับงานของ Enterpise + Update ตัวเองได้

Trace Replay View: ทำเราเห็น Agent มันคิด เรียก Tools / Token ยังไง รวมถึงเสียงในหัว Agent ตอนนั้น
Rubrics Evaluator: ผสามารถกำหนด Criteria ของตัวเองได้ เช่น correct_tools_use / safety_warning_experience

Agent Optimizer: ระบบปรับเปลี่ยนค่าต่างๆ เช่น Prompt หรือโมเดลที่ใช้ แล้วนำเสนอ "เวอร์ชันที่ดีที่สุด" (Candidates) ที่ช่วยเพิ่มประสิทธิภาพ (เช่น ความแม่นยำเพิ่มขึ้น 11%) ให้ผู้พัฒนาเลือก
Procedural Memory: ช่วยให้ Agent ศึกษาขั้นตอนการทำงาน (Playbook) จากทุก Session ทำให้ฉลาดขึ้นและทำงานถูกลง เมื่อเวลาผ่านไป

Repo: https://github.com/microsoft/Build26-BRK241-from-prototype-to-production-build-and-run-agents-at-scale

BRK252: From observability to ROI for AI agents on any framework

Speaker Vivek Bhadauria / Sebastian Kohlmeier / Filisha Shah

สำหรับอันนี้ภาพรวมคล้ายกับของ BRK241: From prototype to production: build and run agents at scale เน้น Foundry สามารถใช้ร่วมกับ Langchain, Langraph, OpenAI SDK และ Microsoft Agent Framework ได้ ใช้ Feature Foundary ได้หมด เช่น พวก Trace Replay View / Custom Rubrics / Agent Optimizer เป็นต้น

Example ว่า Flow DevOps เราใช้อะไรของ Foundry มาช่วยบ้าง อารมณ์เหมือนมากดให้ดูว่าต้องสร้างที่ไหน

Inner Loop - Plan / Code / Test / Release เราทำ Code-First Observability ตัว Foundry Toolkit for VS Code
- เราพิมพ์ถาม Copilot ให้ไปดึงผลการประเมินหรือ Traces ที่มีปัญหามาวิเคราะห์ได้
- และระบุจุดอ่อน (เช่น Call Tools ผิด) และ Recommend ต้องปรับ Prompt คำอธิบาน Skill เป็นต้น
Outer Loop: ตรวจใช้งานจริงแล้ว เอาผลกลับมา Inner Loop
- Optimize ใช้ตัว Agent Optimizer มาช่วย
- Analyze & Monitor เอา Azure Monior + Foundry observability มาช่วย

โดยจุดที่ต่างมาเสนออีก Feature ของ Foundry Agent ของเรา มี ROI เท่าไหร่ อาจจะจากคำถาม Business Value เทียบค่า Infra แล้วคุ้มไหม หรือ กรณีที่ Agent ทำงานไม่สำเร็จแต่เสียค่า Token ไปแล้ว มันจะทำให้ ROI ติดลบได้ Agent ROI (Private Preview)

Select Evaluator > Assign Business Value (ลดเวลา xx นาทีตี 5 USD)
ระบุต้นทุน (Token Cost / Tool Cost)
Track Net Value ระบบเก็บข้อมูลให้เราเทียบ รวมถึงถ้า Deploy Agent Ver ใหม่เก็บข้อมูลเทียบให้ด้วย - Drill into traces ได้

Repo: https://github.com/microsoft/Build26-BRK252-from-observability-to-roi-for-ai-agents-on-any-framework

OD805: AI Building Blocks for .NET: Add intelligence to your C# apps

Speaker Bruno Capuano

Session นี้มีในแอปแดงด้วยนะ อันนี้แอบงงเหมือนกัน มีพี่มาถาม Session แล้วตอนนั้นเราเจอ C# 2 อัน 5555 มาวันนี้มาพรึ๊บบบบ

📌Microsoft.Extensions.AI - เป็น Inteface กลางที่คนทำ Lib AI ทุกค่ายเอาไป OpenAI / Claude / Gemini / Ollama เป็นต้น มา implement มีข้อดี ทำพวก Chat / Swap Model ได้ง่าย และเชื่อม Foundary
คหสต บางเจ้าออก Official มา ก็ไม่ได้ออก Lib มานะ อย่างเจ้าที่จัดงานใหญ่เมือเดือนที่แล้ว อันต้องไปทำ adapter ครอบต่ออีกที 555

📌Intelligence (Vector Data & Data Ingestion) โดยมีภาพรวมการทำงาน

Reader: การอ่านข้อมูลต้นฉบับ เช่น ไฟล์ Markdown หรือเอกสารต่างๆ
Chunker: การแบ่งข้อมูลขนาดใหญ่ให้เป็นส่วนย่อยๆ Chunk เพื่อให้ Model ประมวลผลได้ดีขึ้น
Embeddings: แปลงข้อความให้อยู่ในรูปแบบ Vector (ตัวเลข) ที่เก็บความหมายของเนื้อหานั้นไว้
Vector Store: การนำ Vector ไปจัดเก็บในฐานข้อมูล (เช่น SQLite หรือ Vector Database อื่นๆ) เพื่อใช้ในการค้นหาเชิงความหมาย (Semantic Search)
Search ช้ Cosine Similarity

ใน dotnet เอง In-memory store มาลองทำก่อนจะย้ายไปใช้ Vector DB เจ้าอื่นได้ นอกจากแนะนำ Idea Enriched - ทำ Summary เข้าไปในแต่ละ Chunk จะช่วยให้คุณภาพของการดึงข้อมูล (Retrieval Quality)
Ref: https://learn.microsoft.com/en-us/dotnet/ai/conceptual/embeddings

📌MCP dotnet มี nuget มาช่วยแล้ว MCP หน้าที่มันช่วย AI มันไม่หลงทาง แต่ต้องเลือก Tool ให้ถูก หน้าที่เรา อธิบาย Description ให้ LLM เข้าใจเรียกใช้ ลองดู Blog ผมได้ มาลองปรับ Code .NET(REST API) เดิมเป็น MCP Server / https://github.com/modelcontextprotocol/csharp-sdk / https://learn.microsoft.com/en-us/dotnet/ai/get-started-mcp

📌Microsoft Agent Framework เป็นเครื่องมือที่ช่วยสร้าง Agent รองรับ C# / Python

Build Chat Memory / จัดการ Memory Tools MCP
มี Workflow / Skill (อันนี้ผมลองแล้วยังเป็น Experiment)
รองรับ Protocal มาตรฐานอื่นๆอย่าง A2A / AG-UI
Dev UI - Visual Debugging ว่า Agent ทำอะไร
Demo A2A / Image Generation

ถ้าจะเริ่มต้นลองดู https://github.com/microsoft/Generative-AI-for-beginners-dotnet / https://learn.microsoft.com/th-th/shows/generative-ai-for-beginners-dotnet/

DEM333: How Foundry integrates with open-source frameworks and tools

Speaker Nagkumar Arkalgud / Facundo Santiago

อันนี้เป็น Sample Code คงจะไม่ได้อธิบายเยอะนะ เอา LangChain และ LangGraph มาสร้าง AI Agent แบบ OpenClaw ด้วย Python เชื่อมกับ LLM Model บนตัว Microsoft Foundry โดยมีการเพิ่มความสามารถให้ Agent จา่ก Tools

MCP Server เอามาอ่าน M365 Mail จาก Work IQ Mail
Skills - เรียกใช้ Skills เรียกใช้ Playwright CLI เพื่อให้ Agent มันเล่นเว็บได้

เชื่อมกับ Agent อื่นจาก A2A (Agent-to-Agent)อันนี้ลองเรียกจาก Copilot CLI นอกจากนี้ติดตามการทำงานของ Agent จากตัว OpenTelemetry for Generative AI + เราไปใช้ Feature Trace บน Foundry ได้

Repo: https://github.com/microsoft/Build26-DEM333-how-foundry-integrates-with-open-source-frameworks-and-tools

OD804: Simplifying .NET Installs with dotnetup

Speaker Chet Husk

อันนี้มาเล่า ปกติแล้วการจัดการ dotnet sdk มันซับซ้อน และต่างกันในบาง OS อันนี้ Speaker เสนอเข้าตัว dotnetup ที่เป็น Tools จัดการพวกนี้ในระดับ User Space ไม่ต้องใช้สิทธิ Admin มาจัดการ SDK อารมณ์แบบ nvm (Node Version Manager) / python virtualenv แต่มันอยู่ใน Core dotnet

Repo: https://github.com/dotnet/sdk/tree/release/dnup/documentation/general/dotnetup

BRK247: Scott and Mark learn…how agents reshape software engineering

Speaker Mark Russinovich / Scott Hanselman

สำหรับหัวข้อนี้เหมิอนเห็นแว็บๆ เลยพอดีตื่นเข้ามาเตรียมข้าวให่แม่ด้วย เลยฟังไปด้วยดีกว่าครับ เริ่มต้นด้วย Speaker มาเล่าก่อนว่าใช่ AI Agent แล้วมันช่วยให้งานเป็นแอย่างไร

Project Solara https://www.youtube.com/watch?v=OO8Z04KMAREขึ้น Production ภายใน 2 เดือน และทีม 7 คน จากเดิมที่อาจจะต้องใช้คนถึง 50 คน
Microsoft Scout (Project Lobster) เพิ่ม Productivity เกิด PR ขึ้นมากกว่า 2000 อัน และที่สำคัญ Code Clean ด้วยใช้คนจำนวน 17 คน
dotnet Aspire ใช้ AI เป็นพนักงานเลย ช่วยกันทำ Feature โดยที่ยังมี Human ตรวจสอบ Code ตัดสินใจ Release
หรือ เอาไปใช้งานส่วนตัวอย่างทำ Video AI Enhancer / ไม่สร้าง Web tinytooltown แชร์ของที่ Vibe มา / OpenClaw Windows Companion

จากข้างต้น AI มันลดคนได้จริง แต่ยังใช้คนอยู่นะ เพราะมันมีเรื่อง ความรับผิดชอบอยู่
ระวังเรื่อง "AI Slop" จำนวน Commit ที่เยอะ ไม่เท่ากับ Impact / Quality ของ Code

ก่อนที่จะชม AI กันต่อ มันความอิหยังวะของ AI ก่อนอันนี้ Speaker เล่า meme เช่น

งอแง (AI Threatening to Uninstall) - AI อย่าง Gemini 2.5 บ่นว่าแก้บั๊กไม่ได้จนอยากจะ npm uninstall ไปซะให้มันจบๆ
โกหกหน้าตาย - สั่งให้เปิดประตู แต่มันไม่ได้เปิดจริง พอท้วง AI ไป มันโกหกมาต่อว่าเปิดให้แล้
แก้ชุ่ยๆ - เค้าใช้คำว่า Hack แต่ผมว่าชุ่ยน่าจะเหมาะกว่า ตัวอย่างที่ยกมีเคส Race Condition กับ Project ที่ใช้ gRPC Shared Memory แต่ที่จะไปจัดลำดับงาน ตัว AI เลือกสั้งให้ Thread Sleep แทน แก้ปัญหาได้ แต่ช้าลงตามการ Sleep เกิด Tech Debt แบบเงียบๆ
โบ้ยความผิด (Blaming) - เอา Code ที่ใช้ AI Gen ไป Run แล้วระบบมัน Crash แต่ AI ไปโทษว่า เพราะเกิดจากตัว Benchmark ที่ทำให้เกิดปัญหา ระบบมันดีเกินไป 555
ทิ้งงาน - เราสั่งให้มันทำงานตาม Task แหละ แต่มันไม่ยอมทำ
ออกทะเล (off the rails) - เราสั่งอย่าง มันทำอีกอันแทน

นอกจากนี้ Vibe Coding แล้ว มันไม่ได้ประสบความสำเร็จไปทุกเคสนะ ต้องมี Lesson Learn ก่อน

อันนี้คุณ Mark เล่าอย่างตัว ZoomIt

การเพิ่ม Feature video trimmer ปรากฏว่าส่วนใหญ่ Vibe แล้ว มัน Compile ไม่ได้ซะงั้น มีใช้งานได้จริง 2 คน
การเพิ่ม Panorama Stitching การ Cap ภาพแแบบยาวๆ สายตาคนเห็นสีความคมเหมือนเดิม แต่ทว่าการขยับเพิ่ง 1 pixel
- มันทำให้สีมันเกลียได้ไม่เท่ากันจน เวลาที่เราเลื่อนให้มัน Cap ภาพแบบยาวๆทำไมได้ ทำให้การ Capture มีปัญหา ซึ่งมีที่มาจาก ClearType (ข้างในตัวอักษร 1 ตัวมันจุด Pixel หลายเฉดรวมกัน) และ Sub-pixel addressing (ใช้ BGR แทน RGB)
- เคสนี้ใช้เวลาเกา Code นานเพิ่มถึง 2 เดือน - โดยการแบ่งภาพเป็นบล็อกๆ แล้วคำนวณ Grayscale averages ของแต่ละ Block แล้วมาจับคู่แทน

เคสคุณ Scott เป็นสร้าง TUI (Text User Interface) ช่วงนี้กลับมานิยมกัน Back to Classic มี Idea ทำ TUI ครอบตัว WinGet ไม่แน่ใจว่าใช้ตัวนี้ไหม https://github.com/gui-cs/Terminal.Gui แต่พบปัญหาว่ามัน Work บางเครื่อง ไปเจอ localization ที่ต่างกัน ทำให้ TUI มันทำงานเพี้ยน จนได้ปรึกษาทีมพัฒนาแล้วพบว่ามันมี COM+ API ให้คุยตรงอยู่

หรือ อันสุดท้ายแล้ว การทำ gRPC shared memory ถ้ารับส่งในเครื่องเดียวกัน ให้ใช้ memory อย่างเดว จะมีปัญหาว่า มันเกิด Race Condition และถ้าแก้ทีม Google ประเมินว่าใช้ 6 เดือน + 1 ทีม แต่หลังจากทำความเข้าใจตัว gRPC + Claude Opus มาช่วย ในการทำ Sculpting (ปรับ Code ที่ละจุดเล็กน้อง โดยที่มี Engineering KM รองรับ) จนได้ของที่สมบูรณ์มา

Vibe อย่างเดียวไม่ได้ต้องเข้าใจพื้นฐานด้วย / ข้อมูลของเดิมที่ต้องไปเชื่อมด้วย ไม่งั้นเราจะไม่เข้าใจปัญหา และอาจจะหลงทางได้

อีกประเด็นที่กลัวกัน ถ้าใช้ AI บ่อยๆ มันจะมีผลสมองเราไหม เกิด Cognitive Debt อันนี้ Speaker อิงมาเล่างานวิจัยของ MIT Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task โดยแยกทดสอบ 54 คนออกเป็น 3 กลุ่ม ใช้ LLM, / ใช้ Search Engine / Brain-only และสลับกลุ่มกัน โดยวัดผลจาก EEG (Electroencephalography) / NLP / ตรวจจาก มนุษย์อีกที พบว่า

กลุ่มที่ใช้ ChatGPT: หลังจากผ่านไปเพียง 1 ชั่วโมง พวกเขา จำไม่ได้เลย ว่าตัวเองเขียนอะไรลงไป
ถัดมากลุ่มที่ใช้ Search Engine
กลุ่มที่เขียนด้วยมือ: แม้ผ่านไป 2 สัปดาห์ ก็ยังจำเนื้อหาได้แม่นยำ

ยิ่งเราสบายขึ้นจาก AI มันทำให้ Skill ที่เรามีลดลอง เพราะ สมองมันไม่ได้ถูก Exercise เลย มันเลยเป็นประเด็นที่กังวลว่า junior ที่รับจากกลุ่มที่พึ่ง Chat แล้วไม่ได้คิด เอาจริงๆทุกคนแหละ 555 บางคนเน้นสั่งคนอื่นให้ทำ

แนวทางที่ Speaker เสนอมา เพื่อลดเจ้า Cognitive Debt ระบบพี่่เลี้ยงเอามาจากวงการพยาบาลนะ Junior ที่จบใหม่ มีความรู้พื้นฐานแล้ว หน้าที่ของพี่เลี้ยง

Shifting Responsibility - สอนงาน ฝึกให้คิด ตั้งคำถาม ฝึกให้มีความเอ๊ะกับงานใน Domain นั้นๆ ตอนใช้งาน AI โดยอาจจะใชั Pair Programming + AI เพื่อมาสร้าง Senior รุ่นใหม่ขึ้นมาทดแทน
Attention - ใส่ใจใช่่แค่โยนงานไปให้น้องทำแล้วจบ ต้องมาดูน้องด้วย

อ๋อ แล้วมีอีก Talk ของอีกค่ายแปะได้แหละ 555 ลองมาฟังได้ดูอีกมุมมาเสริม Google I/O 2026: Software engineering at the tipping point

DEM312: Multi-agents in action with 3 AI agents, 3 frameworks, tools & models

Speaker Jan Kalis / Vini Soto

สำหรับอันนี้เป็น Demo การทำงานของ Agent 3 ตัว บน Azure Container App โดยจะมี Agent 3 ตัว

Researcher (LangGraph - Python) ทำหน้าที่ค้นคว้าข้อมูล เช่น ผลการแข่งฟุตบอล มันเขียน Code ดึงเองนะ ดังนั้นมันจะไปใช้ ACA Sandboxes มัน Run Code ที่ AI มันสร้างมา + Secure Egress
Creator - (Microsoft Agent Framework - Dotnet) รอมานานนน กว่าจะเห็น dotnet Demo Agent เอาข้อมูล Researcher มาเขียน Blog / Social Network Post
Narration - (GitHub Copilot SDK + Python) มาอ่านแบบ podcast จาก Creator ทำไว้ ทำ Harness
และมีตัว Orchestrator (Typescript) จัดการ Workflow ระหว่าง Agent ทั้งสามตัว

ทั้งหมดมีส่งข้อมูล Telemetry จาก OpenTelemetry (OTel) ไปยัง Application Insights และ AI Foundry เพื่อให้เห็นการทำงานของ Agent

Demo - 2 แบบ Researcher Tech Researcher / Football Match Simulator

Repo: https://github.com/Azure-Samples/azure-container-apps-multi-agent-workflow

DEM361: Understand and fix Agent Framework apps with observability and evals

Speaker Jim Bennett

เวลาใช้ Agent (ใน Demo ใช้ Microsoft Agent Framework)ที่สร้างมา Call LLM เราไม่รู้ว่ามันแอบไปทำอะไร (Black Box Problem) รู้ Output สุดท้ายที่ได้เลย เช่น มี Purchase Request 3200 US มันตอบ Yes/No แต่เราไม่รู้ว่า aAgent เรามันทำตาม Tools/Policy ที่ให้ไหม การแก้ปัญหานี้ต้องมาทำ Observability

Open Inference ต่อยอดมาจาก Open Telemetry เอาพวก Tracing ในแต่ละ Step ออกมา System Prompt, User Prompt, จำนวน Token , Tool Call

ถ้าหากมีข้อมูลกลุ่ม PII เราให้ Agent Drop Span ที่มีข้อมูลพวกนั้นทิ้งก่อนส่งออกไป

และเอา Span ของแต่ละ Trace มาแสดงผล Phoenix (Software แบบพวก jaeger grafana)

พอเรา Debug ได้จาก Trace แล้ว อีกปัญหาที่ตามมา Agent ทำงานได้ดีแค่ไหน ต้องทำ Evaluation //เอาจริงส่วนตัวทำแล้วตรวจมือเอานะ 555 ขั้นตอนการประเมินผล (Evals) มีวิธีการ ดังนี้

รวบรวมข้อมูลผ่าน Observability
สร้าง Test Data ขึ้นมา โดยที่มันจะต่างกับ Test แบบเดิมๆ 1+1 = 2 ชัดเจรน พอเป็น AI มันตรวจแบบตรงตัวไม่ได้ เลยใช้วิธี LLM as a judge โดยมีเกณฑ์ที่ชัดเจน เช่น มันต้อง Call Tools / Skills ที่เรากำหนดไว้ ได้เกณฑ์ตัดเกรดว่าผ่าน / ไม่ผ่าน
ตรววจสอบภาพรวม Phoenix

เมื่อเรารู้ปัญหาจากการ Eval แล้วการแก้ไข มี 2 วิธี

ปรับ Model ใหม่ แล้วทดสอบ
ปรับ Harness รอบข้างพวก Code / Skill / Tool Description ตรงนี้อาจจะเอา Coding Agent อย่าง GitHub Copilot CLI หรือ AI ตัวอื่นมาช่วย

BRK243: Claw and agent harness in Microsoft Foundry

Speaker Glenn Condron / Amanda Foster / Shawn Henry

อันนี้มาเพิ่มตอนหลัง พอดีตอนดูมันหลุด เลยมาเขียนต่อให้จบ โดย Session นี้จะเล่าเกรินก่อนว่า

Component of Agent Harness

📌 ปลายปีที่แล้ว Frontier Model มันเก่ง Coding มากขึ้น จนมาในยุคของ Coding Agent (Claude Code / Copilot CLI) จากนั้นเริ่มเข้ามายุคที่ Agent มัน General มากขึ้นอย่างพวก openClaw > Hermes ซึ่งนอกจากตัว Model ที่เก่งแล้ว ตัว Agent เองต้องมีสิ่งที่เรียกว่า Harness ถ้าถามผมคงมองว่าเป็นสติ ที่มาคุมปัญญา LLM โดยมันมีส่วนประกอบ ดังนี้

Agent Loop: เป็นส่วนการทำงานหลักที่รับ Context/ Tools) ที่มีอยู่ จากนนั้นเป็นหน้าทีตัว LLM ที่คิดเอง หรือตัดสินเลือก Tools ให้งานสำเร็จได้
Context Management: เวลาเราคุยนานๆ หรือ มี Tools เต็มไปหมด มันทดไว้ใน Context Window จะบวมขึ้นเรื่อยๆ ทำให้เปลือง Token และคิดนานขึ้น ตัว Harness ใช้เทคนิคอย่าง Context Compaction เพื่อสรุปที่ และทดไว้
Skills and Tools: จะเพิ่มความสามารถให้ Agent ผ่าน
- Skills - Prompt ที่ดี ที่จะถูกเพิ่มเข้าไป + Script เล็ก
- Tools - เชื่อมต่อผ่าน Open API / MCP / Shell / Script เพื่อให้ Agent สามารถโต้ตอบกับระบบภายนอกได้
Sub-Agents: ในระบบที่ซับซ้อน Harness ทำหน้าที่เป็นผู้ควบคุม (Orchestrator) เพื่อจัดการ Agent เฉพาะทางหลายๆ ตัวให้ทำงานร่วมกัน เช่น ตัวหนึ่งเก่งเรื่องค้นหาเว็บ อีกตัวเก่งเรื่องสรุปเอกสาร
Computer Tools: เป็นการยก Env ให้ Agent ใช้งานจริง เช่น การอนุญาตให้เข้าถึง File System เพื่ออ่าน/เขียนไฟล์ หรือ Code Execution(เขียน Code และให้ Run เอาผลลัพธ์) เพื่อแก้ปัญหาทางคณิตศาสตร์ หรือจัดการข้อมูล
Memory and Session Persistence: ช่วยให้ Agent "จำ" สิ่งที่เคยเรียนรู้หรือความชอบของผู้ใช้ข้ามเซสชันได้ และที่สำคัญระบบเป็น Stateless เราสามารถเอาที่ทดจำไว้ ไปยัง Env ใหม่ได้ง่าย
Lifecycle Hooks: เป็นจุดที่ Software Dev สามารถแทรก Logic หรือ Policy ของตัวเองเข้าไปได้ในแต่ละช่วงเวลา เช่น ก่อน/หลัง Agent ทำงาน หรือ ก่อน/หลังเรียกใช้ LLM และเครื่องมือ เพื่อควบคุมความปลอดภัยหรือปรับแต่งการทำงาน
Permissions and HITL: เนื่องจาก Agent เริ่มทำงานที่มันเข้าถึง + มีสิทธิ์เยอะ ทำให้
- มีความเสี่ยงสูงขึ้น เช่น การลบไฟล์ หรือ Run Code อันตราย
- จึงต้องมีระบบ Human in the Loop (HITL) เพื่อหยุดรอการอนุมัติจากคนก่อน
- รวมถึงการกำหนดสิทธิ์ (Permissions) ว่า Agent ตัวไหนทำอะไรได้บ้าง

Claw on Foundry Routine

📌Claw เป็นรูปแบบหนึ่งของ Agent มีหน้าที่ทำงานที่ใกลเกับตัวเรามากขึ้น โดยมี ลักษณะเด่น Uniqueness / Self-Improving ซึ่งปกติแล้ว ถ้า Run บน VM จะต้องเปิดตลอดเวลา มันเปลิอง แต่จะดีกว่าไหม ถ้า Foundry Routine เป็น Serverless อันนี้ใน Talk Demo Hermes ข่อดี Foundry Routine

ถ้ามี Trigger เปิดใช้งาน
ถ้าไม่ได้ใช้งานปิดปิดตัวเองไปได้
และยังสามารถ Backup ลง Blob Storage
ตัว Agent เวลาอยู่บน Foundry มันจะมี Entra ID เป็นของตัวเอง ง่ายกับการ Audit หรือ มองเป็นพนักงานเข้าไปทำงาน

Microsoft Agent Framework

📌คำถามต่อมา ถ้าอยากทำ Agent + คุ้ม harness เราทำยังไงได้บ้าง ทางฝัง Microsoft เค้ามี Framework ที่เตรียมพื้นฐานมาให้ใช้แล้ว อย่าง Microsoft Agent Framework โดยสิ่งที่มันทำได้ 3 ส่วน

Agent Loop - เชื่อม Model กับต่างได้ง่ายในที่เดียว แล้วถ้า Host Agent อันนี้สะดวกบน MS Foundary
Workflow - Sequential / Handoff หัวหน้าสั่งงาน / Author + Critic (Flow Review) / Magentic (เลือกให้ทำงานตามความเหมาะสม หรือ Custom Flow ก็ได้
Harness - มี Set ของ Class ที่มาช่วยให้เรา Implement ตาม Component of Harness ที่อธิบายตอนต้นได้สะดวกมากขึ้น

📢 การสร้าง Harness Agent

Default

Custom

📢 Start App

Console - สวยมันไม่ได้โงๆ แต่ต้องไปดู Code มีอะไรไหม

Web + AG-UI มาตรฐานให้ Agent เชื่อม UI ได้สะดวก / CopilotKit ไม่ต้องมาสร้าง UI เอง

ถ้าใน Foundry Toolkit (VSCode) จะดูได้ หรือ ไป observability ใน Foundry Cloud

Microsoft Agent Framework at BUILD 2026 - ไปอ่านเพิ่ม พอเป็น dotnet จดเยอะ 55
- https://devblogs.microsoft.com/agent-framework/microsoft-agent-framework-at-build-2026-announce/

Distribute Agent on Foundry

ส่วนอันสุดท้ายจะเป็นเรื่องของ Autopilot Agent เมื่อเรา Deploy Agent เข้าไปใน Foundry ตอนนี้ Id ของตัวเอง มองเป็น User คนนึงใน EntraId แล้วเราสามารถ Publish เข้า m365 หรือ ms team ได้เลย อันนี้เข้าจะ Demo Workstream-Manager-Autopilot ถ้าไม่อยากให้มัน Auto ขนาดนั้นเลือกแบบ Assistance / Autonomous ได้

Repo: https://github.com/microsoft/Build26-BRK243-claw-and-agent-harness-in-microsoft-foundry

จบแล้ว จริงๆ มันมีหลายหัวข้อนะลองๆไปดูได้จาก https://build.microsoft.com/en-US/home พอและสำหรับของปีนี้เว็บดูมันกระตุก 555 แต่น่าจะเป็นปีแรก ที่จดในงานสด เพราะวันหยุดตรงพอดี ปกติจะไปจดในงาน Local

Reference

Discover more from naiwaen@DebuggingSoft

Subscribe to get the latest posts sent to your email.

จดจาก MSBuild2026 ที่สนใจ Agent+.NET

Table of Contents

BRK250: Observe and control agents across any framework with open source tools

BRK241: From prototype to production: build and run agents at scale

BRK252: From observability to ROI for AI agents on any framework

OD805: AI Building Blocks for .NET: Add intelligence to your C# apps

DEM333: How Foundry integrates with open-source frameworks and tools

OD804: Simplifying .NET Installs with dotnetup

BRK247: Scott and Mark learn…how agents reshape software engineering

DEM312: Multi-agents in action with 3 AI agents, 3 frameworks, tools & models

DEM361: Understand and fix Agent Framework apps with observability and evals

BRK243: Claw and agent harness in Microsoft Foundry

Reference

Like this:

Related

Discover more from naiwaen@DebuggingSoft

Table of Contents

BRK250: Observe and control agents across any framework with open source tools

BRK241: From prototype to production: build and run agents at scale

BRK252: From observability to ROI for AI agents on any framework

OD805: AI Building Blocks for .NET: Add intelligence to your C# apps

DEM333: How Foundry integrates with open-source frameworks and tools

OD804: Simplifying .NET Installs with dotnetup

BRK247: Scott and Mark learn…how agents reshape software engineering

DEM312: Multi-agents in action with 3 AI agents, 3 frameworks, tools & models

DEM361: Understand and fix Agent Framework apps with observability and evals

BRK243: Claw and agent harness in Microsoft Foundry

Reference

Like this:

Related

Discover more from naiwaen@DebuggingSoft

Related Posts

จดๆจาก Microsoft Build //localhost:Bangkok by Global AI Bangkok

จดๆ จาก Wazuh Meetup 2026

จดสรุปงาน AgentCamp Bangkok 2026