Encoding / Embedding เหมือน หรือต่างกันยังไง

จุดที่เหมือนกันของ Encoding / Embedding Encoding Encoding – เป็นการเข้ารหัสข้อมูล สร้างมาตรฐานการจัดเก็บที่กลาง เพื่อความสะดวกในการใช้งาน โดยมีจุดเด่นรูปแบบ 1 ต่อ 1 แปลงไปแล้วสามารถแปลงกลับมา (Decode) เป็นข้อมูลเดิมได้สมบูรณ์ โดยมีอัลกอริทึ่มที่สำคัญ อาทิ เช่น Embedding เป็นรูปแบบหนึงของการทำ Encoding ที่สปอยไว่ โดยเจ้า Embedding แปลงข้อมูลให้เป็น Dense Vector ชุดข้อมูลตัวเลขที่แทนข้อมูลชุดที่สนใจ เป็นมาตรฐานกลางสำหรับการทำพวก AI (Machine Learning/Deep Learning) มีจุดเด่นสามารถหาความสัมพันธ์ของข้อมูลได้ แต่แปลงกลับตรงๆ แบบ 1 ต่อ 1 ไม่ได้ เน้นรักษาความหมาย และสามารถเอาเทคนิคทางคณิตศาสตร์หาหาความเชื่อมโยงได้ ตัวอย่าง คำอย่าง “กสิกรรม” / “เกษตรกรรม” / “Farming” จัดให้อยู่ใน Vector Space เดียวกัน โดย กสิกรรม /เกษตรกรรม อยู่ใกล้ๆกัน และ Farming ขยับออกมาคนละภาษา ถ้าเป็นคำว่า่ Far จะอยู่ไลกออกไปอีก อัลกอริทึ่มที่พบบ่อยๆ พอเรารู้ Semantic เอาไป Apply กับตัว Semantic Search / Similarity Search / RAG / Clustering








