Tag Computer Science

สับสน เมื่อจะเริ่มเรียนปริญญาโท

ยอมรับเลย ว่าปีนี้ 2559 หาข้อมูล ป โท ช้ามากกก เน้นทำงานมากเกินไป จนเพื่อมาหาข้อมูลจริงเกี่ยวกับ ป โท คือ ช่วงวันที่ 27-30 เมษายน เอง เวลาที่น้อยย่อมทำให้เราตัดสินใจพลาดได้ง่ายๆ สำหรับผมลังเลระหว่าง Computer Science กับ Software Engineering อยู่เลย และท้ายที่สุดผมลองเลือก ป.โท CS ของ จุฬา ไปสมัครในวันสุดท้ายเลย เนื่องจากตอน ป ตรี เรียน CS มา แต่พอมาคิดๆอีกที่แล้ว เรายังตอบตัวเองไม่ได้ว่า แต่พอลองมองย้อนกลับมาคิดดีๆ ได้ปรึกษากับอาจารย์ตอนคิดหัวข้อ…

[IR] สรุปจาก Quiz ที่1

ข้อที่หนึ่ง ข้อใดต่อไปนี้ไม่จัดเป็นระบบ IR A: ค้นหาคำว่า “computer” จาก E-mailB: ค้นหาคำว่า “computer” จาก GoogleC: ค้นหาคำว่า “computer” จาก windows explorer ตอบ ข้อ C เพราะงานในด้าน IR นั้นจะยุ่งกับข้อมูลในส่วนของ unstructure data(ข้อมูลทีไม่ได้จัดเก็บเป็นระบบ เช่น ไฟล์ word, e-mail) เอามาทำเป็น index และทำส่วนรองรับการค้นหาจากผู้ใช้ แต่ในกรณีของข้อ C: ค้นหาคำว่า “computer” จาก windows explorer ไม่นับว่าเป็นระบบ…

[IR] คำถามเกียวกับการทำ Cluster Pruning

คำถาม: การทำ Cluster Pruning ใน Lecture 6 หน้า 33-37 โดยการกำหนดค่า b1 และ b2 นั้น เมื่อ b1 และ b2 มากขึ้นจะทำให้เกิดอะไรขึ้นต่อการคำนวณคำตอบ: มาดูคำแต่ละคำกันก่อนว่า คือ อะไร ? Cluster Pruning คือ อะไร ? Cluster Pruning คือ การเตรียมข้อมูล ซึ่งก็คือ document ต่างๆ ในระบบ(ทำตั้งแต่ช่วงสร้าง Dictionary เลย) เพื่อที่จะแบ่งกลุ่ม document…

[IR] ข้อสงสัยของ Frequency แบบต่างๆ

จากที่เรียนมาจะมี 3 คำ ได้แก่ ตัวอย่าง สมมุติมี document แค่ 2 อันในระบบ (collection) doc1: I like a dog doc2: You like a cat and a bird หมายเหตุ ค่า Frequency จะนับทุกเทอม โดยจะไม่ได้ทำ Stem (ลดรูป) และตัด Stopword ออกไป