[IR] คำถามเกียวกับการทำ Cluster Pruning

คำถาม: การทำ Cluster Pruning ใน Lecture 6 หน้า 33-37 โดยการกำหนดค่า b1 และ b2 นั้น เมื่อ b1 และ b2 มากขึ้นจะทำให้เกิดอะไรขึ้นต่อการคำนวณคำตอบ: มาดูคำแต่ละคำกันก่อนว่า คือ อะไร ? Cluster Pruning คือ อะไร ? Cluster Pruning คือ การเตรียมข้อมูล ซึ่งก็คือ document ต่างๆ ในระบบ(ทำตั้งแต่ช่วงสร้าง Dictionary เลย) เพื่อที่จะแบ่งกลุ่ม document ที่คล้ายๆกัน ให้อยู่กลุ่มเดียวกัน เพื่ิอที่จะช่วงลดเวลา ในการค้นหา โดยจะกำหนดให้มี หมายเหตุ ความสัมพันธ์ของ Leader กับ Follower จะมีความสัมพันธ์แบบ 1 ต่อ 1 (b1=1) การทำงาน เมื่อมี Query ? ค่า b1 และ b2 คือ อะไร ? ค่า b1 และ b2 คือ อะไร ปัญหาของการกำหนดค่า b1 และ b2 Document แต่ละอันมันเหมือนกันขนาดไหน ? เราจะรู้ได้อย่างไรว่า document แต่ละอันมันเหมือนกันขนาดไหน ที่จะเอามาแบ่งกลุ่ม สามารถหาได้ โดยการคำนวณ หาค่า cosine คำตอบของเรากรณีที่ b1 และ b2 มากขึ้น

[IR] ข้อสงสัยของ Frequency แบบต่างๆ

จากที่เรียนมาจะมี 3 คำ ได้แก่ ตัวอย่าง สมมุติมี document แค่ 2 อันในระบบ (collection) doc1: I like a dog doc2: You like a cat and a bird หมายเหตุ ค่า Frequency จะนับทุกเทอม โดยจะไม่ได้ทำ Stem (ลดรูป) และตัด Stopword ออกไป

[Internship True]วันที่ 28-29

ในสองวันนี้ ก่อนจบการฝึกงานที่ยาวนานกว่าสองเดือน(ไม่ได้ทำกับทีม แต่ไปทำกับ Outsource) ผมได้รวมงานของผมที่ทำกับงานของพี่ โดยไฟล์ในส่วนที่พี่ทำใหม่นั้นจะมีการเปลี่ยนแปลงเท่าที่สังเกตมา 2 อย่าง ได้แก่่

[Internship True]วันที่ 27

วันนี้ศึกษาการนำเสนอข้อมูลด้วยกราฟเพิ่มเติม(จากที่อาจารย์สอน เราก็ไม่ได้อะไรเลย อ.มัว แต่ไปรับงานนอก) โดยจากข้อมูลที่ได้มา แต่ต้องการที่จะเอาข้อมูลในส่วนของ filter, transmitted และ received โดยกราฟที่ได้ทดลองและศึกษา ได้แก่  ที่มาข้อมูลเรื่องแผนภูมิ: ชนิดข้องแผนภูมิต่างๆใน Microsoft Office (เนื้อหาดีมาก ^__^)

[Internship True]วันที่ 26

วุ่นๆกับการลงทะเบียนเรียนเทอมหน้า ที่ตอนจะลงวิชาเรียนจะต้องมาหาข้อสรุปมติ แต่ทำไมตอนจับกลุ่มโปรเจค ไม่เห็นมีแบบนี้บ้าง และก็โยนปัญหามาทางเรา ต่อมาจัดการวิชาเลือกเสรี เพราะโพสไปในเว็บบอร์ดสาขาที่ไม่มีคนจะมาโพสเพิ่ม อยากจะเป็นฝ่ายรับอย่างเดียว มีปัญหาอะไร โยนมาทางเราอีก ซวยอีกโดนบ่นในทวิตอีก ทำดีแล้วโดนด่า สู้ทำตัวแบบบางคนจะดีกว่า เห็นแก่ตัวเยอะๆ ช่วยงานบ้าง เสนอ idea แต่ไม่ต้องทำ

[Internship True]วันที่ 25

จากงานที่ได้รับมอบหมายให้ปรับปรุง ก็จะมีการทำงานย่อยๆ 2 ส่วน ได้แก่ ปัญหาที่พบ โดยหลักๆแล้วจะเป็นการยัดข้อมูลที่ได้ลงตัว Combobox ส่วนการ Query ดึงข้อมูลจาก DB นั้นไม่มีปัญหา และในที่สุดก็สามารถที่จะดึงมาแสดงผลใน Combobox ได้ T_T

[Internship True]วันที่ 24

เมื่อก่อนที่ได้ Code พี่มาศึกษา เราต้องไล่แกะ Code และมาเขียนเองหมดเลย แต่ตอนนี้พี่เค้าแนะนำ Tool ตัวหนึ่งมาใช้ ชื่อว่า aBator ที่จะช่วยให้ใช้งาน ibatis ได้สะดวกขึ้น โดยจะมีการ Gen Class ต่างๆ, DAO และ sqlMap มาใช้เลยรวมถึง sql พื้นฐานต่างๆด้วย ทำให้เราสบายขึ้นเยอะ การใช้ aBator ในการ gen ไฟล์ที่เกี่ยวข้องในการใช้ ibatis กับ Spring

[Internship True]วันที่ 23

วันนี้ก็มีการประชุมดูงานกัน และก็จะมีการปรับปรุงแก้ไขในส่วนของเว็บ คือ จะเพิ่มตัว Filter ขึ้นมาอีกอันนึง โดยจะเป็นตัว Node เพื่อที่จะสามารถจะดูข้อมูลได้ละเอียดยิ่งขึ้น และก็จะมีการหาค่า stat เพื่อเอามาเทียบข้อมูลของเมื่อวานกับวันนี้(นั่งฟังแต่ไม่เข้าใจ:P) โดยในส่วนนี้พี่ Outsource จะเป็นคนทำ และก็จะมารวมงานอีกทีตอนท้าย แต่ที่งง คือ ที่นี่ไม่ใช้ตัว Subversion(SVN) ในการช่วยให้การเขียนโปรแกรม จากคนหลายคนทำงานได้ง่ายยิ่งขึ้น และมีการตรวจสอบ version ได้ เพราะใน Eclipse ก็มีตัว plug-in support อยู่แล้ว ^__^

[Internship True]วันที่ 21-22

ตอนนี้ก็ได้ทำเว็บจนเสร็จและ และพี่ที่ดูแลก็ OK เพราะ ต้องรอความต้องการของหัวหน้าจริงๆว่าจะให้แสดงอะไรบ้าง สิ่งที่ควรรู้คร่าวๆ เกี่ยวกับ iReport ลองทำรายงานด้วย iReport

[Internship True]วันที่ 20

วันนี้ก็ได้ลาหัวหน้า เพื่อที่จะไปรับเงิน TA และก็ไปเคลียร์ เรื่องกลุ่มโปรเจค เพราะแต่ละคนก็โยนกันไปมาในเรื่องนี้…