บทความตอนนี้จะขยายมาจากที่ไปฟังสรุปงาน Big Data Conference ครับ จากที่ผมเคยได้บินคำว่า Big Dataมาตั้งแต่ตอนสมัยเรียนปี 4 ผ่านมาแล้ว 3 ปี เห็นคนพูดว่า Big Data อะไรอะไรก็ใหญ่ไปหมด แต่เราไม่รู้มันใหญ่แค่ไหน ถ้ามันไม่ได้เริ่มจากสิ่งเล็กๆ ใช่ครับ Big Data มันใหญ่ได้ ก็ เพราะ มี Small Data
แล้ว Small Data มัน คือ อะไร ไม่เคยได้ยินเลยยย จริงๆแล้วมันอยู่รอบๆตัวเรา เจ้า Small Data เนี่ย มันมาตั้งแต่ที่มีฐานข้อมูลในยุคที่ระบบไฟล์ มาจนถึง Relational Database (อันนี้ฮิตที่สุดครับ แม้ว่าจะมีหลายแบบมาใหม่ อาทิ เช่น Object Oriented Database เป็นต้น) ที่นี้เราลองมาดูกันหน่อยว่า Small Data มันต่างจาก Big Data อย่างไรครับ
Category | Small Data | Big Data |
---|---|---|
Data Sources (แหล่งข้อมูล) | Transaction แหล่งข้อมูลจากระบบงานต่างๆ | แหล่งข้อมูลนอกเหนือจากระบบงานที่มี เช่น Log, Social Data |
Volume (จำนวนข้อมูล) | Megabytes (106) Gigabytes (109) Terabytes (1012) | Terabytes (1012) Petabytes (1015) Exabytes (1018) Zettabytes (1021) |
Velocity (ความต้องการใช้ข้อมูล) | Batch, Periodic, Near Real | Real Time |
Variety (ความหลากหลาย) | Structure Data | Structure Data และ Unstructure Data |
Value (คุณค่าที่ได้รับ) | Analysis, Reporting หรือ Business Intelligence | Predicts (ทำนายอนาคต), หรือ Insight ใช้ Data Mining ช่วย |
View (การแสดงผล) | แสดงข้อมูลดิบ โดยไม่มีการสังเคราะห์ อาจจะเป็นการนำอมูลมาแสดงผล โดยการพลิกมุม รายงานขายตามประเภทสินค้า หรือ ตามภูมิภาค | แสดงข้อมูลที่เกิดจากการสังเคราะห์ เช่น เกิดจากการทำ Data Mining เพื่อหาความเกี่ยวข้อง หาข้อมูลที่ซ่อนอยู่ |
ทุกวันนี้ เราสนใจ Small Data ได้ดีหรือยัง ก่อนทีจะข้ามไปสู่ Big Data
Discover more from naiwaen@DebuggingSoft
Subscribe to get the latest posts sent to your email.