ความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติ
เนื้อหา
ตารางข้อเท็จจริงและตารางมิติเป็นปัจจัยสำคัญในการสร้าง สคี. บันทึกของตารางข้อเท็จจริงคือการรวมกันของแอตทริบิวต์จากตารางมิติที่แตกต่างกัน ตารางข้อเท็จจริงช่วยให้ผู้ใช้สามารถวิเคราะห์มิติทางธุรกิจที่ช่วยเขาในการตัดสินใจในการปรับปรุงธุรกิจของเขา ในทางกลับกันตารางมิติช่วยตารางข้อเท็จจริงเพื่อรวบรวมมิติตามมาตรการที่จะต้องดำเนินการ
จุดที่แตกต่างตารางข้อเท็จจริงและตารางมิติคือ ตารางมิติ มีแอททริบิวที่ใช้ในการวัด ตารางข้อเท็จจริง. มีปัจจัยอื่น ๆ ที่สร้างความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติข้อมูลเพื่อดูพวกเขามาดูแผนภูมิเปรียบเทียบด้านล่าง
- แผนภูมิเปรียบเทียบ
- คำนิยาม
- รูป
- ความแตกต่างที่สำคัญ
- ข้อสรุป
แผนภูมิเปรียบเทียบ
พื้นฐานสำหรับการเปรียบเทียบ | ตารางข้อเท็จจริง | ตารางมิติ |
---|---|---|
ขั้นพื้นฐาน | ตารางข้อเท็จจริงประกอบด้วยการวัดตามคุณลักษณะของตารางมิติ | ตารางมิติข้อมูลประกอบด้วยแอตทริบิวต์ที่ตารางความเป็นจริงคำนวณเมตริก |
คุณสมบัติและบันทึก | ตารางข้อเท็จจริงประกอบด้วยแอตทริบิวต์น้อยลงและบันทึกเพิ่มเติม | ตารางส่วนข้อมูลมีคุณลักษณะมากขึ้นและบันทึกน้อยลง |
ขนาดโต๊ะ | ตารางข้อเท็จจริงเติบโตในแนวตั้ง | ตารางมิติเติบโตในแนวนอน |
สำคัญ | ตารางข้อเท็จจริงประกอบด้วยคีย์หลักซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมด | แต่ละตารางมิติประกอบด้วยคีย์หลัก |
การสร้าง | ตารางข้อเท็จจริงสามารถสร้างได้เมื่อตารางมิติเสร็จสมบูรณ์เท่านั้น | ตารางมิติจำเป็นต้องสร้างขึ้นก่อน |
schema | สคีมามีจำนวนตารางข้อเท็จจริงน้อยกว่า | สคีมามีตารางมิติจำนวนมากขึ้น |
แอตทริบิวต์ | ตารางข้อเท็จจริงสามารถมีข้อมูลเป็นตัวเลขและรูปแบบ ual | ตารางมิติประกอบด้วยแอตทริบิวต์ในรูปแบบ ual เสมอ |
คำจำกัดความของตารางข้อเท็จจริง
ตารางข้อเท็จจริงเป็นตารางที่มี วัด ตามคุณสมบัติของตารางมิติ สามารถมีข้อมูลในระดับต่ำสุดที่เป็นไปได้ ตารางข้อเท็จจริงบางอย่างมีข้อมูลสรุปที่เรียกว่า ตารางข้อเท็จจริงรวม. ตารางความจริงเกือบจะมี ประทับวันที่ ข้อมูล. ให้เราคุยถึงลักษณะของตารางข้อเท็จจริง
รหัสตัดแบ่ง
ตารางข้อเท็จจริงประกอบด้วยคีย์ Concatenated ซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมด กุญแจสำคัญที่ต่อกันของตารางความเป็นจริงจะต้องระบุแถวในตารางข้อเท็จจริง
Data Grain
ข้อมูลข้าวแสดงให้เห็นว่าการจัดเก็บข้อมูลการวัดในตารางความเป็นจริงลึก Data data ต้องอยู่ในระดับสูงสุดที่เป็นไปได้
มาตรการเพิ่มเติม
คุณสมบัติของตารางข้อเท็จจริงสามารถ สารเติมแต่งอย่างเต็มที่ หรือ กึ่งสารเติมแต่ง. มาตรการเติมเต็มอย่างสมบูรณ์คือมาตรการที่สามารถสรุปได้ง่ายสำหรับทุกมิติในตารางข้อเท็จจริง ยกตัวอย่างเช่นปริมาณ _ordered เป็นคุณลักษณะที่สามารถสรุปได้สำหรับทุกมิติ เช่นเดียวกับที่เราสามารถนำปริมาณทั้งหมดออกมาสำหรับลูกค้าเฉพาะภูมิภาควันที่ยี่ห้อ ฯลฯ มาตรการแบบกึ่งเสริมคือมาตรการที่สามารถสรุปรวมตามมิติข้อมูลบางส่วนของตาราง แต่ไม่ใช่มิติทั้งหมด เช่นยอดคงเหลือไม่สามารถสรุปรวมตามมิติเวลาตามที่เปลี่ยนแปลงตลอดเวลา
ข้อมูลกระจัดกระจาย
บางครั้งเราอาจเห็นบันทึกในตารางข้อเท็จจริงที่มี คุณสมบัติที่มี มาตรการว่างเปล่า. ตัวอย่างเช่นอาจไม่มีการสั่งซื้อใด ๆ ในวันหยุด ดังนั้นแอตทริบิวต์สำหรับวันนี้จะมีค่าเป็นศูนย์ เราไม่จำเป็นต้องจัดเก็บการวัดสำหรับบันทึกประเภทนี้เนื่องจากไม่ได้ให้ข้อมูลใด ๆ
ขนาดที่เสื่อมโทรม
บางครั้งคุณอาจพบมิติบางอย่างในตารางข้อเท็จจริงซึ่งไม่ได้เติมแต่งเลย ตัวอย่างเช่น order_number, customer_id คุณไม่สามารถเพิ่มมิติข้อมูลประเภทนี้ได้ อย่างไรก็ตามในกรณีที่คุณต้องการค้นหาคำสั่งซื้อจากลูกค้ารายใดรายหนึ่งในเดือนนี้ จากนั้นคุณจะต้องมี customer_id เพื่อเชื่อมโยงการค้นหาของคุณ ชนิดเหล่านี้หากเรียกคุณลักษณะหรือมิติของตารางข้อเท็จจริง มิติที่เสื่อมโทรม.
คำจำกัดความของ Dimension Table
Dimension Table เป็นองค์ประกอบสำคัญสำหรับตารางเริ่มต้น Schema.A ขนาดประกอบด้วยคุณลักษณะที่แสดงมิติพร้อมกับการวัดที่นำมาใช้ในตารางความเป็นจริง นอกจากนี้เราจะพูดถึงคุณลักษณะบางอย่างของตารางมิติ
คุณสมบัติและกุญแจ
ตารางทุกมิติจะต้องมี คีย์หลัก ที่ระบุแต่ละระเบียนของตารางโดยไม่ซ้ำกัน เป็นที่สังเกตกันโดยทั่วไปว่าตารางมิติประกอบด้วยคุณลักษณะมากมาย ดังนั้นดูเหมือนว่าจะเป็น กว้าง เช่นเมื่อคุณสร้างตารางส่วนข้อมูลคุณจะพบว่ามันกระจายออกไป แนวนอน.
ค่าคุณสมบัติ
ค่าของแอ็ตทริบิวต์ในตารางมิติไม่ค่อยเป็นตัวเลขส่วนใหญ่คุณจะพบค่าในแอททริบิว รูปแบบ ual. ตัวอย่างเช่นชื่อผลิตภัณฑ์แบรนด์หมวดหมู่หมวดหมู่ย่อย ฯลฯ
ความสัมพันธ์ระหว่างคุณสมบัติ
บ่อยครั้งที่คุณสามารถสังเกตเห็นแอตทริบิวต์ที่คุณเจอในตารางมิติไม่เกี่ยวข้องโดยตรง เช่นเดียวกับ Product_brand ไม่ต้องทำอะไรกับ package_date แต่ทั้งคู่ก็อาจเป็นคุณลักษณะของตารางส่วนข้อมูลผลิตภัณฑ์
normalization
ตารางมิติคือ ไม่ ควรจะเป็น ปกติ. นี่เป็นเพราะ normalizing ตารางจะสร้างตารางกลางจำนวนมาก เมื่อแบบสอบถามหยิบแอตทริบิวต์จากตารางมิติและกู้คืนการวัดตามนั้นสำหรับตารางข้อเท็จจริงแบบสอบถามจะต้องผ่านตารางกลางเหล่านั้นซึ่งไม่มีประสิทธิภาพ ดังนั้นตารางมิติข้อมูลจะไม่ถูกทำให้เป็นมาตรฐาน
เจาะลงกลิ้งขึ้น
แอททริบิวของตารางส่วนข้อมูลช่วยให้คุณสามารถรับรายละเอียดโดยการข้ามจากระดับที่สูงขึ้นของแอททริบิวต์รวมไปยังแอททริบิวระดับล่าง ตัวอย่างเช่นหากคุณต้องการค้นหายอดขายทั้งหมดในภูมิภาคคุณสามารถเจาะลึกเพื่อค้นหายอดขายตามรัฐเมืองรหัสไปรษณีย์ คุณสามารถม้วนขึ้นเพื่อหายอดขายรวมก่อนจากไปรษณีย์จากเมืองแล้วระบุ
หลายลำดับชั้น
บ่อยครั้งที่ตารางมิติมีหลายลำดับชั้น ตัวอย่างเช่นเรามีตารางมิติผลิตภัณฑ์สำหรับห้างสรรพสินค้า ขณะนี้เรามีแผนกการตลาดและแผนกบัญชีสองแผนก
ฝ่ายการตลาดจะเจาะลึกลงในคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แน่นอนเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง
ในทางกลับกันแผนกบัญชีจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แตกต่างกันเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง
ดังนั้นตารางมิติต้องมีหลายลำดับชั้นหรือระดับของการรวมคุณลักษณะเพื่อให้ผู้ใช้เจาะลึกตามลำดับชั้นหลาย ๆ
ประวัติ
แม้ว่าตารางขนาดจะมีแอตทริบิวต์มากเกินไป แต่ก็มีบันทึกน้อยกว่า
- ตารางข้อเท็จจริงประกอบด้วยการวัดตามมิติ / คุณลักษณะของตารางมิติ
- ตารางข้อเท็จจริงประกอบด้วยระเบียนมากขึ้นและแอตทริบิวต์น้อยลงเมื่อเปรียบเทียบกับตารางมิติในขณะที่ตารางมิติประกอบด้วยแอตทริบิวต์เพิ่มเติมและบันทึกน้อยลง
- ขนาดตารางของตารางข้อเท็จจริงเพิ่มขึ้นในแนวตั้งในขณะที่ขนาดตารางของตารางมิติเติบโตในแนวนอน
- แต่ละตารางมิติประกอบด้วยคีย์หลักเพื่อระบุแต่ละระเบียนในตารางในขณะที่ตารางข้อเท็จจริงประกอบด้วยคีย์ที่ต่อกันซึ่งเป็นการรวมกันของคีย์หลักทั้งหมดของตารางมิติทั้งหมด
- ต้องบันทึกตารางมิติข้อมูลก่อนการสร้างตารางข้อเท็จจริง
- สคีมามีตารางข้อเท็จจริงน้อยลง แต่มีมิติข้อมูลเพิ่มเติม
- แอตทริบิวต์ในตารางข้อเท็จจริงเป็นตัวเลขเช่นเดียวกับ ual แต่คุณลักษณะของตารางมิติมีแอตทริบิวต์ ual เท่านั้น
สรุป:
ทั้งสองมีความสำคัญเท่าเทียมกันสำหรับการสร้าง schema แต่ตารางมิติต้องถูกบันทึกก่อนตารางข้อเท็จจริง เนื่องจากเป็นไปไม่ได้ที่จะสร้างตารางข้อเท็จจริงโดยไม่ต้องมีมิติ