ความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติ

ผู้เขียน: Laura McKinney
วันที่สร้าง: 1 เมษายน 2021
วันที่อัปเดต: 13 พฤษภาคม 2024
Anonim
Difference Between Fact Table and Dimension Table - Interview questions
วิดีโอ: Difference Between Fact Table and Dimension Table - Interview questions

เนื้อหา


ตารางข้อเท็จจริงและตารางมิติเป็นปัจจัยสำคัญในการสร้าง สคี. บันทึกของตารางข้อเท็จจริงคือการรวมกันของแอตทริบิวต์จากตารางมิติที่แตกต่างกัน ตารางข้อเท็จจริงช่วยให้ผู้ใช้สามารถวิเคราะห์มิติทางธุรกิจที่ช่วยเขาในการตัดสินใจในการปรับปรุงธุรกิจของเขา ในทางกลับกันตารางมิติช่วยตารางข้อเท็จจริงเพื่อรวบรวมมิติตามมาตรการที่จะต้องดำเนินการ

จุดที่แตกต่างตารางข้อเท็จจริงและตารางมิติคือ ตารางมิติ มีแอททริบิวที่ใช้ในการวัด ตารางข้อเท็จจริง. มีปัจจัยอื่น ๆ ที่สร้างความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติข้อมูลเพื่อดูพวกเขามาดูแผนภูมิเปรียบเทียบด้านล่าง

  1. แผนภูมิเปรียบเทียบ
  2. คำนิยาม
  3. รูป
  4. ความแตกต่างที่สำคัญ
  5. ข้อสรุป

แผนภูมิเปรียบเทียบ

พื้นฐานสำหรับการเปรียบเทียบตารางข้อเท็จจริงตารางมิติ
ขั้นพื้นฐานตารางข้อเท็จจริงประกอบด้วยการวัดตามคุณลักษณะของตารางมิติ ตารางมิติข้อมูลประกอบด้วยแอตทริบิวต์ที่ตารางความเป็นจริงคำนวณเมตริก
คุณสมบัติและบันทึก ตารางข้อเท็จจริงประกอบด้วยแอตทริบิวต์น้อยลงและบันทึกเพิ่มเติมตารางส่วนข้อมูลมีคุณลักษณะมากขึ้นและบันทึกน้อยลง
ขนาดโต๊ะตารางข้อเท็จจริงเติบโตในแนวตั้งตารางมิติเติบโตในแนวนอน
สำคัญ ตารางข้อเท็จจริงประกอบด้วยคีย์หลักซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมด แต่ละตารางมิติประกอบด้วยคีย์หลัก
การสร้างตารางข้อเท็จจริงสามารถสร้างได้เมื่อตารางมิติเสร็จสมบูรณ์เท่านั้นตารางมิติจำเป็นต้องสร้างขึ้นก่อน
schema สคีมามีจำนวนตารางข้อเท็จจริงน้อยกว่าสคีมามีตารางมิติจำนวนมากขึ้น
แอตทริบิวต์ตารางข้อเท็จจริงสามารถมีข้อมูลเป็นตัวเลขและรูปแบบ ualตารางมิติประกอบด้วยแอตทริบิวต์ในรูปแบบ ual เสมอ


คำจำกัดความของตารางข้อเท็จจริง

ตารางข้อเท็จจริงเป็นตารางที่มี วัด ตามคุณสมบัติของตารางมิติ สามารถมีข้อมูลในระดับต่ำสุดที่เป็นไปได้ ตารางข้อเท็จจริงบางอย่างมีข้อมูลสรุปที่เรียกว่า ตารางข้อเท็จจริงรวม. ตารางความจริงเกือบจะมี ประทับวันที่ ข้อมูล. ให้เราคุยถึงลักษณะของตารางข้อเท็จจริง

รหัสตัดแบ่ง
ตารางข้อเท็จจริงประกอบด้วยคีย์ Concatenated ซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมด กุญแจสำคัญที่ต่อกันของตารางความเป็นจริงจะต้องระบุแถวในตารางข้อเท็จจริง

Data Grain
ข้อมูลข้าวแสดงให้เห็นว่าการจัดเก็บข้อมูลการวัดในตารางความเป็นจริงลึก Data data ต้องอยู่ในระดับสูงสุดที่เป็นไปได้

มาตรการเพิ่มเติม
คุณสมบัติของตารางข้อเท็จจริงสามารถ สารเติมแต่งอย่างเต็มที่ หรือ กึ่งสารเติมแต่ง. มาตรการเติมเต็มอย่างสมบูรณ์คือมาตรการที่สามารถสรุปได้ง่ายสำหรับทุกมิติในตารางข้อเท็จจริง ยกตัวอย่างเช่นปริมาณ _ordered เป็นคุณลักษณะที่สามารถสรุปได้สำหรับทุกมิติ เช่นเดียวกับที่เราสามารถนำปริมาณทั้งหมดออกมาสำหรับลูกค้าเฉพาะภูมิภาควันที่ยี่ห้อ ฯลฯ มาตรการแบบกึ่งเสริมคือมาตรการที่สามารถสรุปรวมตามมิติข้อมูลบางส่วนของตาราง แต่ไม่ใช่มิติทั้งหมด เช่นยอดคงเหลือไม่สามารถสรุปรวมตามมิติเวลาตามที่เปลี่ยนแปลงตลอดเวลา


ข้อมูลกระจัดกระจาย
บางครั้งเราอาจเห็นบันทึกในตารางข้อเท็จจริงที่มี คุณสมบัติที่มี มาตรการว่างเปล่า. ตัวอย่างเช่นอาจไม่มีการสั่งซื้อใด ๆ ในวันหยุด ดังนั้นแอตทริบิวต์สำหรับวันนี้จะมีค่าเป็นศูนย์ เราไม่จำเป็นต้องจัดเก็บการวัดสำหรับบันทึกประเภทนี้เนื่องจากไม่ได้ให้ข้อมูลใด ๆ

ขนาดที่เสื่อมโทรม
บางครั้งคุณอาจพบมิติบางอย่างในตารางข้อเท็จจริงซึ่งไม่ได้เติมแต่งเลย ตัวอย่างเช่น order_number, customer_id คุณไม่สามารถเพิ่มมิติข้อมูลประเภทนี้ได้ อย่างไรก็ตามในกรณีที่คุณต้องการค้นหาคำสั่งซื้อจากลูกค้ารายใดรายหนึ่งในเดือนนี้ จากนั้นคุณจะต้องมี customer_id เพื่อเชื่อมโยงการค้นหาของคุณ ชนิดเหล่านี้หากเรียกคุณลักษณะหรือมิติของตารางข้อเท็จจริง มิติที่เสื่อมโทรม.

คำจำกัดความของ Dimension Table

Dimension Table เป็นองค์ประกอบสำคัญสำหรับตารางเริ่มต้น Schema.A ขนาดประกอบด้วยคุณลักษณะที่แสดงมิติพร้อมกับการวัดที่นำมาใช้ในตารางความเป็นจริง นอกจากนี้เราจะพูดถึงคุณลักษณะบางอย่างของตารางมิติ

คุณสมบัติและกุญแจ
ตารางทุกมิติจะต้องมี คีย์หลัก ที่ระบุแต่ละระเบียนของตารางโดยไม่ซ้ำกัน เป็นที่สังเกตกันโดยทั่วไปว่าตารางมิติประกอบด้วยคุณลักษณะมากมาย ดังนั้นดูเหมือนว่าจะเป็น กว้าง เช่นเมื่อคุณสร้างตารางส่วนข้อมูลคุณจะพบว่ามันกระจายออกไป แนวนอน.

ค่าคุณสมบัติ
ค่าของแอ็ตทริบิวต์ในตารางมิติไม่ค่อยเป็นตัวเลขส่วนใหญ่คุณจะพบค่าในแอททริบิว รูปแบบ ual. ตัวอย่างเช่นชื่อผลิตภัณฑ์แบรนด์หมวดหมู่หมวดหมู่ย่อย ฯลฯ

ความสัมพันธ์ระหว่างคุณสมบัติ
บ่อยครั้งที่คุณสามารถสังเกตเห็นแอตทริบิวต์ที่คุณเจอในตารางมิติไม่เกี่ยวข้องโดยตรง เช่นเดียวกับ Product_brand ไม่ต้องทำอะไรกับ package_date แต่ทั้งคู่ก็อาจเป็นคุณลักษณะของตารางส่วนข้อมูลผลิตภัณฑ์

normalization
ตารางมิติคือ ไม่ ควรจะเป็น ปกติ. นี่เป็นเพราะ normalizing ตารางจะสร้างตารางกลางจำนวนมาก เมื่อแบบสอบถามหยิบแอตทริบิวต์จากตารางมิติและกู้คืนการวัดตามนั้นสำหรับตารางข้อเท็จจริงแบบสอบถามจะต้องผ่านตารางกลางเหล่านั้นซึ่งไม่มีประสิทธิภาพ ดังนั้นตารางมิติข้อมูลจะไม่ถูกทำให้เป็นมาตรฐาน

เจาะลงกลิ้งขึ้น
แอททริบิวของตารางส่วนข้อมูลช่วยให้คุณสามารถรับรายละเอียดโดยการข้ามจากระดับที่สูงขึ้นของแอททริบิวต์รวมไปยังแอททริบิวระดับล่าง ตัวอย่างเช่นหากคุณต้องการค้นหายอดขายทั้งหมดในภูมิภาคคุณสามารถเจาะลึกเพื่อค้นหายอดขายตามรัฐเมืองรหัสไปรษณีย์ คุณสามารถม้วนขึ้นเพื่อหายอดขายรวมก่อนจากไปรษณีย์จากเมืองแล้วระบุ

หลายลำดับชั้น
บ่อยครั้งที่ตารางมิติมีหลายลำดับชั้น ตัวอย่างเช่นเรามีตารางมิติผลิตภัณฑ์สำหรับห้างสรรพสินค้า ขณะนี้เรามีแผนกการตลาดและแผนกบัญชีสองแผนก

ฝ่ายการตลาดจะเจาะลึกลงในคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แน่นอนเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง

ในทางกลับกันแผนกบัญชีจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แตกต่างกันเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง

ดังนั้นตารางมิติต้องมีหลายลำดับชั้นหรือระดับของการรวมคุณลักษณะเพื่อให้ผู้ใช้เจาะลึกตามลำดับชั้นหลาย ๆ

ประวัติ
แม้ว่าตารางขนาดจะมีแอตทริบิวต์มากเกินไป แต่ก็มีบันทึกน้อยกว่า

  1. ตารางข้อเท็จจริงประกอบด้วยการวัดตามมิติ / คุณลักษณะของตารางมิติ
  2. ตารางข้อเท็จจริงประกอบด้วยระเบียนมากขึ้นและแอตทริบิวต์น้อยลงเมื่อเปรียบเทียบกับตารางมิติในขณะที่ตารางมิติประกอบด้วยแอตทริบิวต์เพิ่มเติมและบันทึกน้อยลง
  3. ขนาดตารางของตารางข้อเท็จจริงเพิ่มขึ้นในแนวตั้งในขณะที่ขนาดตารางของตารางมิติเติบโตในแนวนอน
  4. แต่ละตารางมิติประกอบด้วยคีย์หลักเพื่อระบุแต่ละระเบียนในตารางในขณะที่ตารางข้อเท็จจริงประกอบด้วยคีย์ที่ต่อกันซึ่งเป็นการรวมกันของคีย์หลักทั้งหมดของตารางมิติทั้งหมด
  5. ต้องบันทึกตารางมิติข้อมูลก่อนการสร้างตารางข้อเท็จจริง
  6. สคีมามีตารางข้อเท็จจริงน้อยลง แต่มีมิติข้อมูลเพิ่มเติม
  7. แอตทริบิวต์ในตารางข้อเท็จจริงเป็นตัวเลขเช่นเดียวกับ ual แต่คุณลักษณะของตารางมิติมีแอตทริบิวต์ ual เท่านั้น

สรุป:

ทั้งสองมีความสำคัญเท่าเทียมกันสำหรับการสร้าง schema แต่ตารางมิติต้องถูกบันทึกก่อนตารางข้อเท็จจริง เนื่องจากเป็นไปไม่ได้ที่จะสร้างตารางข้อเท็จจริงโดยไม่ต้องมีมิติ