ความแตกต่างระหว่างการทำเหมืองข้อมูลและคลังข้อมูล

ผู้เขียน: Laura McKinney
วันที่สร้าง: 2 เมษายน 2021
วันที่อัปเดต: 13 พฤษภาคม 2024
Anonim
เหมืองข้อมูล (Data Mining) ตอนที่ 3 - คลังข้อมูล (Data Warehouse)
วิดีโอ: เหมืองข้อมูล (Data Mining) ตอนที่ 3 - คลังข้อมูล (Data Warehouse)

เนื้อหา


การขุดข้อมูลและคลังข้อมูลใช้เพื่อเก็บข้อมูลทางธุรกิจและช่วยในการตัดสินใจ แต่ทั้งการทำเหมืองข้อมูลและคลังข้อมูลมีแง่มุมที่แตกต่างกันในการทำงานกับข้อมูลขององค์กร ในอีกด้านหนึ่ง คลังข้อมูล เป็นสภาพแวดล้อมที่ข้อมูลขององค์กรรวบรวมและจัดเก็บในลักษณะรวมและสรุป ในทางกลับกัน, การขุดข้อมูล เป็นกระบวนการ ที่ใช้อัลกอริทึมในการดึงความรู้จากข้อมูลที่คุณไม่ทราบว่ามีอยู่ในฐานข้อมูล

ให้เราตรวจสอบความแตกต่างระหว่าง data mining และ data data ด้วยความช่วยเหลือของกราฟเปรียบเทียบที่แสดงด้านล่าง

  1. แผนภูมิเปรียบเทียบ
  2. คำนิยาม
  3. ความแตกต่างที่สำคัญ
  4. ข้อสรุป

แผนภูมิเปรียบเทียบ

พื้นฐานสำหรับการเปรียบเทียบการขุดข้อมูลคลังข้อมูล
ขั้นพื้นฐาน Data mining เป็นกระบวนการในการดึงหรือดึงข้อมูลที่มีความหมายจากฐานข้อมูล / คลังข้อมูลคลังข้อมูลเป็นพื้นที่เก็บข้อมูลที่เก็บข้อมูลจากหลายแหล่งภายใต้สคีมาเดียว


ความหมายของการขุดข้อมูล

การขุดข้อมูลเป็นกระบวนการที่จะ ค้นพบความรู้ซึ่งคุณ ไม่เคยคาดคิด ไปยัง มีอยู่ในฐานข้อมูลของคุณ. การใช้เครื่องมือ Query แบบดั้งเดิมคุณสามารถดึงข้อมูลที่ทราบจากข้อมูลเท่านั้น แต่การขุดดาต้าให้วิธีการแก่คุณ ดึงข้อมูลที่ซ่อนอยู่ออกจากข้อมูล. การขุดข้อมูลจะดึงข้อมูลที่มีความหมายจากฐานข้อมูลที่สามารถใช้สำหรับ การตัดสินใจ.

การค้นพบความรู้ในฐานข้อมูลที่เรียกว่า KDDการจัดแสดง ความสัมพันธ์ และ แบบแผน. ความสัมพันธ์อาจอยู่ระหว่างวัตถุสองอย่างหรือมากกว่านั้นระหว่างคุณสมบัติของวัตถุเดียวกัน รูปแบบเป็นผลลัพธ์ของการขุดข้อมูลที่แสดงลำดับของข้อมูลที่เข้าใจได้อย่างสม่ำเสมอและช่วยในการตัดสินใจ

ขั้นตอนที่เกี่ยวข้องใน KDD เช่นการค้นพบความรู้ในฐานข้อมูลสามารถสรุปได้เป็นครั้งแรก การเลือก ของชุดข้อมูลที่จะต้องดำเนินการขุดข้อมูล ถัดไปคือ ก่อนการประมวลผล ซึ่งเกี่ยวข้องกับการลบข้อมูลที่ไม่สอดคล้องกัน จากนั้นมา การแปลงข้อมูล ตำแหน่งที่ข้อมูลถูกแปลงเป็นรูปแบบที่เหมาะสมสำหรับ data mining ถัดไปคือ การขุดข้อมูลนี่คืออัลกอริทึมการขุดข้อมูลที่ใช้กับข้อมูล และในที่สุดก็, การตีความและการประเมินผล ซึ่งเกี่ยวข้องกับการแยกความสัมพันธ์หรือรูปแบบระหว่างข้อมูล


การขุดข้อมูลนั้นเหมาะสมในสภาพแวดล้อมคลังข้อมูลที่เก็บข้อมูลในลักษณะรวมและสรุป มันกลายเป็นเรื่องง่ายที่จะขุดข้อมูลในคลังข้อมูล

การกำหนดคลังข้อมูล

คลังข้อมูล เป็นสถานที่ส่วนกลางที่ให้ข้อมูล รวบรวมจากแหล่งต่าง ๆ จะถูกเก็บไว้ภายใต้สคีเดียวแบบครบวงจร. การรวบรวมข้อมูลเริ่มต้นแหล่งต่าง ๆ ขององค์กรจากนั้นทำความสะอาดและแปลงและจัดเก็บในคลังข้อมูล เมื่อข้อมูลถูกป้อนลงในคลังข้อมูลแล้วข้อมูลนั้นจะอยู่ที่นั่นเป็นเวลานานและสามารถเข้าถึงได้เกินเวลา

Data Warehouse เป็นการผสมผสานกันอย่างลงตัวของเทคโนโลยีเช่น การสร้างแบบจำลองข้อมูล, การเก็บข้อมูล, การจัดการข้อมูล, การจัดการข้อมูลเมตา, เครื่องมือในการพัฒนาจัดเก็บการจัดการ. เทคโนโลยีเหล่านี้รองรับฟังก์ชั่นเช่น การสกัดข้อมูลการแปลงข้อมูลการจัดเก็บข้อมูลให้ส่วนต่อประสานผู้ใช้สำหรับการเข้าถึงข้อมูล.

คลังข้อมูลไม่ใช่ผลิตภัณฑ์หรือซอฟต์แวร์ แต่เป็นสภาพแวดล้อมที่ให้ข้อมูลซึ่งให้ข้อมูลเช่นมุมมองแบบรวมขององค์กร คุณสามารถเข้าถึงข้อมูลปัจจุบันและข้อมูลย้อนหลังขององค์กรซึ่งช่วยในการตัดสินใจ สนับสนุนธุรกรรมที่ทำเพื่อการตัดสินใจโดยไม่กระทบต่อระบบปฏิบัติการ มันเป็นทรัพยากรที่มีความยืดหยุ่นในการรับข้อมูลเชิงกลยุทธ์

  1. มีความแตกต่างพื้นฐานที่แยก data mining และ data warehousing ที่ data mining เป็นกระบวนการของการแยกข้อมูลที่มีความหมายจากฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล อย่างไรก็ตามคลังข้อมูลให้สภาพแวดล้อมที่ข้อมูลถูกเก็บไว้ในรูปแบบบูรณาการซึ่งช่วยให้การขุดข้อมูลง่ายขึ้นเพื่อดึงข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น

สรุป:

การขุดข้อมูลสามารถทำได้ก็ต่อเมื่อมีฐานข้อมูลขนาดใหญ่ที่รวมเข้าด้วยกันแล้วเช่นคลังข้อมูล ดังนั้นคลังข้อมูลจะต้องเสร็จสิ้นก่อนทำการขุดข้อมูล คลังข้อมูลจะต้องมีข้อมูลในรูปแบบที่บูรณาการเพื่อให้การขุดข้อมูลสามารถดึงความรู้ออกมาได้อย่างมีประสิทธิภาพ