Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ข้อมูลประเภทใดที่สามารถขุดได้?


การขุดข้อมูลกำหนดการแยกหรือความรู้การขุดจากข้อมูลจำนวนมาก โดยทั่วไปแล้วการขุดข้อมูลจะใช้ในสถานที่ที่มีการบันทึกและประมวลผลข้อมูลจำนวนมาก ตัวอย่างเช่น ระบบธนาคารใช้การขุดข้อมูลเพื่อบันทึกข้อมูลจำนวนมากซึ่งมีการประมวลผลอย่างต่อเนื่อง

ในการทำเหมืองข้อมูล รูปแบบข้อมูลที่ซ่อนอยู่จะถูกพิจารณาตามหมวดหมู่ต่างๆ ให้เป็นข้อมูลที่มีประโยชน์ ข้อมูลนี้ถูกรวบรวมในพื้นที่รวมถึงคลังข้อมูลสำหรับการวิเคราะห์ และดำเนินการอัลกอริธึมการทำเหมืองข้อมูล ข้อมูลนี้อำนวยความสะดวกในการสร้างการตัดสินใจที่มีประสิทธิภาพซึ่งลดมูลค่าและเพิ่มรายได้

แอปพลิเคชั่นการขุดข้อมูลมีหลายประเภทที่ใช้สำหรับข้อมูลดังต่อไปนี้ -

  • ฐานข้อมูลเชิงสัมพันธ์ − ระบบฐานข้อมูลเรียกอีกอย่างว่าระบบจัดการฐานข้อมูล ประกอบด้วยชุดข้อมูลที่เกี่ยวข้องกัน ซึ่งเรียกว่าฐานข้อมูล และชุดโปรแกรมซอฟต์แวร์เพื่อจัดการและเข้าถึงข้อมูล

ฐานข้อมูลเชิงสัมพันธ์คือชุดของตาราง ซึ่งแต่ละตารางได้รับอนุญาตให้ใช้ชื่อเฉพาะ แต่ละตารางมีชุดของแอตทริบิวต์ (คอลัมน์หรือเขตข้อมูล) และโดยทั่วไปจะจัดเก็บ tuples ชุดใหญ่ (ระเบียนหรือแถว) ทูเพิลแต่ละตัวในตารางเชิงสัมพันธ์กำหนดอ็อบเจ็กต์ที่ระบุโดยคีย์เฉพาะและแสดงด้วยชุดของค่าแอททริบิวต์ แบบจำลองข้อมูลเชิงความหมายรวมถึงแบบจำลองข้อมูลความสัมพันธ์เอนทิตี (ER) ถูกสร้างขึ้นโดยทั่วไปสำหรับฐานข้อมูลเชิงสัมพันธ์ แบบจำลองข้อมูล ER กำหนดฐานข้อมูลเป็นชุดของเอนทิตีและความสัมพันธ์

  • ฐานข้อมูลธุรกรรม − ฐานข้อมูลธุรกรรมรวมถึงไฟล์ที่แต่ละเร็กคอร์ดกำหนดธุรกรรม ธุรกรรมโดยทั่วไปประกอบด้วยหมายเลขประจำตัวของธุรกรรมที่ไม่ซ้ำกัน (รหัสทรานส์) และรายการของรายการที่สร้างธุรกรรม (เช่น รายการที่ซื้อในร้านค้า)

ฐานข้อมูลธุรกรรมสามารถมีตารางเพิ่มเติมที่เกี่ยวข้องได้ ซึ่งรวมถึงข้อมูลอื่นๆ เกี่ยวกับการขาย รวมถึงวันที่ทำธุรกรรม หมายเลขรหัสลูกค้า หมายเลข ID ของพนักงานขาย และสาขาที่มีการขาย เป็นต้น

  • ฐานข้อมูลเชิงวัตถุ − ฐานข้อมูลเชิงวัตถุถูกประกอบขึ้นโดยใช้แบบจำลองข้อมูลเชิงวัตถุ โมเดลนี้สานต่อโมเดลเชิงสัมพันธ์โดยสนับสนุนชนิดข้อมูลที่สมบูรณ์สำหรับการจัดการออบเจกต์ที่ซับซ้อนและการวางแนวของออบเจกต์

  • ฐานข้อมูลชั่วคราว − โดยทั่วไปฐานข้อมูลชั่วคราวจะจัดเก็บข้อมูลเชิงสัมพันธ์ที่มีคุณลักษณะที่เกี่ยวข้องกับเวลา คุณลักษณะเหล่านี้สามารถรวมการประทับเวลาได้หลายครั้ง โดยแต่ละรายการมีความหมายหลายอย่าง

  • ฐานข้อมูลลำดับ − ฐานข้อมูลของซีเควนซ์จะจัดเก็บลำดับของเหตุการณ์ที่ได้รับคำสั่ง โดยมีหรือไม่มีแนวคิดเกี่ยวกับเวลาตามข้อเท็จจริง ตัวอย่างเช่น ลำดับการซื้อของลูกค้า กระแสการคลิกเว็บ และลำดับทางชีวภาพ

  • ฐานข้อมูลอนุกรมเวลา − ฐานข้อมูลอนุกรมเวลาจัดเก็บลำดับของค่าหรือเหตุการณ์ที่เข้าถึงผ่านการวัดเวลาซ้ำๆ (เช่น รายชั่วโมง รายวัน รายสัปดาห์) ตัวอย่างประกอบด้วยข้อมูลที่รวบรวมจากตลาดหลักทรัพย์ การควบคุมสต็อก และการวัดปรากฏการณ์ทางธรรมชาติ (เช่น อุณหภูมิและลม)