Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

เทคนิคของ Discretization and Concept Hierarchy Generation สำหรับข้อมูลตามหมวดหมู่คืออะไร


ข้อมูลหมวดหมู่เป็นข้อมูลที่ไม่ต่อเนื่อง แอตทริบิวต์ตามหมวดหมู่มีค่าคงที่จำนวนคงที่ โดยไม่มีการจัดลำดับระหว่างค่าที่เกี่ยวข้องกับพื้นที่ทางภูมิศาสตร์ หมวดหมู่งาน และประเภทรายการ มีวิธีการต่างๆ ในการสร้างลำดับชั้นแนวคิดสำหรับข้อมูลที่เป็นหมวดหมู่ดังนี้ −

  • ข้อกำหนดของการเรียงลำดับแอตทริบิวต์บางส่วนอย่างชัดเจนที่ระดับสคีมาโดยผู้ใช้หรือผู้เชี่ยวชาญ − ลำดับชั้นของแนวคิดสำหรับคุณลักษณะหรือมิติที่จัดหมวดหมู่โดยทั่วไปประกอบด้วยกลุ่มของคุณลักษณะ ผู้ใช้หรือผู้เชี่ยวชาญสามารถแสดงลำดับชั้นของแนวคิดได้โดยการกำหนดการเรียงลำดับแอตทริบิวต์บางส่วนหรือทั้งหมดที่ระดับสคีมา

ตัวอย่างเช่น ฐานข้อมูลเชิงสัมพันธ์หรือพื้นที่มิติของคลังข้อมูลสามารถรวมทีมแอตทริบิวต์ต่อไปนี้ได้ เช่น ถนน เมือง จังหวัดหรือรัฐ และประเทศ ลำดับชั้นสามารถแสดงได้โดยการกำหนดลำดับโดยรวมระหว่างแอตทริบิวต์เหล่านี้ที่ระดับสคีมา รวมถึงถนน <เมือง <จังหวัด หรือ รัฐ <ประเทศ

  • การระบุส่วนหนึ่งของลำดับชั้นโดยการจัดกลุ่มข้อมูลที่ชัดเจน − นี่คือคำจำกัดความด้วยตนเองของส่วนหนึ่งของลำดับชั้นแนวคิด ในฐานข้อมูลสูง การแสดงลำดับชั้นของแนวคิดทั้งหมดด้วยการแจงนับค่าที่ชัดเจนนั้นไม่สมจริง ในทางตรงกันข้าม มันสามารถแสดงการจัดกลุ่มที่ชัดเจนสำหรับข้อมูลระดับกลางส่วนเล็กๆ ได้

  • การระบุชุดแอตทริบิวต์ แต่ไม่ใช่การเรียงลำดับบางส่วน − ผู้ใช้สามารถอธิบายชุดของแอตทริบิวต์ที่สร้างลำดับชั้นของแนวคิดได้ แต่กำจัดการระบุการเรียงลำดับบางส่วนอย่างชัดเจน ระบบสามารถพยายามสร้างลำดับแอตทริบิวต์โดยอัตโนมัติเพื่อสร้างลำดับชั้นแนวคิดที่มีความหมาย

ขึ้นอยู่กับการสังเกตนี้ ลำดับชั้นแนวคิดสามารถสร้างขึ้นได้โดยอัตโนมัติตามค่าที่แตกต่างกันหลายค่าต่อแอตทริบิวต์ในชุดแอตทริบิวต์ที่กำหนด แอตทริบิวต์ที่มีค่าที่แตกต่างกันมากที่สุดจะอยู่ที่ระดับต่ำสุดของลำดับชั้น ยิ่งค่าที่แตกต่างกันหลายค่าที่แอตทริบิวต์มีค่าต่ำเท่าใด ค่านั้นก็จะยิ่งอยู่ในลำดับชั้นของแนวคิดที่สร้างขึ้น กฎฮิวริสติกใช้ได้ดีในบางกรณี ผู้ใช้หรือผู้เชี่ยวชาญสามารถใช้การสลับหรือปรับเปลี่ยนระดับท้องถิ่นบางอย่างได้ เมื่อจำเป็น หลังจากวิเคราะห์ลำดับชั้นที่สร้างขึ้นแล้ว

  • ข้อกำหนดของแอตทริบิวต์เพียงบางส่วนเท่านั้น − ผู้ใช้อาจมีแนวคิดที่คลุมเครือเกี่ยวกับสิ่งที่จำเป็นต้องรวมอยู่ในลำดับชั้น ตัวอย่างเช่น ชื่อผู้ใช้สามารถระบุได้เฉพาะชื่อและนามสกุลเท่านั้น และไม่รวมชื่อกลาง เป็นลำดับชั้นที่ระบุบางส่วนดังกล่าวได้รับการจัดการโดยการติดตั้งความหมายของข้อมูลในการออกแบบฐานข้อมูลสำหรับการตรึงแอตทริบิวต์ไว้ด้วยกันด้วยการเชื่อมต่อแบบความหมายที่รวดเร็ว