Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

กฎของ Attribute Generalization คืออะไร?


ลักษณะทั่วไปของแอตทริบิวต์ขึ้นอยู่กับกฎต่อไปนี้:หากมีการรวบรวมค่าที่แตกต่างกันจำนวนมากสำหรับแอตทริบิวต์ในความสัมพันธ์การทำงานดั้งเดิม และมีกลุ่มของตัวดำเนินการการวางนัยทั่วไปในแอตทริบิวต์ ดังนั้นตัวดำเนินการการวางนัยทั่วไปควรเลือกใช้กับแอตทริบิวต์ .

กฎนี้ขึ้นอยู่กับเหตุผลต่อไปนี้ การใช้บริการ generalization เพื่อสรุปค่าแอตทริบิวต์ภายใน tuple หรือกฎในความสัมพันธ์การทำงานจะสร้างกฎที่ครอบคลุมมากขึ้นของข้อมูล tuples เริ่มต้น ดังนั้นจึงเป็นการสรุปแนวคิดที่กำหนด สิ่งนี้สอดคล้องกับกฎการวางนัยทั่วไปที่กำหนดไว้เป็นการปีนต้นไม้ทั่วไปในความรู้จากอินสแตนซ์หรือการขึ้นต้นไม้แนวคิด

มันขึ้นอยู่กับแอตทริบิวต์หรือแอปพลิเคชันที่มีอยู่ ผู้ใช้สามารถต้องการให้แอตทริบิวต์บางอย่างยังคงอยู่ที่วิธีการนามธรรมที่ต่ำปานกลางในขณะที่บางส่วนเป็นแบบทั่วไปถึงวิธีที่สูงกว่า การควบคุมว่าแอตทริบิวต์ควรมีลักษณะทั่วไปสูงเพียงใดนั้นโดยทั่วไปแล้วจะเป็นแบบอัตนัย การควบคุมของเฟสนี้เรียกว่าการควบคุมลักษณะทั่วไปของแอตทริบิวต์

หากแอตทริบิวต์เป็นแบบทั่วไป "สูงเกินไป" อาจนำไปสู่การ overgeneralization และกฎผลลัพธ์ก็ไม่สามารถอธิบายได้มากนัก กล่าวอีกนัยหนึ่ง ถ้าแอตทริบิวต์ไม่ได้ถูกทำให้เป็น "ระดับสูงพอสมควร" ผลลัพธ์ที่ได้ภายใต้การทำให้เป็นนัยทั่วไปอาจส่งผลให้กฎที่ได้รับไม่สามารถให้ข้อมูลได้เช่นกัน ดังนั้น จึงต้องได้มาซึ่งความสมดุลในลักษณะทั่วไปเชิงแอตทริบิวต์

มีหลายวิธีที่เป็นไปได้ในการควบคุมกระบวนการวางนัยทั่วไปดังนี้ -

การควบคุมเกณฑ์การกำหนดลักษณะทั่วไปของแอตทริบิวต์ − เทคนิคแรก เรียกว่า การควบคุมขีดจำกัดการวางนัยทั่วไปของแอตทริบิวต์ กำหนดหนึ่งขีดจำกัดการวางนัยทั่วไปสำหรับแอตทริบิวต์บางรายการ หรือตั้งค่าขีดจำกัดหนึ่งค่าสำหรับทุกแอตทริบิวต์ หากค่าที่แตกต่างกันหลายค่าในแอตทริบิวต์หนึ่งสูงกว่าเกณฑ์แอตทริบิวต์ จะต้องนำแอตทริบิวต์ออกหรือลักษณะทั่วไปของแอตทริบิวต์ด้วย

ระบบการทำเหมืองข้อมูลโดยทั่วไปมีค่าธรณีประตูแอตทริบิวต์ดีฟอลต์ซึ่งปกติจะอยู่ระหว่าง 2 ถึง 8 และต้องช่วยให้ผู้เชี่ยวชาญและผู้ใช้เปลี่ยนค่าขีดจำกัดได้เช่นกัน หากผู้ใช้เข้าใจว่าลักษณะทั่วไปถึงระดับที่มากเกินไปสำหรับแอตทริบิวต์เฉพาะ เกณฑ์สามารถปรับปรุงได้

การควบคุมเกณฑ์ความสัมพันธ์ทั่วไป − เทคนิคที่สอง รู้จักกันในชื่อ การควบคุมเกณฑ์ความสัมพันธ์ทั่วไป ตัดสินใจเลือกธรณีประตูสำหรับความสัมพันธ์ทั่วไป หากทูเพิลหลายตัว (แตกต่าง) ในความสัมพันธ์ทั่วไปนั้นสูงกว่าเกณฑ์ ยิ่งไปกว่านั้น ต้องมีการนำเอาการทำให้เป็นนัยทั่วไปด้วย

ดังนั้นจึงไม่มีการวางแนวทั่วไปเพิ่มเติม เกณฑ์ดังกล่าวสามารถตั้งค่าล่วงหน้าได้ในระบบการทำเหมืองข้อมูล (โดยทั่วไปอยู่ในช่วง 10 ถึง 30) หรือกำหนดโดยผู้เชี่ยวชาญหรือผู้ใช้ และต้องปรับได้ ตัวอย่างเช่น หากผู้ใช้เข้าใจว่าความสัมพันธ์ทั่วไปนั้นเล็กเกินไป ก็สามารถเพิ่มขีดจำกัดได้ ซึ่งหมายถึงการเจาะลึก