Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

กราฟและเครือข่ายการขุดคืออะไร


กราฟกำหนดคลาสของกลไกทั่วไปมากกว่าชุด ลำดับ แลตทิซ และทรี มีแอพพลิเคชั่นกราฟมากมายบนอินเทอร์เน็ตและในโซเชียลเน็ตเวิร์ก เครือข่ายข้อมูล เว็บทางชีววิทยา ชีวสารสนเทศ สารสนเทศทางเคมี คอมพิวเตอร์วิทัศน์ และมัลติมีเดียและการค้นหาเนื้อหา การใช้งานกราฟและเครือข่ายการขุดมีดังนี้ -

การขุดรูปแบบกราฟ - มันคือการขุดของกราฟย่อยที่พบบ่อยในหนึ่งหรือชุดของกราฟ มีหลายวิธีสำหรับรูปแบบกราฟการขุดที่สามารถจัดประเภทเป็นแนวทางตาม Apriori และตามรูปแบบการเติบโตของรูปแบบ

มันสามารถขุดชุดของกราฟปิดที่กราฟ g ถูกปิด หากไม่มี supergraph g ที่เหมาะสมต่อไปซึ่งสร้างการสนับสนุนที่คล้ายกันนับเป็น g นอกจากนี้ยังมีรูปแบบกราฟที่หลากหลาย เช่น กราฟความถี่โดยประมาณ กราฟที่สอดคล้องกัน และกราฟหนาแน่น ข้อจำกัดที่ผู้ใช้กำหนดสามารถขับเคลื่อนลึกลงไปในเฟสการทำเหมืองรูปแบบกราฟเพื่อเพิ่มประสิทธิภาพการขุด

การสร้างแบบจำลองทางสถิติของเครือข่าย − เครือข่ายประกอบด้วยชุดของโหนด ซึ่งแต่ละอันเทียบเท่ากับอ็อบเจ็กต์ที่เกี่ยวข้องกับชุดของคุณสมบัติ และชุดของขอบ (หรือลิงก์) ที่เชื่อมโยงโหนดเหล่านั้น ซึ่งอธิบายความสัมพันธ์ระหว่างอ็อบเจ็กต์

เครือข่ายจะเป็นเนื้อเดียวกันหากบางโหนดและลิงก์เป็นประเภทเดียวกัน รวมถึงเครือข่ายเพื่อน เครือข่ายผู้เขียนร่วม หรือเครือข่ายเพจอินเทอร์เน็ต เครือข่ายมีความแตกต่างกันหากโหนดและการเชื่อมต่อมีหลายประเภท รวมถึงเครือข่ายสิ่งพิมพ์ (เชื่อมโยงผู้เขียน การประชุม เอกสาร และข้อความ) และเครือข่ายการดูแลสุขภาพ (เชื่อมโยงแพทย์ พยาบาล ผู้ป่วย โรค และการรักษา)

การล้างข้อมูล บูรณาการ และการตรวจสอบโดยการวิเคราะห์เครือข่ายข้อมูล − ข้อมูลซ้ำซ้อนสามารถเกิดขึ้นได้ระหว่างองค์ประกอบต่างๆ ของข้อมูลที่เชื่อมต่อถึงกันในเครือข่ายขนาดใหญ่ สามารถวิเคราะห์ความซ้ำซ้อนของข้อมูลในเครือข่ายดังกล่าวเพื่อใช้การล้างข้อมูลที่มีคุณภาพ การรวมข้อมูล การตรวจสอบความถูกต้องของข้อมูล และการค้นหาความน่าเชื่อถือโดยการวิเคราะห์เครือข่าย

การจัดกลุ่มและการจำแนกกราฟและเครือข่ายที่เป็นเนื้อเดียวกัน − มีการสร้างวิธีการวิเคราะห์คลัสเตอร์บนเครือข่ายขนาดใหญ่เพื่อเปิดเผยกลไกเครือข่าย ค้นหาชุมชน ฮับ และค่าผิดปกติที่ซ่อนอยู่ ขึ้นอยู่กับกลไกทอพอโลยีเครือข่ายและคุณสมบัติที่เกี่ยวข้อง มีการสร้างวิธีการจัดกลุ่มเครือข่ายหลายประเภทและสามารถจัดประเภทเป็นอัลกอริทึมการแบ่งพาร์ติชัน ลำดับชั้น หรืออัลกอริทึมตามความหนาแน่น

การจัดกลุ่ม การจัดอันดับ และการแบ่งประเภทของเครือข่ายที่ต่างกัน − เครือข่ายที่ต่างกันรวมถึงโหนดที่เชื่อมต่อถึงกันและการเชื่อมต่อหลายประเภท กลไกที่เชื่อมโยงถึงกันดังกล่าวรวมถึงข้อมูลที่หลากหลาย ซึ่งสามารถใช้เพื่อปรับปรุงโหนดและลิงก์ร่วมกัน และเผยแพร่การสังเกตจากประเภทหนึ่งไปยังอีกประเภทหนึ่ง

การจัดกลุ่มและการจัดอันดับของเว็บที่แตกต่างกันดังกล่าวสามารถนำไปใช้อย่างใกล้ชิดในบริบทที่โหนดที่มีอันดับสูงในคลัสเตอร์สามารถมีส่วนร่วมมากกว่าการจับคู่ที่มีอันดับต่ำกว่าในการคำนวณความสอดคล้องกันของคลัสเตอร์