Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ลักษณะของ Naive Bayes Classifiers คืออะไร?


ตัวแยกประเภทแบบเบย์เป็นตัวแยกประเภททางสถิติ มันสามารถทำนายความน่าจะเป็นของการเป็นสมาชิกคลาส เช่น ความน่าจะเป็นที่กลุ่มตัวอย่างที่กำหนดนำไปใช้กับคลาสที่แน่นอน ตัวแยกประเภทแบบเบย์ยังแสดงประสิทธิภาพและความเร็วขนาดใหญ่เมื่อสามารถมีฐานข้อมูลสูงได้

เนื่องจากมีการกำหนดคลาส ระบบจึงต้องอนุมานกฎที่ควบคุมการจัดประเภท ดังนั้นระบบจะต้องสามารถค้นพบคำอธิบายของแต่ละคลาสได้ คำอธิบายต้องกำหนดคุณลักษณะการทำนายของชุดการฝึก เพื่อให้เฉพาะอินสแตนซ์ที่เป็นบวกเท่านั้นที่ต้องเป็นไปตามคำอธิบาย ไม่ใช่อินสแตนซ์เชิงลบ มีการกล่าวกันว่ากฎนั้นถูกต้องหากคำอธิบายครอบคลุมตัวอย่างเชิงบวกทั้งหมด และไม่มีการครอบคลุมตัวอย่างเชิงลบของชั้นเรียน

สมมติว่าการมีส่วนร่วมของแอตทริบิวต์ทั้งหมดเป็นอิสระและแต่ละองค์ประกอบมีส่วนเท่าๆ กันกับปัญหาการจัดหมวดหมู่ ซึ่งเป็นรูปแบบการจัดประเภทง่ายๆ ที่เรียกว่าการจัดประเภท Naïve Bayes

การจำแนกประเภท Naïve Bayes เรียกว่า Naïve เนื่องจากถือว่ามีความเป็นอิสระแบบมีเงื่อนไขของคลาส การใช้ค่าแอตทริบิวต์ในคลาสที่กำหนดจะแยกจากค่าของแอตทริบิวต์หลายรายการ ข้อสมมตินี้ทำขึ้นเพื่อลดต้นทุนในการคำนวณ ดังนั้นจึงถือว่าไร้เดียงสา

มีอัลกอริธึมมากมายสำหรับการทำความเข้าใจโทโพโลยีเครือข่ายจากเร็กคอร์ดการฝึกอบรมที่กำหนดตัวแปรที่สังเกตได้ ปัญหาคือการเพิ่มประสิทธิภาพที่ไม่ต่อเนื่อง ผู้เชี่ยวชาญที่เป็นมนุษย์มักเข้าใจดีถึงการพึ่งพาตามเงื่อนไขโดยตรงที่มีอิทธิพลต่อโดเมนภายใต้การวิเคราะห์ ซึ่งสนับสนุนการออกแบบเครือข่าย ผู้เชี่ยวชาญควรกำหนดความน่าจะเป็นแบบมีเงื่อนไขสำหรับโหนดที่ทำงานในการพึ่งพาโดยตรง

ความน่าจะเป็นเหล่านี้สามารถใช้เพื่อประเมินค่าความน่าจะเป็นที่เหลืออยู่ ถ้าทอพอโลยีเครือข่ายได้รับการยอมรับและสามารถสังเกตตัวแปรได้ ดังนั้นการฝึกอบรมเครือข่ายจึงเป็นเรื่องง่าย รวมถึงการคำนวณรายการ CPT เช่นเดียวกับที่เสร็จสมบูรณ์ในทำนองเดียวกันเมื่อประเมินความน่าจะเป็นที่รวมอยู่ในการจำแนกประเภท Bayesian ที่ไร้เดียงสา

มีลักษณะเฉพาะต่างๆ ของ Naïve Bayes Classifiers ซึ่งมีดังนี้ -

พวกมันแข็งแกร่งจนถึงจุดรบกวนที่แยกได้ เนื่องจากจุดดังกล่าวจะถูกหาค่าเฉลี่ยเมื่อประเมินความน่าจะเป็นแบบมีเงื่อนไขจากข้อมูล นอกจากนี้ยังสามารถจัดการค่าที่หายไปได้ด้วยการลบอินสแตนซ์ระหว่างการสร้างและจัดประเภทแบบจำลอง

มีความแข็งแกร่งถึงแอตทริบิวต์ที่ไม่เกี่ยวข้อง ถ้า Xi เป็นคุณลักษณะที่ไม่เหมาะสม ดังนั้น P (Xi |Y) มีการกระจายอย่างสม่ำเสมอ ความน่าจะเป็นแบบมีเงื่อนไขคลาสสำหรับ Xi ไม่มีผลกระทบต่อการคำนวณความน่าจะเป็นหลังทั้งหมด

แอตทริบิวต์ที่สัมพันธ์กันสามารถลดประสิทธิภาพของตัวแยกประเภท Bayes ที่ไร้เดียงสาได้เนื่องจากข้อสมมติความเป็นอิสระแบบมีเงื่อนไขไม่มีไว้สำหรับแอตทริบิวต์ดังกล่าวอีกต่อไป ตัวอย่างเช่น พิจารณาความน่าจะเป็นดังต่อไปนี้ −

P (A=0|Y=0) =0.4, P (A=1 | Y=0) =0.6,

P (A=0|Y =1) =0.6, P (A=1 | Y =1) =0.4,

โดยที่ A คือแอตทริบิวต์ไบนารีและ Y คือตัวแปรคลาสไบนารี สมมติว่ามีแอตทริบิวต์ไบนารี B อื่นที่มีความสัมพันธ์อย่างสมบูรณ์กับ A เมื่อ Y =0 แต่ไม่ขึ้นกับ A เมื่อ Y =1 เพื่อความสมบูรณ์ ให้พิจารณาว่าความน่าจะเป็นตามเงื่อนไขคลาสสำหรับ B เท่ากับ A