Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

องค์ประกอบของ MBR คืออะไร?


มีองค์ประกอบต่าง ๆ ของ MBR ซึ่งมีดังนี้ -

การเลือกชุดการฝึก − ชุดฝึกอบรมประกอบด้วยข่าว 49,652 เรื่อง ซึ่งสนับสนุนโดยบริการดึงข่าวสำหรับเป้าหมายนี้ เรื่องราวเหล่านี้ปรากฏจากข่าวประมาณ 3 เดือนและจากแหล่งต่างๆ เกือบ 100 แหล่ง

แต่ละเรื่องมีคำโดยเฉลี่ย 2,700 คำและมีแปดรหัสที่สร้างขึ้น ชุดฝึกอบรมไม่ได้ถูกสร้างขึ้นโดยเฉพาะ ดังนั้นความถี่ของรหัสในชุดฝึกอบรมจึงแตกต่างกันอย่างมาก โดยเลียนแบบความถี่ที่สมบูรณ์ของรหัสในเรื่องข่าวโดยทั่วไป

การเลือกฟังก์ชันระยะทาง − ขั้นต่อไปคือการเลือกฟังก์ชันระยะทาง ในวิธีนี้ มีฟังก์ชันระยะทาง ขึ้นอยู่กับแนวคิดที่เรียกว่าคำติชมที่เกี่ยวข้อง ซึ่งคำนวณความคล้ายคลึงกันของไฟล์สองไฟล์ตามคำที่รวมไว้ คำติชมที่เกี่ยวข้อง ซึ่งกำหนดไว้อย่างครบถ้วนมากขึ้นในแถบด้านข้าง ถูกสร้างขึ้นเพื่อส่งคืนไฟล์ที่คล้ายกับเอกสารที่กำหนด ซึ่งเป็นวิธีการปรับแต่งการค้นหา ไฟล์เดียวกันคือไฟล์เพื่อนบ้านที่ใช้สำหรับ MBR

การเลือกฟังก์ชันการรวม − การตัดสินใจครั้งต่อไปคือฟังก์ชันการรวม สามารถสร้างรหัสการจัดหมวดหมู่ให้กับข่าวที่แตกต่างจากประเด็นการจัดหมวดหมู่ส่วนใหญ่ ปัญหาการจำแนกประเภทบางอย่างกำลังดูเป็นโซลูชันเดียวที่ดีที่สุด แต่ข่าวอาจมีหลายรหัส แม้จะมาจากองค์ประกอบเดียวกัน ความสามารถในการปรับ MBR ให้เข้ากับประเด็นนี้เน้นถึงความยืดหยุ่น

ฟังก์ชันการรวมต้องใช้วิธีการรวมแบบถ่วงน้ำหนัก เนื่องจากระยะทางสูงสุดคือ 1 น้ำหนักจึงง่าย 1 ลบระยะทาง ดังนั้นน้ำหนักอาจมากสำหรับเพื่อนบ้านในระยะทางเล็ก ๆ และเล็กสำหรับเพื่อนบ้านในระยะทางใหญ่

การเลือกจำนวนเพื่อนบ้าน − การสอบสวนได้ทำให้จำนวนเพื่อนบ้านที่ใกล้ที่สุดนั้นมีความหลากหลายระหว่าง 1 และ 11 ซึ่งรวมถึง ผลลัพธ์ที่ดีที่สุดคือการใช้เพื่อนบ้านมากขึ้น แต่กรณีศึกษานี้แตกต่างจากแอปพลิเคชั่น MBR หลายตัว เพราะมันสร้างหลายหมวดหมู่ให้กับแต่ละเรื่อง ปัญหาทั่วไปคือการสร้างเฉพาะหมวดหมู่หรือรหัสและเพื่อนบ้านจำนวนน้อยก็เพียงพอสำหรับผลลัพธ์ที่ดีที่สุด

สามารถคำนวณประสิทธิภาพของ MBR ในการเขียนโค้ด บริการข่าวมีคณะกรรมการบรรณาธิการตรวจสอบโค้ดบางโค้ดที่ได้รับมอบหมาย ไม่ว่าจะโดยบรรณาธิการหรือโดย MBR ถึง 200 เรื่อง มีบางรหัสที่ตกลงกันโดยคณะกรรมการส่วนใหญ่ได้รับการปฏิบัติ "ถูกต้อง"

การเปรียบเทียบโค้ดที่ "ถูกต้อง" กับโค้ดที่สร้างโดยบรรณาธิการที่เป็นมนุษย์ในช่วงแรกนั้นน่าสนใจ 88% ของรหัสที่สร้างขึ้นครั้งแรกสำหรับเรื่องราว (โดยมนุษย์) นั้นถูกต้อง แต่บรรณาธิการที่เป็นมนุษย์ทำผิดพลาด