Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ข้อมูลสถิตินี้มีประโยชน์สำหรับการตอบคำถามอย่างไร


พารามิเตอร์ทางสถิติสามารถใช้ในแนวทางจากบนลงล่างตามตารางได้ดังนี้ ขั้นแรก เลเยอร์ภายในสถาปัตยกรรมแบบลำดับชั้นจะถูกตัดสินใจว่าจะเริ่มขั้นตอนการตอบคำถาม

โดยทั่วไปเลเยอร์นี้จะมีเซลล์จำนวนเล็กน้อย สำหรับทุกเซลล์ในเลเยอร์ปัจจุบัน เซลล์สามารถคำนวณช่วงความเชื่อมั่น (หรือช่วงความน่าจะเป็นโดยประมาณ) ที่สะท้อนถึงความเกี่ยวข้องของเซลล์กับข้อความค้นหาที่ระบุ

พารามิเตอร์ทางสถิติของเซลล์ระดับสูงกว่าสามารถคำนวณได้ง่ายๆ จากพารามิเตอร์ของเซลล์ระดับล่าง พารามิเตอร์เหล่านี้ประกอบด้วยค่าต่อไปนี้ - พารามิเตอร์ที่ไม่ขึ้นกับแอตทริบิวต์ การนับ และพารามิเตอร์ที่ขึ้นกับแอตทริบิวต์ ค่าเฉลี่ย stdev (ค่าเบี่ยงเบนมาตรฐาน) ค่าต่ำสุด (ค่าต่ำสุด) ค่าสูงสุด (ค่าสูงสุด) และประเภทของการแจกแจงที่ค่าแอททริบิวต์ในเซลล์ตามมา ซึ่งรวมถึงปกติ ชุดฟอร์ม เลขชี้กำลัง หรือไม่มีเลย (หากการแจกแจงเป็นแบบนิรนาม)

เซลล์ที่ไม่เกี่ยวข้องจะถูกลบออกจากการพิจารณาเพิ่มเติม การประมวลผลการทดสอบระดับล่างต่อไปนี้เฉพาะเซลล์ที่เกี่ยวข้องที่เหลืออยู่ ขั้นตอนนี้ทำซ้ำจนกว่าจะได้ชั้นล่าง หากตรงตามคำอธิบายคิวรี พื้นที่ของเซลล์ที่เกี่ยวข้องที่ใช้คิวรีจะได้รับการคืนค่า

STING มีข้อดีหลายประการดังนี้ −

  • การคำนวณตามตารางไม่ขึ้นกับคิวรี เนื่องจากข้อมูลทางสถิติที่บันทึกไว้ในแต่ละเซลล์จะกำหนดระเบียนสรุปของข้อมูลในเซลล์กริด โดยแยกจากคิวรี

  • สถาปัตยกรรมกริดรองรับการประมวลผลแบบขนานและการรีเฟรชที่เพิ่มขึ้น

  • ประสิทธิภาพของเทคนิคเป็นประโยชน์อย่างมาก STING ต้องผ่านฐานข้อมูลเพราะสามารถคำนวณพารามิเตอร์ตัวเลขของเซลล์ ดังนั้นความซับซ้อนของเวลาในการสร้างคลัสเตอร์คือ O(n) โดยที่ n คือจำนวนออบเจ็กต์ทั้งหมด

  • หลังจากสร้างสถาปัตยกรรมแบบลำดับชั้นแล้ว เวลาประมวลผลคิวรีคือ O(g) โดยที่ g คือจำนวนเซลล์กริดทั้งหมดที่ระดับต่ำสุด ซึ่งโดยทั่วไปจะน้อยกว่า n

  • เนื่องจาก STING ต้องการวิธีแบบหลายความละเอียดในการวิเคราะห์คลัสเตอร์ คุณภาพของการจัดกลุ่ม STING ขึ้นอยู่กับความละเอียดระดับต่ำสุดของสถาปัตยกรรมกริด หากความละเอียดละเอียดมาก คุณค่าของการประมวลผลจะเพิ่มขึ้นอย่างมาก อย่างไรก็ตาม หากระดับล่างสุดของสถาปัตยกรรมกริดนั้นหยาบคายเกินไป ก็อาจทำให้คุณภาพของการวิเคราะห์คลัสเตอร์ลดลงได้

  • STING ไม่ได้รักษาความสัมพันธ์เชิงพื้นที่ระหว่างเด็กและเซลล์เพื่อนบ้านเพื่อพัฒนาเซลล์ต้นกำเนิด เป็นผลให้รูปร่างของกระจุกที่ส่งออกเป็นไอโซเทกต์ กล่าวคือ ขอบเขตคลัสเตอร์บางส่วนเป็นแนวนอนหรือแนวตั้ง และไม่พบขอบเขตแนวทแยง ซึ่งอาจทำให้คุณภาพและความแน่นอนของกลุ่มลดลง แม้ว่าเทคนิคจะใช้เวลาดำเนินการอย่างรวดเร็ว