Computer >> คอมพิวเตอร์ >  >> การเขียนโปรแกรม >> การเขียนโปรแกรม

ความแตกต่างระหว่าง Inverted Index และ Forward Index


Inverted Index และ Forward Index เป็นโครงสร้างข้อมูลที่ใช้ค้นหาข้อความในเอกสารหรือชุดเอกสาร

ดัชนีกลับหัว

Inverted Index เก็บคำเป็นดัชนีและชื่อเอกสารเป็นข้อมูลอ้างอิงที่แมป

ดัชนีไปข้างหน้า

ดัชนีไปข้างหน้าเก็บชื่อเอกสารเป็นดัชนีและคำเป็นข้อมูลอ้างอิงที่แมป

ต่อไปนี้คือความแตกต่างที่สำคัญบางประการระหว่าง Inverted Index และ Forward Index

ซีเนียร์ เลขที่ คีย์ Inverted Index ดัชนีไปข้างหน้า
1 รูปแบบการแมป Inverted Index เก็บคำเป็นดัชนีและชื่อเอกสารเป็นข้อมูลอ้างอิงที่แมป Forward Index เก็บชื่อเอกสารเป็นดัชนีและคำเป็นข้อมูลอ้างอิงที่แมป
2 กระบวนการสร้างดัชนี
  • สแกนเอกสาร เตรียมรายการคำศัพท์

  • เตรียมรายการดัชนีของคำที่ไม่ซ้ำทั้งหมดและจับคู่คำเหล่านั้นกับการค้นหาเอกสาร

  • ทำซ้ำขั้นตอนข้างต้นสำหรับเอกสารทั้งหมด

  • สแกนเอกสาร เตรียมรายการคำศัพท์

  • แมปคำทั้งหมดลงในเอกสารเป็นดัชนี

  • ทำซ้ำขั้นตอนข้างต้นสำหรับเอกสารทั้งหมด

3 การจัดทำดัชนี ในดัชนี Inverted การจัดทำดัชนีจะช้าเนื่องจากต้องตรวจสอบแต่ละคำก่อนเตรียมดัชนี ในดัชนีการส่งต่อ การจัดทำดัชนีนั้นรวดเร็วเนื่องจากมีการผนวกคำหลักเมื่อพบ
4 กำลังค้นหา ใน Inverted index การค้นหาค่อนข้างเร็ว ในดัชนีการส่งต่อ การค้นหาช้า
5 ตัวอย่าง
Word Documents
-------------------------
Welcome doc1
Hello doc1, doc3
Hi doc2
-------------------------
Word Documents
-------------------------
doc1 Welcome, Hello
doc2 Hi
doc3 Hello
-------------------------
6 ความซ้ำซ้อน ในดัชนี Inverted ไม่มีคีย์เวิร์ดที่ซ้ำกันถูกเก็บไว้ในดัชนี ในดัชนีการส่งต่อ อาจมีคำหลักที่ซ้ำกันในดัชนีเช่น 'สวัสดี'
7 ตัวอย่างในชีวิตจริง อภิธานศัพท์ท้ายดัชนี ค้นหาแบบย้อนกลับ สารบัญที่จุดเริ่มต้นของหนังสือ ค้นหา DNS