จากสตริงที่กำหนด เราจะได้ส่วนต่อท้ายที่เป็นไปได้ทั้งหมด หลังจากเรียงลำดับคำต่อท้ายในลำดับศัพท์แล้ว เราก็จะได้อาร์เรย์ส่วนต่อท้าย อาร์เรย์ต่อท้ายยังสามารถสร้างได้โดยใช้ทรีส่วนต่อท้าย โดยการใช้ DFS traversal ของ suffix tree เราจะได้ suffix arrays อาร์เรย์ต่อท้ายมีประโยชน์ในการค้นหาส่วนต่อท้ายในเวลาเชิงเส้น นอกจากนี้เรายังสามารถค้นหาสตริงย่อยโดยใช้อาร์เรย์ต่อท้ายโดยใช้ขั้นตอนประเภทการค้นหาแบบไบนารี
ความซับซ้อนของเวลาคือ O(m log n)
อินพุตและเอาต์พุต
Input: Main String: “BANANA”, Pattern: “NAN” Output: Pattern found at position: 2
อัลกอริทึม
fillSuffixArray (ข้อความ, suffArray)
ป้อนข้อมูล: สายหลัก
ผลลัพธ์: อาร์เรย์ของคำต่อท้าย
Begin n := text Length define suffix array as allSuffix of size n for i := 0 to n-1, do allSuffix[i].index := i allSuffix[i].suff := substring of text from (i to end) done sort the allSuffix array store indexes of all suffix array in suffArray. End
suffixArraySearch (ข้อความ รูปแบบ suffArray)
ป้อนข้อมูล: สตริงหลัก รูปแบบ และอาร์เรย์ต่อท้าย
ผลลัพธ์ − ตำแหน่งที่พบรูปแบบ
Begin patLen := size of pattern strLen := size of text left := 0 right := strLen -1 while left <= right, do mid := left + (right - left)/2 tempStr := substring of text from suffArray[mid] to end result := compare tempStr and pattern upto pattern length. if result = 0, then print the location if res < 0, then right := mid – 1 else left := mid +1 done End
ตัวอย่าง
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
struct suffix {
int index;
string suff;
};
int strCompare(string st1, string st2, int n) {
int i = 0;
while(n--) {
if(st1[i] != st2[i])
return st1[i] - st2[i];
i++;
}
return 0;
}
bool comp(suffix suff1, suffix suff2) { //compare two strings for sorting
if(suff1.suff<suff2.suff)
return true;
return false;
}
void fillSuffixArray(string mainString, int suffArr[]) {
int n = mainString.size();
suffix allSuffix[n]; //array to hold all suffixes
for(int i = 0; i<n; i++) {
allSuffix[i].index = i;
allSuffix[i].suff = mainString.substr(i); //from ith position to end
}
sort(allSuffix, allSuffix+n, comp);
for(int i = 0; i<n; i++)
suffArr[i] = allSuffix[i].index; //indexes of all sorted suffix
}
void suffixArraySearch(string mainString, string pattern, int suffArr[], int array[], int *index) {
int patLen = pattern.size();
int strLen = mainString.size();
int left = 0, right = strLen - 1; //left and right for binary search
while(left <= right) {
int mid = left + (right - left)/2;
string tempStr = mainString.substr(suffArr[mid]);
int result = strCompare(pattern,tempStr, patLen);
if(result == 0) { //the pattern is found
(*index)++;
array[(*index)] = suffArr[mid];
}
if(result < 0)
right = mid -1;
else
left = mid +1;
}
}
int main() {
string mainString = "BANANA";
string pattern = "NAN";
int locArray[mainString.size()];
int index = -1;
int suffArr[mainString.size()];
fillSuffixArray(mainString, suffArr);
suffixArraySearch(mainString, pattern, suffArr, locArray, &index);
for(int i = 0; i <= index; i++) {
cout << "Pattern found at position: " << locArray[i]<<endl;
}
} ผลลัพธ์
Pattern found at position: 2