6.3.1: የፍለጋ ኢንዴክስ አማራጮች

ኢንዴክሶች እንዴት እንደሚፈጠሩ የሚቆጠጠር ሌሎች አማራጮች አሉ። እነዚህ ለተወሰነ ኢንዴክስ (ግራጫ መልክ ላላቸው) ላይኖር ይችላለል።

ለኤምጂ እና ኤምጂፒፒ ኢንዴክሶች ስቴሚንገ እና ኬዝ-ፎልዲንግን (Stemming and case-folding) ማንቃት ይቻላል። ከነቁ፣ ስቴም እና ኬዝ-ፎልድ የተደረጉ ኢንዴክሶች ይፈጠራሉ። ተጠቃሚው እነዚህን ለመፈለግ አማራጭ ያገኛል። ካልነቁ፣ ፍለጋው ኬዝ-ሰንሰንቲቭ እና ስቴም ያልተደረገ ይሆናል፣ አማራጮቹ ደግሞ በክምችቱ የምርጫዎች ገጽ ላይ አይታይም።

ለኤምጂፒፒ ኢንዴክሶች አክሰንት-ፎልዲንግ ይኖራል። ይህም እንደ ኬዝ-ፎልዲንግ ተመሳሳይ ነው፣ ነገር ግን በትንንሽ እና ትልልቅ ፊደላት ዝምድና ይልቅ ፊደላትን ለብቻ ከማዛመድ ይልቅ ፊደላትን ከንባብ ምልክቶች ጋር የሚያዛምድ ነው። የሉሰን ኢንዴክስ ሁልጊዜ አክሰንት-ፎልዲንግ ሲሆን በተለያየ ጊዜ አጥፍቶ ለማብራት የሚያስችል አማራጭ ተገልጋዩ የክምችት ምርጫዎች ገፅ ላይ የለውም።

ቻይንኛ፣ ጃፓንኛ እና ኮሪያኛ ጽሁፍ ለየብቻ ወደ ቃላት አይለያዩምም። የኢንዴክስ አፈጣጠር ቃላትን በጽሁፍ ውስጥ በመሰባበር (በመለያየት) የሚሰራ ስለሆነ፣ ይህ ለነዚህ መፈለግ የማይቻል ኢንዴክስ ይፈጥራል። የ "CJK Text Segmentation" አማራጭ በማስተካከል፣ ለቻይንኛ፣ ጃፓንኛ እና ኮሪያኛ ፅሁፍ ውስጥ ላሉ ፊደላት መካከል ቦታ እንዲገባ ማድረግ ይቻላል። ስለሆነም በፊደል ደረጃ ፍለጋ ማከናወን ይቻላል።