რ
ჟ
პ
ო
ნ
ლ
კ
ი
მარკირება
ინგლ. tokenization. ტექსტის მაინინგის ერთ-ერთი საწყისი ეტაპი, რომლის დროსაც დასამუშავებელი ტექსტური ინფორმაცია აღიწერება სინონიმების ცნებაზე დაყრდნობით, საერთო განზოგადებული ტერმინების (მარკერების) საშუალებით.
ტერმინების სიხშირული მატრიცა
(ინგლ. frequency term-document matrix) ცხრილი, რომელიც აიგება ტექსტის მაინინგის პროცესში და ასახავს სხვადასხვა ტერმინის სიხშირეს (ტერმინის განმეორებათა რაოდენობას) ტექსტურ ერთეულებში (დოკუმენტებში).

