მარკირება
ინგლ. tokenization. ტექსტის მაინინგის ერთ-ერთი საწყისი ეტაპი, რომლის დროსაც დასამუშავებელი ტექსტური ინფორმაცია აღიწერება სინონიმების ცნებაზე დაყრდნობით, საერთო განზოგადებული ტერმინების (მარკერების) საშუალებით.
ტერმინების სიხშირული მატრიცა
(ინგლ. frequency term-document matrix) ცხრილი, რომელიც აიგება ტექსტის მაინინგის პროცესში და ასახავს სხვადასხვა ტერმინის სიხშირეს (ტერმინის განმეორებათა რაოდენობას) ტექსტურ ერთეულებში (დოკუმენტებში).
დოკუმენტი
(ინგლ. document): ტექსტის მაინინგის პროცესში ანალიზის ცალკეული ობიექტი, ტექსტური ერთეული.
ტერმინების ორობითი მატრიცა
ინგლ. binary term-document matrix
მონაცემთა მაინინგი
ინგლ. data mining
ტექსტის მაინინგი
ინგლ. text mining
დაკვირვება
ინგლ. observation
ასოცირების შედეგი
(ინგლ. consequent): ასოცირების წესის ის ნაწილი, რომელიც შეესაბამება წინაპირობის ჭეშმარიტობის შემთხვევაში დამდგარ ფაქტს.
ასოცირების წინაპირობა
(ინგლ. antecedent): ის კრიტერიუმი ასოცირების წესში, რომელზე დაყრდნობითაც დგება შედეგი მომხმარებლის მიერ განხორციელებულ ქმედებაში (ტრანზაქციაში, შენაძენში).
სამომხმარებლო კალათის ანალიზი
(ინგლ. market basket analysis): მოიცავს მომხმარებელთა მიერ განხორციელებულ ტრანზაქციათა შესწავლასა და დამუშავებას შეძენილი პროდუქტების მიხედვით.