ტერმინების ორობითი მატრიცა აიგება ტექსტის მაინინგის პროცესში და ასახავს სხვადასხვა ტერმინების არსებობა/არარსებობას ტექსტურ ერთეულებში (დოკუმენტებში).
მატრიცის სტრიქონები შეესაბამება დოკუმენტებს, ხოლო სვეტები კი – ტერმინებს. არსებობა აღინიშნება, როგორც წესი, 1-ით, ხოლო არარსებობა – 0-ით.
მაგალითად, თუკი ტექსტი შედგება ორი დოკუმენტისგან:
- “ძალიან მომეწონა”
- “ძალიან კარგია”
მაშინ შესაბამისი ორობითი მატრიცა იქნება:
# | “ძალიან” | “მომეწონა” | “კარგია” |
1 | 1 | 1 | 0 |
2 | 1 | 0 | 1 |