ტექსტის მაინინგი წარმოადგენს მონაცემთა მაინინგის მეთოდების გამოყენების პროცესს ტექსტურ მონაცემებთან მიმართებაში, სასარგებლო ინფორმაციის მოპოვების მიზნით.
რამდენადაც ტექსტი არასტრუქტურიზებული მონაცემია, მაინინგის საწყისი ეტაპი მის სტრუქტურიზაციას მოიცავს. ეს გულისხმობს ტექსტის გარდაქმნას რიცხობრივ მონაცემებად, მათი ანალიტიკური მეთოდებით შემდგომი შესწავლის მიზნით. ამისათვის იქმნება ტერმინების ორობითი მატრიცა და/ან ტერმინების სიხშირული მატრიცა.