Phân lớp văn bản tiếng Việt tự động theo chủ đề

Bài viết trình bày việc sử dụng các thuật toán như Naive Bayes, SVM và K-NN để thực nghiệm phân lớp văn bản tiếng Việt trên 05 bộ dữ liệu thuộc 04 chủ đề khác nhau: Du lịch, giải trí, giáo dục và pháp luật.