Hướng tiếp cận không toàn văn cho bài toán phân lớp tự động bản tin tiếng Việt

Bài viết này trình bày một hướng tiếp cận phân lớp các bản tin tiếng Việt không dựa trên nội dung toàn văn của bản tin đó. Qua đó đề xuất sử dụng một trong hai thông tin: 1-tóm tắt; 2-từ khóa đại diện, trong đó tóm tắt và từ khóa đại diện được tạo tự động từ nội dung của văn bản, để phân lớp văn bản.

Từ khóa: Phân loại văn bản, Tóm tắt tự động, Mô hình chủ đề, Cây quyết định, Bài toán phân lớp tự động, Bản tin tiếng Việt