uitnlp/vihsd
Viewer • Updated • 33.4k • 315 • 4
How to use huynhthangofficial/konket-moderation with Transformers:
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-classification", model="huynhthangofficial/konket-moderation") # Load model directly
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("huynhthangofficial/konket-moderation")
model = AutoModelForSequenceClassification.from_pretrained("huynhthangofficial/konket-moderation")Đây là mô hình Trí tuệ Nhân tạo phân loại văn bản (Text Classification) được tinh chỉnh (fine-tuned) từ lõi vinai/phobert-base. Mô hình được phát triển dành riêng cho hệ thống mạng xã hội KonKet (Đồ án Tốt nghiệp).
Mô hình có nhiệm vụ tự động quét, nhận diện và phân loại các bài viết/bình luận tiếng Việt thành 3 cấp độ để Backend (Convex) ra quyết định kiểm duyệt:
LABEL_0 (Clean): Nội dung sạch, bình thường.LABEL_1 (Offensive): Ngôn từ xúc phạm, văng tục.LABEL_2 (Hate): Ngôn từ thù ghét, công kích mạnh.Được huấn luyện trên bộ dữ liệu nghiên cứu chuẩn UIT-ViHSD (Vietnamese Hate Speech Detection) của trường Đại học Công nghệ Thông tin. Đã trải qua quá trình làm sạch (Data Cleaning) để loại bỏ giá trị rỗng trước khi đưa vào huấn luyện.
Base model
vinai/phobert-base