Tạp chí Đại học Cửu Long, S. 11 (2018)

Cỡ chữ:  Nhỏ  Vừa  Lớn

Phần mềm phát hiện sao chép luận văn Đại học Cửu Long

Trần Lam Quyên, Trần Thị Thúy

Tóm tắt


Trong bài báo này chúng tôi đề xuất một giải pháp phát hiện sao chép luận văn dựa trên các kỹ thuật của lĩnh vực tìm kiếm thông tin. Việc kiểm chứng luận văn có được sao chép hay không dựa trên hai nguồn là cơ sở dữ liệu (CSDL) cục bộ và trực tuyến. Việc kiểm tra được thực hiện ở mức câu vì đây là hình thức phổ biến nhất. Đối với việc kiểm tra trực tuyến, chúng tôi thực hiện truy vấn bộ máy tìm kiếm google để tìm các tài liệu có thể bị sao chép và sử dụng độ đo Jaccard để tính điểm sự giống nhau giữa hai câu. Đối với CSDL cục bộ, chúng tôi sử dụng hệ quản trị CSDL MongoDB để lưu chỉ mục nghịch đảo nguồn CSDL cục bộ và sử dụng độ đo Cosine để xác định điểm tương đồng giữa hai câu. Hệ thống có khả năng tìm được các câu có khả năng sao chép từ nguồn khác và đồng thời loại bỏ được câu sao chép với câu trích dẫn. Kết quả thực nghiệm cho thấy giải pháp mà chúng tôi đề xuất mang lại hiệu quả cao trong thực tế.


Toàn văn: PDF

Tạp chí Đại học Cửu Long. ISSN: 2354-1423