Đề Xuất 5/2022 # Tóm Tắt Văn Bản Tiếng Việt Tự Động Với Mô Hình Sequence # Top Like

Xem 21,186

Cập nhật nội dung chi tiết về Tóm Tắt Văn Bản Tiếng Việt Tự Động Với Mô Hình Sequence mới nhất ngày 21/05/2022 trên website Athena4me.com. Hy vọng thông tin trong bài viết sẽ đáp ứng được nhu cầu ngoài mong đợi của bạn, chúng tôi sẽ làm việc thường xuyên để cập nhật nội dung mới nhằm giúp bạn nhận được thông tin nhanh chóng và chính xác nhất. Cho đến nay, bài viết này đã thu hút được 21,186 lượt xem.

--- Bài mới hơn ---

  • Ứng Dụng Giải Bài Tập Offline
  • Luyện Tập Tóm Tắt Văn Bản Tự Sự Sách Giáo Khoa Ngữ Văn Lớp 9
  • Soạn Bài: Kiểm Tra Truyện Trung Đại Trong Sách Giáo Khoa Ngữ Văn Lớp 9
  • Soạn Bài: Luyện Tập Tóm Tắt Tác Phẩm Tự Sự Trong Sách Giáo Khoa Ngữ Văn Lớp 9
  • Soạn Bài: Kiểm Tra Về Truyện Trong Sách Giáo Khoa Ngữ Văn Lớp 9
  • ABSTRACT

    Deep learning is a machine learning method that has been studied and used extensively in recent years, opening up new directions for problems such as image processing, speech processing, and natural language processing, etc. This article focuses on the use of deep learning for automatic text summarization for Vietnamese. Previous approaches such as statistics, machine learning, language analysis, etc. have been successful at different levels and purposes. In this paper, the Word2vec model was used to extract the specific characteristics of Vietnamese text for the Sequence to Sequence with Attention model to produce a sequence of words. Finally, the results were re-selected using the Beam Search algorithm, and a summary sentence was generated. The accuracy of the model was estimated using the ROUGE method on a dataset of over twenty-seven million words collected from newspapers in the country. The result was the summary statement reflecting the text content. Although the results were not high yet, the model has successfully solved the problem, and the dataset needs improving to enhance the efficiency of the model.

    TÓM TẮT

    Học sâu là phương pháp học máy được nghiên cứu và sử dụng rộng rãi trong những năm gần đây, mở ra hướng đi mới cho các bài toán như xử lý ảnh, xử lý tiếng nói và xử lý ngôn ngữ tự nhiên… Bài báo tập trung nghiên cứu sử dụng học sâu cho bài toán tóm tắt văn bản tự động đối với tiếng Việt. Các hướng tiếp cận trước đây như: thống kê, máy học, phân tích ngôn ngữ… đã thành công trên những cấp độ và mục đích tóm tắt khác nhau. Trong bài báo này, chúng tôi sử dụng mô hình Word2vec để rút trích những đặc trưng riêng của văn bản tiếng Việt, phục vụ cho mô hình Sequence to sequence with Attention nhằm tạo kết quả đầu ra là chuỗi các từ. Cuối cùng kết quả được chọn lọc lại bằng giải thuật Beam Search và sinh ra câu tóm tắt. Độ chính xác của mô hình được đánh giá bằng phương pháp ROUGE trên tập dữ liệu hơn hai mươi bảy triệu từ thu thập từ các trang báo trong nước. Kết quả thu được là các câu tóm tắt phản ánh đúng nội dung văn bản. Tuy kết quả còn chưa cao nhưng mô hình đã giải quyết thành công mục tiêu của bài toán, chúng tôi sẽ cố gắng cải thiện tập dữ liệu để nâng cao hiệu quả của mô hình.

    --- Bài cũ hơn ---

  • Các Trang Web Dịch Tiếng Anh Sang Tiếng Việt Chuẩn Nhất Hiện Nay
  • Phần Mềm Nghe Đọc Tiếng Anh Có Hướng Dẫn Balabolka Doc
  • Text To Speech Live Player Chương Trình Đọc Văn Bản Tiếng Anh Như Người Thật
  • Acapela Telecom & Loquendo Tts Natural Voices: Nghe Đọc Văn Bản Tiếng Anh Với Giọng Thật
  • Bỏ Túi Ngay 5 Phần Mềm Phát Âm Tiếng Anh Hay Nhất
  • Bạn đang đọc nội dung bài viết Tóm Tắt Văn Bản Tiếng Việt Tự Động Với Mô Hình Sequence trên website Athena4me.com. Hy vọng một phần nào đó những thông tin mà chúng tôi đã cung cấp là rất hữu ích với bạn. Nếu nội dung bài viết hay, ý nghĩa bạn hãy chia sẻ với bạn bè của mình và luôn theo dõi, ủng hộ chúng tôi để cập nhật những thông tin mới nhất. Chúc bạn một ngày tốt lành!

  • Web hay
  • Links hay
  • Push
  • Chủ đề top 10
  • Chủ đề top 20
  • Chủ đề top 30
  • Chủ đề top 40
  • Chủ đề top 50
  • Chủ đề top 60
  • Chủ đề top 70
  • Chủ đề top 80
  • Chủ đề top 90
  • Chủ đề top 100
  • Bài viết top 10
  • Bài viết top 20
  • Bài viết top 30
  • Bài viết top 40
  • Bài viết top 50
  • Bài viết top 60
  • Bài viết top 70
  • Bài viết top 80
  • Bài viết top 90
  • Bài viết top 100