Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
Tạp chí Khoa học Đại học Đà Lạt
…
14 pages
1 file
Wikipedia nổi tiếng là một bách khoa toàn thư mở lớn nhất hiện nay với mục đích phổ cập kiến thức cho tất cả mọi người trên thế giới. Với việc áp dụng robot trong khâu tạo bài tự động, dự án tiếng Việt là một trong 13 dự án ngôn ngữ có hơn một triệu bài viết. Tuy nhiên, điều đó tạo cho Wikipedia tiếng Việt nhiều thách thức trong việc nâng cao chất lượng bài, sắp xếp thể loại, chống phá hoại nội dung và nhiều công tác khác. Trong bài báo này, chúng tôi phân loại thể loại ở Wikipedia tiếng Việt, chi tiết hơn là cấu trúc và các quy ước đặt tên thể loại. Phương pháp chính là áp dụng các tiêu chuẩn và cấu trúc thể loại sẵn có ở tiếng Anh, một dự án Wikipedia lớn nhất về mặt thông tin đóng góp, từ đó áp dụng cho phiên bản tiếng Việt. Tuy nhiên, điều đó không thực hiện dễ dàng, do đó chúng tôi phải kết hợp nhiều phương pháp xã hội cũng như chuyên môn để đạt được sự kỳ vọng. Việc phân tích tên thể loại và dữ liệu từ Wikidata được chúng tôi áp dụng là một tiền đề xây dựng một công cụ chuyển ...
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2017
Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp, đặc biệt là hệ thống hỏi đáp mở (Opendomain question answering system). Phân loại câu hỏi giúp xác định đối tượng cần tìm kiếm và phạm vi kiến thức của câu trả lời. Do đó độ chính xác của bộ phân loại câu hỏi ảnh hưởng nhiều đến chất lượng của một hệ thống hỏi đáp mở. Trong bài báo này, chúng tôi trình bày phương pháp phân loại câu hỏi tiếng Việt sử dụng kết hợp các phương pháp túi từ, từ khóa và quan hệ phụ thuộc. Chúng tôi tiến hành thử nghiệm phương pháp trên 2 bộ câu hỏi: bộ câu hỏi TREC tiếng Việt và bộ câu hỏi do chúng tôi tự xây dựng. Kết quả thử nghiệm cho ra hệ thống phân loại câu hỏi có độ chính xác ở lớp thô(Coarse) là 85.4% và lớp mịn(Fine-Grained) là 70.2%. Hệ thống cũng xây dựng được bộ dữ liệu được đặt tên là UIT-OQA. Bộ dữ liệu gồm 1,416 câu hỏi phù hợp với các nghiên cứu về phân loại câu hỏi và hệ thống hỏi đáp trên ngôn ngữ Tiếng Việt. Từ khóa: Open-domainquestion answering, hệ thống hỏi đáp mở, quan hệ phụ thuộc, túi từ.
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN 2015, 2016
TÓM TẮT-Bài báo này được thực hiện nhằm mục đích nghiên cứu tìm hiểu thuật toán phân cụm FCM và các ý tưởng cải tiến đã có; tiến hành phân tích và phát hiện những đặc điểm phù hợp trong thuật toán FCM có thể áp dụng được đại số gia tử-một lý thuyết sử dụng đại số trong việc biểu diễn giá trị của các biến ngôn ngữ. Từ đó, đề xuất một hướng cải tiến mới, đó là sử dụng lý thuyết đại số gia tử vào trọng số mũ của thuật toán FCM và sau cùng là xây dựng cài đặt một thuật toán phân cụm mờ sử dụng đại số gia tử để có thể áp dụng giải quyết bài toán phân cụm trong các ứng dụng thực tế.
Tạp chí Khoa học Đại học Sư phạm Thành phố Hồ Chí Minh, 2022
Bài báo nghiên cứu *
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2016
Sự xuất hiện của các trang mạng xã hội đã làm cho số lượng người sử dụng và lượng thông tin trao đổi trên mạng internet trở nên rất lớn và không ngừng gia tăng. Phần lớn người sử dụng mạng xã hội, blog thường bày tỏ một cách chân thật các kiến thức, ý kiến, quan điểm, cảm xúc… của chính mình. Việc phân tích chủ đề từ những trao đổi, tài liệu trên mạng xã hội nhằm nắm bắt, quản lý và trích xuất thông tin là vô cùng quan trọng và có ý nghĩa lớn trong giáo dục, kinh tế, chính trị, xã hội, tâm lý học... Tuy nhiên để có được những thông tin hữu ích chúng ta phải giải quyết các vấn đề phức tạp ở cả hai giai đoạn: thu thập dữ liệu từ các trang mạng xã hội và phân tích thông tin từ nguồn dữ liệu lớn. Thông thường bài toán phân tích thông tin, cụ thể là phân lớp bài viết theo chủ đề, là bài toán xử lý, phân loại văn bản truyền thống nhưng khi áp dụng cho dữ liệu mạng xã hội thì gặp phải khó khăn về dung lượng dữ liệu cần xử lý, có thể lên đến hàng TeraByte, ZettaByte. Để có thể lưu trữ và xử lý lượng dữ liệu này cần sử dụng các công nghệ tính toán phân tán Cluster Computing, trong đó phổ biến nhất là mô hình MapReduce.
Journal of Computer Science and Cybernetics, 2018
VNU Journal of Foreign Studies
Uyển ngữ chỉ cái chết trong các ngôn ngữ khác nhau là đề tài thú vị cho nhiều nghiên cứu. Uyển ngữ chỉ cái chết trong tiếng Anh và tiếng Việt được một số nghiên cứu chỉ ra, tuy nhiên chưa có nhiều công bố về phương pháp dịch uyển ngữ chỉ cái chết từ tiếng Anh sang tiếng Việt. Nghiên cứu này, với dữ liệu trích xuất từ 63 bài diễn văn tiếng Anh, đã so sánh và phân tích các uyển ngữ chỉ cái chết trong tiếng Anh và các phương án dịch sang tiếng Việt, theo khung lý thuyết dựa trên các phương pháp dịch uyển ngữ do Barnwell (1980), Duff (1989), và Larson (1998) đề xuất. Kết quả cho thấy phương pháp dịch uyển ngữ chỉ cái chết tiếng Anh thành uyển ngữ tương đương trong tiếng Việt là phổ biến nhất (chiếm 67,56% dữ liệu), phương pháp dịch thành uyển ngữ không tương đương ít phổ biến hơn (chiếm 21,62%), và phương pháp dịch trực tiếp uyển ngữ chỉ cái chết ít phổ biến nhất (chiếm 10,81%). Các uyển ngữ chỉ cái chết được dịch thành uyển ngữ không tương đương thường mang sắc thái trang trọng và phù ...
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN 2015, 2016
Truy vấn trực tiếp trên các đối tượng trong cơ sở dữ liệu hướng đối tượng rất tốn kém chi phí lưu trữ dữ liệu trong quá trình truy vấn và tốn nhiều thời gian để thực hiện truy vấn trên hệ thống dữ liệu thực. Gần đây, có nhiều nghiên cứu tập trung vào việc giải quyết vấn đề đó bằng cách xây dựng các chỉ mục trên các lớp đơn, phân cấp lớp, hoặc phân cấp đối tượng lồng nhau. Trong bài báo này, chúng tôi sẽ đề xuất một phương pháp lập chỉ mục mới. Phương pháp này dựa trên kỹ thuật sử dụng tập tin chữ ký và cây SD-tree trong đó các tập tin chữ ký được tổ chức theo phân cấp để nhanh chóng lọc dữ liệu không thích hợp và mỗi tập tin chữ ký được lưu theo cấu trúc cây SD-tree nhằm tăng tốc độ quét chữ ký. Kỹ thuật này giúp giảm đáng kể không gian tìm kiếm và do đó sẽ cải thiện đáng kể độ phức tạp thời gian truy vấn.
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2017, 2017
Trong bài viết này, chúng tôi đề xuất hệ thống điểm danh bằng mặt người với máy học véctơ hỗ trợ (Support Vector Machines-SVM) sử dụng đặc trưng GIST. Hệ thống điểm danh thực hiện hai bước chính là định vị khuôn mặt trong ảnh thu được từ camera và định danh đối tượng từ ảnh khuôn mặt. Bước định vị khuôn mặt được thực hiện dựa trên các đặc trưng Haar-like kết hợp với mô hình phân tầng (Cascade of Boosted Classifiers-CBC). Chúng tôi đề xuất huấn luyện mô hình máy học SVM sử dụng đặc trưng GIST để thực hiện định danh đối tượng từ ảnh khuôn mặt. Kết quả thực nghiệm trên tập dữ liệu gồm 6722 ảnh của 132 đối tượng là những sinh viên Khoa CNTT-TT, Trường Đại học Cần Thơ cho thấy máy học SVM sử dụng đặc trưng GIST đạt đến 99.29% độ chính xác trên tập kiểm tra, cao hơn khi so với mô hình mạng nơron tích chập (Convolutional Neural Network-CNN), máy học SVM sử dụng mô hình túi từ (Bag-of-Words-BoW) của đặc trưng SIFT (Scale-Invariant Feature Transform), Bayes thơ ngây với láng giềng gần nhất (Naïve Bayes Nearest Neighbor-NBNN) sử dụng đặc trưng SIFT có độ chính xác lần lượt là 96.88%, 97.54% và 98.88%. Từ khóa: Nhận dạng mặt người, đặc trưng GIST, máy học véctơ hỗ trợ (SVM).
Tạp chí Khoa học Đo đạc và Bản đồ, 2011
Hiện nay, ảnh viễn thám đang và sẽ được sử dụng cho nhiều mục đích khác nhau. Một trong những ứng dụng chủ yếu của ảnh viễn thám là lập các bản đồ lớp phủ trên mặt đất thông qua các phương pháp phân loại. Những phương pháp phân loại truyền thống(gọi là phân loại cứng) với giả thiết nhận dạng mỗi pixel (điểm ảnh) chỉ cho phép thuộc về một lớp phủ. Trong thời gian gần đây, phân loại mềm bắt đầu được thực hiện và ứng dụng cho thành lập bản đồ lớp phủ. Trong phân loại mềm, có thể xác định thành phần phần trăm lớp phủ trong mỗi pixel. Như vậy, phân loại mềm cho phép thực hiện bài toán phân loại ở mức độ chi tiết cao hơn 1 pixel ảnh. Mục đích chính của bài báo này là giới thiệu về phân loại ảnh viễn thám, các phương pháp phân loại ảnh viễn thám, khái niệm phân loại mềm và bản chất thuật toán của các phương pháp sử dụng trong phân loại mềm ảnh viễn thám được sử dụng hiện nay.
Journal of Computer Science and Cybernetics, 2018
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.
Tạp chí Khoa học Đại học Sư phạm Thành phố Hồ Chí Minh, 2022
Tạp chí Khoa học Ngoại ngữ
Tạp chí Nghiên cứu dân tộc, 2019
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2016
Tạp chí Y học Việt Nam
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN 2015, 2016
Journal of Computer Science and Cybernetics, 2016
VNU Journal of Science: Legal Studies, 2018
SCIENTIFIC JOURNAL OF TAN TRAO UNIVERSITY
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2017
BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM - PROCEEDING OF THE 4TH NATIONAL SCIENTIFIC CONFERENCE ON BIOLOGICAL RESEARCH AND TEACHING IN VIETNAM
ĐA DẠNG SINH HỌC VÀ CÁC CHẤT CÓ HOẠT TÍNH SINH HỌC KỶ YẾU HỘI NGHỊ KHOA HỌC 45 NĂM VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM, 2020
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2017, 2017
Can Tho University Journal of Science, 2021
Can Tho University Journal of Science, 2021
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2016
Journal of Computer Science and Cybernetics, 2018
Journal of Computer Science and Cybernetics, 2012
Journal of Computer Science and Cybernetics, 2016
FAIR - NGHIÊN CỨU CƠ BẢN VÀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN - 2016, 2017
BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM HỘI NGHỊ KHOA HỌC QUỐC GIA LẦN THỨ 5 - PROCEEDING OF THE 5TH NATIONAL SCIENTIFIC CONFERENCE ON BIOLOGICAL RESEARCH AND TEACHING IN VIETNAM