Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
The information retrieval system (IRS) now provides document search results with abundant results of documents (high recall) and low accuracy (low precision). The objective of designing IRS with Vector Space Model (VSM) Method is to facilitate users to search Indonesian documents. IRS Software is designed to provide search results with the optimum number of documents (low recall) and accuracy (high precision) with VSM method that users may get fast and accurate results. VSM method provides a different credit for each document stored in a database which in turns to determine the document most similar to the query, where the documents with the highest credits are placed on the top of the search results. The evaluation of search results with IRS is conducted under recall and precision tests. This study fascinatingly creates a system which can preprocess (tokenizing, filtering, and stemming) within computation time of four minutes forty-one seconds. The system can search the documents and display them in the search results with an average computation time of 1.5 seconds, with an average recall of 0.19, and an average precision of 0.54. The system is equipped with a credit for each document, and the value is positioned on which a user may easily search the Indonesian text.
Jurnal Ilmiah FIFO, 2017
Informasi saat ini sangat mudah didapatkan dengan memanfaatkan fasilitas internet dimanapun dan kapanpun. Di sisi lain informasi yang didapat dari search engine merupakan semua hal yang berkaitan dengan kata kunci yang dicari. Hal ini menyebabkan pengguna terpaksa menyaring untuk mendapatkan dokumen yang relevan. Oleh karena itu diperlukan cara untuk mengelompokkan banyaknya informasi yang tersedia, yang dibutuhkan pengguna sehingga memudahkan pengguna untuk mendapatkan dokumen yang diinginkan. Pada penelitian ini diusulkan suatu solusi dari permasalahan tersebut dengan mengembangkan metode ilmu pencarian yang dikenal dengan temu-kembali informasi (information retrieval) dan metode Vector Space Model (VSM). Pada metode Vector Space Model (VSM) beberapa dokumen online akan diindeks dan diurutkan berdasarkan bobot dari kata pencarian yang terdapat di dalam dokumen online tersebut. Salah satu algoritma pembobotannya adalah algoritma tf-idf yang dipengaruhi oleh frekuensi kemunculan ka...
Information is now very easy to get anywhere. Information technology, especially the internet, strongly supports the exchange of information very quickly. The internet has become an information and communication media that has been used by many people with many interests, especially in taking large-scale information data, Unfortunately the information presented is sometimes less relevant. Quality information is influenced by relevance, accuracy and on time. However, there are not many effective search systems available. This study discusses the implementation of an information retrieval system to find and find symptoms of autism disorders using the Vector Space Model (VSM) method. Vector Space Model (VSM) is a model used to measure the similarity between a document and a query. In this model, queries and documents are considered vectors in n dimensional space. Where n is the number of all terms listed. The purpose of this study was to design an information retrieval software to find and match the symptoms of autism disorders. By using Vector Space Model, it is hoped that it can provide a solution to the search engine to provide text matching information in the database using certain keywords, the results of the matching are presented in the form of ranks.
Journal of Informatics, Information System, Software Engineering and Applications, 2020
Pariwisata di Indonesia kini sudah semakin meningkat baik pariwisata alami, maupun buatan. Kabupaten Purbalingga dapat dikatakan sebagai kabupaten yang sedang tumbuh terutama dalam bidang pariwisatanya dan mulai dijadikan sebagai perbandingan dengan pariwisata di kota lain di Jawa Tengah. Sistem Temu Kembali Informasi merupakan optimalisasi dalam pencarian website agar user mendapatkan informasi sesuai dengan yang diharapkan. Pariwisata di Kabupaten Purbalingga masih mengalami kendala yaitu aspek dalam memberikan informasi secara detail objek wisata. Penggunaan sistem temu kembali diharapkan dapat digunakan sebagai optimalisasi pencarian untuk meningkatkan relevansi antara query dengan dokumen pariwisata Kabupaten Purbalingga. Tools yang akan digunakan untuk membuat sistem temu kembali informasi ini yaitu dengan framework codeigniter kemudian bahasa pemrograman php untuk website dengan penyimpanan data menggunakan database Mysql. Dalam proses pembangunan sistem temu kembali informasi diperlukan sebuah algoritma yaitu vector space model sebagai perhitungan relevansi antara query dengan dokumen. Penerapan sistem temu kembali informasi pariwisata Kabupaten Purbalingga, diharapkan dapat membantu kondisi pariwisata di Kabupaten Purbalingga menjadi meningkat khususnya dalam informasi pariwisata. Hasil penelitian ini adalah website pencarian yang akan memberikan informasi objek wisata sesuai dengan query yang diinputkan oleh user kemudian menampilkan dokumen secara relevan dengan query.
Tulisan ini memperlihatkan langkah-langkah membangun sebuah sistem temu-balik informasi (STBI) atau information retrieval system sederhana berbasis web. Sistem ini mengkoleksi beberapa berita. Berita-berita ini akan diberikan kepada pengguna sesuai dengan query yang dimasukkan. Sistem akan melakukan perhitungan kemiripan antara query dengan daftar berita yang tersedia.
2014
Paper ini membahas tentang cara lain yang bisa digunakan untuk mendapatkan informasi hadits yaitu dengan menggunakan suatu sistem aplikasi yang menggunakan teknik Temu Kembali Informasi (Information Retrieval) dengan Model Ruang Vektor. Model digunakan untuk mencari kemiripan antara kata kunci yang dimasukkan dengan dokumen yang tersimpan didalam basis data. Basis data terdiri dari dokumen hadits berjumlah 536 dokumen. Sistem yang dihasilkan dapat mempercepat proses pencarian dokumen hadits, mempermudah mendapatkan dokumen dan dapat menemukan dokumen hadits atau informasi yang relevan.
ABSTRAK Information Retrieval (IR) adalah sebuah metode untuk mengambil data terstruktur yang tersimpan dalam koleksi dokumen, kemudian menyediakan informasi yang diperlukan. Tujuan dari sistem IR adalah untuk mengambil dan menampilkan dokumen yang relevan dengan input pengguna (query). Generalized Vector Space Model (GVSM) adalah salah satu dari model sistem IR yang termasuk dalam model aljabar. Query yang dimasukkan oleh pengguna akan diproses terlebih dahulu. Pengolahan kata meliputi tokenizing, stop word removal, dan stemming. Aplikasi ini melakukan pencarian dokumen seperti pdf (*.pdf) dan Ms Word Doc (*.doc & *.docx.) yang relevan dengan query. Hasil pencarian ini disusun berdasarkan nilai kesamaan GVSM yang tertinggi. Dengan menggunakan Generalized Vector Space Model, hasil pencarian dokumen menjadi lebih relevan berdasarkan nilai perbandingan kemiripan.
Jurnal Informatika Polinema, 2016
Temu kembali citra berbasis query teks telah jamak digunakan di dalam suatu sistem temu kembali citra. Namun temu kembali dengan query teks tidak efektif apabila deskripsi citra tidak mengambarkan konten yang terkandung dalam citra. Dari latar belakang tersebut diajukan sebuah solusi berupa suatu sistem temu kembali citra berwarna menggunakan metode histogram warna fuzzy dan chi-square distance. Sistem ini menggunakan konten berupa citra sebagai query sebagai acuan temu kembali citra yang mirip dari segi komposisi warna. Histogram warna fuzzy didapatkan dengan mengelompokkan warna dengan pendekatan fuzzy. Kemudian histogram warna fuzzy dari citra query dan citra koleksi melalui uji kemiripan dengan formula chi-square distance. Sistem yang diuji mampu menemukan kembali citra yang sama serta mampu menemukan citra yang mirip dalam koleksi citra homogen dan heterogen dengan kesesuaian terhadap pengamatan manusia masing-masing sebesar 89,5% dan 78%.
Jurnal Teknik Informatika, 2016
Abstrak - Sistem temu kembali informasi (information retrieval system)merupakan sistem yang digunakan untuk menemukan informasi yang relevan dengan kebutuhan dari penggunanya, dengan menerapkan sistem tersebut permasalahan pencarian informasi dokumen skripsi bisa memberikan hasil yang relevan sesuai kebutuhan pengguna. Terdapat dua proses utama dalam sistem temu kembali informasi yaitu indexing dan retrieval. Proses indexing adalah proses untuk memberikan bobot pada kata dalam dokumen, metode pembobotan pada penelitian ini menggunakan metode pembobotan TF-IDF. Prosesretrieval adalah proses untuk menghitung kemiripan query terhadap dokumen, perhitungan kemiripan menggunakan konsepvector space modeldengan mencari nilai cosine similarity.Tujuan dari penelitian ini adalah untuk mengembangkan dan mengimplementasikan pengindeksan otomatis untuk membangun sistem pencarian dokumen di dalam sebuah system penyimpanan dokumen dengan konsep temu-kembali informasi. Kata kunci : Information retri...
Jurnal Sistem Informasi, 2017
The information retrieval (IR) system or information retrieval system is used to rediscover the information relevant to the user's needs from an information set automatically. In the information retrieval there are many methods used, one of them is the vector space model method that can measure the similarity between the vectors with the keywords in the input by the user. By adding the frequency-inverse document frequency (TF-IDF) method the data will be calculated by its weight, if there is a term with almost the same weight, this data will be more in priority and will appear at the top of the search. Recall is declared as part of the relevant document in the found document, whereas Precision is declared as part of the relevant document found. In this study can be produced in performance, retrieval system developed is good enough because with average precision about 71.31973% which means the average on each recall point, 71.31973% documents successfully found-return Relevant to the given query
2013
Content Based Image Retrieval is a method to find images by comparing between a query image with images in database based on information of image. CBIR used to find images in database based on similarity of colors, texture and shapes. This research will using colors and texture methosd to find similarity images in database. Method that in using for colors extraction is HSV Histograms then for texture extraction is static characteristic extraction method. This research using 30 of images from 5 different type of cloth as training and query images. Result for image retrival After performing subjective test using recall method based on texture similarity percentages 76,19%, based on color percentages 100% and based on texture and color similarity percentages 100%. Result of this study is content based image retrieval based texture and color using static characteristic extraction and HSV Histograms method can to retrieve relevan of images in database that match by query image.
Abstraksi Integrasi Optical Character Recognition dan Vector Space Model dalam sebuah sistem pengelolaan dokumen cetak. Sistem ini diharapkan mampu membantu manusia untuk lebih mengenal dan menggali informasi yang terkandung di dalam dokumen cetak. Proses digitalisasi dengan pengenalan karakter yang dibantu dengan metode temu kembali dokumen atau informasi (Information Retreval) yang cukup baik dapat membantu manusia menemukan informasi yang sesuai. Penelitian ini akan menjelaskan nilai tambah penggunaan Vector Space Model dan tahapan-tahapan pendukungnya seperti Tokenization dan Stemming dalam upaya untuk mendapatkan nilai balik informasi yang paling relevan diantara kumpulan data cetak yang telah di digitalisasi. Pencarian dokumen dilakukan dengan dua cara, yaitu pencarian penuh (tanpa stemming) dan pencarian normal (dengan stemming). Dari percobaan yang dilakukan diketahui bahwa penggunaan stemming mampu mengurangi jumlah term_tunggal yang harus di indeks. Tetapi penggunaan indeks dengan proses non stemming, memberikan hasil yang sedikit lebih relevan dibanding penggunaan indeks dengan proses stemming. Vector Space Model kurang dapat bekerja baik saat jumlah dokumen yang ter-indeks di basis data masih sedikit. Sehingga perlu indeks data yang besar untuk mendapatkan hasil yang lebih relevan.
Jurnal Pilar Nusa Mandiri, 2019
Speed and density in the process of finding documents and information has become mandatory, contained in information systems, to facilitate the search process or find documents and information needed, it is called information retrieval or information retrieval system, implementation of the theory applied in this study using the model method vector space, the purpose of this study is to provide general exposure to the process of finding digital documents. With the token and indexing process so that the results of the masses are found in the database using keywords, so the system will search according to the keywords input into the system, and will be compared with the data contained in the database, so that it can produce the correct information.
Dengan menyebut nama Allah SWT yang Maha Pengasih lagi Maha Panyayang, Kami panjatkan puja dan puji syukur atas kehadirat-Nya, yang telah melimpahkan rahmat, hidayah, dan inayah-Nya kepada kami, sehingga kami dapat menyelesaikan makalah ilmiah tentang Tokenisasi, Stopword Removal, dan Stemming.
Emitor: Jurnal Teknik Elektro
Temu kembali informasi berdasar peristiwa pada Majalah Suara Muhammadiyah periode 2010 – 2015 adalah untuk melihat banyaknya kata yang digunakan pada dokumen untuk menggambarkan topik yang dibahas pada dokumen tersebut. Temu kembali infomasi pada dokumen ini dibatasi untuk periode 2010 – 2015 dan dokumen yang dikumpulkan sebanyak 232 dokumen. Pengumpulan dokumen majalah Suara Muhammadiyah dalam bentuk digital yaitu berekstensi pdf. Ektraksi teks dokumen dari berkas pdf menggunakan pdfminer. Metode untuk temu kembali menggunakan Vector Space Model. Tahapan dimulai dari ekstraksi dokumen pdf menjadi teks,kemudian teks diparsing untuk menghapus tanda baca dan tanda hubung, penghapusan stopwords bahasa Indonesia untuk mengurangi kata-kata hubung dan kata-kata yang kurang bermakna, kemudian dilakukan pembobotan teks dan pencarian kemiripan teks untuk dapat menghitung dan mencari kembali informasi. Setelah dilakukan parsing dan pembobotan teks didapatkan bahwa teks yang banyak digunakan d...
Sistem temu kembali informasi merupakan sistem yang digunakan untuk menemukan informasi yang relevan dengan kebutuhan dari penggunanya secara otomatis berdasarkan kesesuaian dengan query dari suatu koleksi informasi. Penelitian ini bertujuan untuk mengenal karakteristik beberapa notasi pembobotan TF-IDF serta mengimplementasikan model ruang vektor menggunakan beberapa notasi pada metode pembobotan TF-IDF pada sistem temu kembali informasi. Notasi TF-IDF yang digunakan pada penelitian ini adalah anc.ntc, lnc.ltc dan ltc.ltc. Pada Model Ruang Vektor, pembobotan term dilakukan disisi dokumen dan query. Pembobotan yang dihasilkan pada algoritma TF-IDF akan menjadi variabel dalam perhitungan cosine similarity. Hasil dari cosine similarity pada masing-masing dokumen terhadap query akan diurutkan secara descending, sehingga hasil pencarian akan menampilkan dokumen yang paling mendekati kata kunci. Sistem ini dikembangkan menggunakan bahasa pemrograman PHP dan dokumen yang digunakan sebagai data uji sebanyak 50 artikel berita yang penulis kutip dari beberapa situs di internet. Penelitian ini telah berhasil mengimplementasikan vector space model dan tiga notasi pembobotan TF-IDF. Hasil dari penelitian ini menunjukkan bahwa tiap notasi pembobotan TF-IDF memiliki karekteristik yang berbeda-beda dan menghasilkan urutan dokumen relevan yang berbeda, antara notasi satu dengan notasi lainnya.
Perkembangan informasi pada saat ini sangat berkembang pesat di masyarakat sehingga masyarakat akan mengalami kesulitan dalam mendapatkan informasi yang relevan sesuai dengan kebutuhannya. Seseorang harus memiliki kemampuan dalam menyaring segala informasi yang masuk, sehingga informasi yang didapatkan tidak keliru dan dapat dipergunakan untuk aktivitas yang dilakukan (Solehat dkk. 2016:53). Oleh karena itu, seseorang harus bisa menyaring informasi yang cepat tepat dan relevan. Perkembanan pencarian pada saat ini menghasilkan banyak dokumen, akan tetapi dokumen yang diharapkan sesuai dengan kebutuhan masih rendah. Pencarian informasi saat ini dilakukan dengan menggunakan mesin pencarian atau biasa kita sebut denan sistem temu balik informasi, pengguna menuliskan kueri dan mesin pencari pun akan mencari kemudian akan menampilkan hasil dari pencariannya. Mesin pencari akan menmpilkan hasil pencarian dengan hasil dokumen yang sangat banyak atau banyak dokumen yang terambil, sehingga pengguna memerlukan lagi waktu lebih untuk mendapatkan hasil yang relevan atau sesuai dengan kebutuhan si pengguna. Menentukan hasil dari apa yang ditampilkan oleh mesin pencari memang banyak sehingga hasil ini akan menyulitkan pengguna dalam mendapatkan informasi yang dicari, hal ini terjadi karena dokumen yang terambil oleh sistem menghasilkan dokumen yang jumlahnya banyak, sehingga hasil ini memungkinkan menampilkan hasil yang tidak relevan. Salah satu cara untuk mengklasifiksaikan dokumen-dokumen dari hasil pencarian pengguna berdasarkan tingkat kemiripan antara dokumen-dokumen yang telah terkumpul agar dokumen yang dipilih nanti sudah mendekati apa yang dicari oleh pengguna sesuai dengan kata kunci yang dimasukan sehingga menghasilkan tingkat relevansi hasil temu balik tersebut kedalam sebuah sistem temu balik informasi yaitu dengan menggunakan vector space model. Vector Space Model (VSM) adalah metode untuk mengetahui tingkat
2012
The rapid growth of information and digital documents has caused the process to retrieve desire documents becomes more difficult when performed manually. Therefore, an information retrieval system is needed as the search engine to find relevant documents as user desire. This research is to develop a information retrieval system based on OKAPI BM25 model. Two main steps would do in build an information retrieval system with Okapi BM25 model are preprocessing and applied the model to it. The preprocessing steps are collection of document (corpus), tokenization, linguistic preprocessing, and indexing by creating an inverted index. After preprocessing, applied Okapi BM25 model to the system to compute the relevant value between each document to user’s query. The system retrieve a list of documents which in descending sort based on relevant value. System performance is measured by calculating precision and recall. Experiment on several query key, shows a good performance where precision ...
semanTIK
Artikel ilmiah adalah tulisan yang berisi laporan sistematis mengenai hasil kajian atau hasil penelitian yang dilakukan oleh dosen, mahasiswa, peneliti dan ilmuwan. Jurusan Arkeologi Universitas Halu Oleo telah memiliki koleksi artikel Arkeologi. Namun, proses pencarian dokumen membutuhkan waktu yang relatif lama, karena banyaknya koleksi artikel yang dimiliki. Berdasarkan hal tersebut dibutuhkan suatu sistem pencarian yang dapat membantu menemukan dokumen yang dibutuhkan. Sistem Temu Kembali Informasi (Information Retrieval) adalah proses menemukan materi yang biasanya dokumen dari data yang tidak terstruktur yang memenuhi kebutuhan informasi dari sebuah kumpulan koleksi yang tersimpan pada komputer. Salah satu metode sistem temu kembali informasi yang cocok digunakan untuk menemukan dokumen artikel arkeologi yaitu Vector Space Model karena efektif dan memiliki ketepatan dalam mengurutkan dokumen berdasarkan query yang dicari. Dari hasil pengujian precision dan recall yang dilakuka...
Abstrak Pada tulisan ini akan dijelaskan berbagai teknik sistem temu-kembali informasi dan rancangan integrasi sistem ke basis hiperteks. Sistem pengindeksan yang dijelaskan adalah pengindeksan dengan pembobotan berdasarkan frekuensi dan berdasarkan rumus Savoy(1993). Sedangkan teknik temu-kembali informasi yang dijelaskan adalah teknik Boolean biasa, teknik Boolean berperingkat dan teknik Extended Boolean. Kinerja berbagai teknik temu-kembali informasi dan berbagai pengindeksan di ukur dengan menampilkan dokumen yang terambil berikut bobot peringkatnya. Sistem ini dapat digunakan sebagai " benchmarking tool " untuk mengukur kinerja berbagai teknik yang digunakan dalam sistem temu-kembali informasi.
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.