Academia.edu no longer supports Internet Explorer.
To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.
2017, Jurnal Sains Matematika dan Statistika
Data hilang merupakan informasi yang tidak tersedia untuk sebuah kasus tertentu. Salah satu metode yang digunakan untuk mengatasi data hilang adalah Algoritma EM. Penelitian ini bertujuan untuk mendapatkan teknik mengatasi data hilang dengan metode Algoritma EM. Metode Algoritma EM merupakan sebuah metode optimisasi iteratif yang terbagi atas dua tahapan yaitu tahap ekspektasi dan tahap maksimisasi. Data yang digunakan pada penelitian ini adalah data matriks
2017
Data hilang pada rancangan blok lengkap acak (RBLA) merupakan informasi yang tidak tersedia untuk sebuah obyek (kasus) tertentu, dimana banyaknya data pengamatan dalam rancangan blok random lengkap kurang dari kxn data pengamatan. Metode Yates merupakan metode pendugaan untuk menangani data hilang yang dilakukan dengan meminimumkan jumlah kuadrat error, sedangakan metode Biggers merupakan metode pendugaan data hilang dengan pendekatan matrik. Kemudian untuk mengatasi error pada jumlah kuadrat perlakuan diperlukan tabel analisis varian alternatif sebagai alternatif analisis data hilang pada RBRL dan mengetahui pengaruh perlakuan terhadap respon pengamatan. Maka untuk satu dan dua data hilang dapat diselesaikan dengan menggunakan metode Yates. Untuk empat data hilang dapat diselesaikan dengan metode Biggers dan tiga data hilang dapat diselesaikan dengan menggunakan aturan Baten dan pendekatan matriks pada metode Biggers.
Jurnal Riset dan Aplikasi Matematika (JRAM)
Analisis data sudah sangat luas digunakan dalam penelitian, namun masalah pada data seperti jumlah sampel yang sedikit dan adanya data hilang tidak dapat dihindari. Metode resampling dan pendugaan data hilang mempunyai kekurangan dan kelebihan masing-masing. Penduga rasio merupakan suatu metode pendugaan yang digunakan ketika terdapat parameter yang sulit diketahui dugaannya, oleh karena itu peneliti ingin mengetahui metode resampling dan pendugaan data hilang yang terbaik dengan melihat hasil penduga rasio dan ragam dugaan rasio tersebut.. Penelitian ini menggunakan metode simulasi resampling dari data Indeks Prestasi Akademik (The Academic Performance Indeks/API) sebagai populasi dengan menggunakan bahasa pemrograman R. Pada penelitian ini metode Jackknife menghasilkan dugaan rasio yang sama dengan metode Stratified Random Sampling. Ragam dugaan rasio metode Jackknife dan Bootstrap relatif lebih kecil dibandingkan metode Stratified Random Sampling. Pada metode Bootstrap ragam dugaan tergantung pada banyaknya ulangan, semakin banyak ulangan maka ragam dugaan rasio relatif lebih kecil. Pada metode pendugaan data hilang untuk kasus ini metode Imputasi Regresi (Deterministik) dan algoritma EM lebih baik dibandingkan metode Imputasi Regresi (Stokastik) dikarenakan dugaan rasio yang lebih mendekati dan ragam dugaan rasio yang relatif lebih kecil.
MEDIA STATISTIKA, 2011
Data augmentation is a method for estimating missing data. It is a special case of Gibbs sampling which has two important steps. The first step is imputation or I-step where the missing data is generated based on the conditional distributions for missing data if the observed data are known. The next step is posterior or P-step where the estimation process of parameter values from the complete data is conducted. Imputation and posterior steps on the data augmentation will continue to run until the convergence is reached. The estimate of missing data is obtained through the average of simulated values.
E-Jurnal Matematika, 2015
Missing data often occur in agriculture and animal husbandry experiment. The missing data in experimental design makes the information that we get less complete. In this research, the missing data was estimated with Yates method and Expectation Maximization (EM) algorithm. The basic concept of the Yates method is to minimize sum square error (JKG), meanwhile the basic concept of the EM algorithm is to maximize the likelihood function. This research applied Balanced Lattice Design with 9 treatments, 4 replications and 3 group of each repetition. Missing data estimation results showed that the Yates method was better used for two of missing data in the position on a treatment, a column and random, meanwhile the EM algorithm was better used to estimate one of missing data and two of missing data in the position of a group and a replication. The comparison of the result JKG of ANOVA showed that JKG of incomplete data larger than JKG of incomplete data that has been added with estimator ...
2016
Hujan merupakan kejadian alam yang umum terjadi diwilayah Indonesia, terutama pada saat musim penghujan. Kelengkapan data hujan merupakan salah satu bagian terpenting dalam kaitannya perencanaan manajemen keairan, menajemen sumber daya air, maupun perencanaan pembangunan, terlebih lagi untuk perencanaan bangunan air. Namun tidak jarang terjadi ketidaklengkapan data pada periode perekaman pada stasiun hujan yang ada di suatu wilayah. Maka dari itu, model hidologi untuk mengisi data hujan yang hilang diperlukan. Penelitian ini dilaksanakan di Daerah Aliran Sungai (DAS) Dengkeng yang terletak di Kabupaten Klaten, Jawa Tengah. Proses simulasi model diawali dengan mengeliminasi data dengan metode sampling, kemudian melakukan perhitungan dengan model untuk mendapatkan data hujan kembali dengan metode ARIMA (Autoregresive Integrated Moving Average) dan metode Reciprocal. Parameter untuk menilai model adalah dengan melihat Q80 hasil perhitungan berbagai jenis data. Hasil penelitian menunjuk...
2017
Analisis regresi merupakan analisis yang bertujuan untuk mengetahui hubungan antara dua variabel, yaitu variabel dependen dan variabel independen. Dalam analisis regresi, diperlukan data. Data merupakan hal yang paling utama yang akan diolah sehingga menghasilkan suatu kesimpulan. Data yang baik sangat dibutuhkan agar kesimpulan yang dihasilkan dari penelitian tidak jauh berbeda dengan keadaan yang sebenarnya. Namun, tidak jarang sebagian data yang dihasilkan tidak lengkap. Data hilang dapat saja diabaikan jika data yang hilang sedikit, namun apabila data yang hilang berjumlah cukup besar maka data tersebut tidak dapat diabaikan. Metode modern yang digunakan untuk mengatasi data hilang salah satunya adalah metode Maksimum Likelihood dengan menggunakan algoritma Ekspektasi Maksimasi. Algoritma EM adalah proses dua langkah untuk mengestimasi parameter suatu model data tidak lengkap. Langkah awalnya adalah dengan membagi data kedalam dua bagian, yaitu bagian missing dan nonmissing. Dal...
Salah satu permasalahan yang ada pada dataset adalah ketiadaan nilai pada data untuk atribut tertentu atau yang sering disebut dengan missing data. Metode yang paling mudah dan populer adalah K-Nearest Neighbour (KNN). Namun, metode ini memiliki beberapa kelemahan salah satunya adalah pemilihan nilai k yang tidak tepat dapat menurunkan kinerja klasifikasi. Penelitian ini bertujuan menangani missing data dengan teknik imputasi menggunakan gabungan algoritma KNN dan Algoritma Genetika (KNN-GA). GA digunakan untuk mengoptimasi nilai k pada KNN sehingga dapat menghasilkan nilai estimasi yang baik dengan MSE sekecil mungkin. Pengujian performansi dilakukan dengan membandingkan nilai MSE dan akurasi hasil klasifikasi antara metode KNN-GA dengan metode imputasi yang lain, yaitu : KNN, Mean, dan Median. Hasil yang diperoleh menunjukkan bahwa secara rata-rata metode imputasi KNN-GA memiliki nilai MSE terendah dan hasil akurasi klasifikasi yang inggi. Kata kunci : Algoritma Genetika, Imputasi...
Abstract— Missing data adalah hilangnya suatu nilai atribut tertentu pada suatu instance dataset. Permasalahan ini disebabkan oleh tidak adanya data di lapangan atau adanya kesalahan dalam pencacahan. Metode yang sering digunakan untuk mengatasi permasalahan ini adalah dengan mengisi nilai dari rataan atribut yang ada atau menghilangkan instance yang mengandung missing data. Penggunaan metode ini dirasa kurang efektif karena dapat menghilangkan informasi penting yang mungkin terdapat pada data yang dibuang. Metode lain yang digunakan adalah dengan mengestimasi nilai missing data atau yang dikenal dengan imputasi data. Salah satu teknik imputasi yang digunakan adalah algoritma pengelompokan data K-Means (KM). Dalam perkembangannya, KM telah disempurnakan untuk menghindari pengaruh dari data-data yang ada di sekitar titik tengah klaster, metode pengelompokan data ini disebut dengan K-Harmonic Means (KHM). KHM merupakan variasi model KM dalam hal fungsi obyektif yang digunakan. Penelit...
Generally, the use of conventional method in data compression cannot overcome data manipulation performance in reducing the use of memory space and speed in data communication. By using new data manipulation which applies available compression algorythms like Huffman, Half-byte or Run-Length we can do data compression from user interface before the data is kept in repository, so that the performance in data manipulation becomes better. With better performance, we can minimize the use of memory space in the repository and maximize the speed of data transmission in the communication between user interface and repository in doing data manipulation.
Journal of Mathematics : Theory and Application
Rancangan split-block merupakan suatu rancangan percobaan dengan dua faktor atau lebih, dimana ketepatan pengaruh interaksi antar faktor lebih diutamakan dibandingkan dengan pengaruh mandiri masing-masing faktor. Dalam percobaan yang dilakukan, seringkali pelaksanaannya tidak sesuai dengan yang diharapkan, sehingga kadangkala menyebabkan tidak lengkapnya data yang diperoleh. Penelitian ini bertujuan untuk menentukan nilai estimasi data yang tidak lengkap atau data hilang pada rancangan split-block, serta mengukur kesalahan dan ketelitian hasil estimasi data hilang yang dihasilkan. Metode yang digunakan dalam mengestimasi data hilang adalah metode Yates, yaitu metode dengan nilai estimasi yang meminimumkan jumlah kuadrat galat percobaan. Berdasarkan hasil analisis yang telah dilakukan pada data simulasi, diberikan hasil bahwa semakin banyak jumlah data yang hilang yang diestimasi dengan menggunakan metode Yates, maka semakin banyak iterasi yang dibutuhkan, sehingga menyebabkan metode...
Jurnal Matematika, Statistika dan Komputasi, 2021
One way to deal with the presence of missing value or incomplete data is to impute the data using EM Algorithm. The need for large and fast data processing is necessary to implement parallel computing on EM algorithm serial program. In the parallel program architecture of EM Algorithm in this study, the controller is only related to the EM module whereas the EM module itself uses matrix and vector modules intensively. Parallelization is done by using OpenMP in EM modules which results in faster compute time on parallel programs than serial programs. Parallel computing with a thread of 4 (four) increases speed up, reduces compute time, and reduces efficiency when compared to parallel computing by the number of threads 2 (two).
Telematika, 2018
(SKTLK) masih manual dengan tools pengolah kata dan membutuhkan waktu yang lama, sehingga masyarakat mengalami kesulitan dalam proses pelayanannya. Polres Banyuwangi menjalankan Program Prioritas Promoter (Profesional, Modern dan Terpercaya) Kapolri Tahun 2016, khususnya program ke-2: Peningkatan Pelayanan Publik yang Lebih Mudah bagi Masyarakat dan Berbasis Teknologi Informasi. Tujuan dari penelitian ini adalah masyarakat (pemohon SKTLK) dapat mengakses layanan dengan mudah dan mendapatkan SKTLK lebih cepat di polres/polsek terdekat pada wilayah hukum kabupaten Banyuwangi. Metode yang digunakan dalam penelitian ini adalah Rapid Application Development (RAD) yang terdiri dari: Requirements Planning, User Design, Construction dan Cutover. Hasil penelitian ini adalah web tentang laporan kehilangan (ereport) dengan URL http://banyuwangi.jatim.polri.go.id/kehilangan.html. Kesimpulan dari penelitian ini adalah pelayanan publik pada Polres Banyuwangi tentang e-report dengan metode RAD dapat diakses pada web, sehingga pemohon dapat dengan mudah mendapatkan SKTLK di Polres atau Polsek yang terdekat dengan lokasi kehilangan. Metode RAD mempermudah dalam pembangunan layanan e-report berbasis web karena aktivitas dan fasenya melibatkan pengguna khususnya pada user design. Hasil pengujian terhadap fitur pada layanan e-report pada fase construction dan cutover dapat menampilkan sesuai dengan requirements planning yang ditetapkan pengguna.
Untuk memecahkan masalah pengurutan dalam membangun suatu program aplikasi, dibutuhkan algoritma pengurutan. Metode-metode pengurutan data pun ada berbagai jenis. Mulai dari binary sort, insertion sort, merge sort, Heap Sort dll. Heap Sort, algoritma pengurutan, merupakan salah satu metode pengurutan yang sering digunakan. Dalam penelitian ini penulis mengembangkan sebuah program aplikasi simulasi pengurutan data menggunakan algoritma Heap Sort. Program aplikasi kompresi yang dibuat dapat digunakan pada sistem operasi Windows 7 dan XP, dengan menggunakan bahasa pemrograman Microsoft Visual Basic 6.0.
A. PENGERTIAN ENCODING (PENGKODEAN) Pengkodean (Encoding) adalah proses perubahan karakter data yang akan dikirim dari suatu titik ke titik lain dengan kode yang dikenal oleh setiap termianal yang ada, dan menjadikan setiap karakter data dalam sebuah informasi digital ke dalam bentuk biner agar dapat ditransmisikan. Suatu terminal yang berbeda menggunakan kode biner yang berbeda untuk mewakili setiap karakter. B. TUJUAN PENGKODEAN (ENCODING) Tujuan dari Pengkodean (Encoding) adalah menjadikan setiap karakter data dalam sebuah informasi digital ke dalam bentuk biner agar dapat ditransmisikan dan bisa melakukan komunikasi data. Kode-kode yang digunakan dalam komunikasi data pada system computer memiliki perbedaan dari generasi ke generasinya, karena semakin besar dan kompleksnya data yang akan dikirim / digunakan. Dalam penyaluran data antar komputer, data yang disalurkan harus dimengerti oleh masing-masing perangkat baik oleh pengirim maupun penerima. Untuk itu digunakan system sandi sesuai standard. Suatu karakter didefinisikan sebagai huruf, angka, tanda aritmetik dan tanda khusus lainnya.
Permasalahan yang sering dihadapi dalam analisis data iklim ialah masalah ketersediaan data. Seringkali dijumpai dalam banyak kasus, data iklim lebih banyak tersedia dalam bentuk data bulanan dibandingkan dalam bentuk harian. Kondisi ini menyebabkan kegiatan analisis yang memerlukan data harian sulit untuk dilakukan. Ini juga merupakan salah satu masalah yang harus diselesaikan menggunakan analisis statistika yaitu dengan teknik pembangkitan data menggunakan metode Epstein dan Fourier (Nawaningsih 2013). Selain itu, Pembangkitan data iklim untuk masalah tidak tersedianya data iklim pada suatu lokasi dapat dilakukan dengan melakukan interpolasi parameter dari model stochastic. Banyak teknik yang tersedia, akan tetapi metode perhitungan untuk teknik-tekniknya cukup rumit misalnya Metode Kriging (Seaman dan Hutchinson 1985) dan Thiesen Polygon Weighting (De Jong et al. 1992). Akhirnya Boer et al. (1993a, 1993b) menemukan bahwa tehnik regresi dapat diterapkan untuk memberikan hasil yang cukup akurat.
Seminar Nasional Official Statistics
Salah satu ciri data statistik yang berkualitas adalah completeness. Namun, pada penyelenggaraan sensus atau survei, sering kali ditemukan masalah data hilang atau tidak lengkap (missing values), tidak terkecuali pada data Survei Sosial Ekonomi Indonesia (Susenas). Berbagai masalah dapat ditimbulkan oleh missing values. Oleh karena itu, masalah missing values harus ditangani. Imputasi adalah cara yang sering digunakan untuk menangani masalah ini. Terdapat beberapa metode imputasi yang telah dikembangkan untuk menangani missing values. Hot-deck Imputation dan K-Nearest Neighbor Imputation (KNNI) merupakan metode yang dapat digunakan untuk menangani masalah missing values. Metode Hot-deck Imputation dan KNNI memanfaatkan variabel prediktor untuk melakukan proses imputasi dan tidak memerlukan asumsi yang rumit dalam penggunaannya. Algoritma dan cara penanganan missing values yang berbeda pada kedua metode tentunya dapat menghasilkan hasil estimasi yang berbeda pula. Penelitian ini memb...
Jurnal EurekaMatika, 2021
Penelitian ini bertujuan untuk menentukan mengestimasi data yang kosong atau data yang hilang (Mising data). Missing data adalah hilangnya sebagian informasi atau sebagian data pada suatu penelitian. Metode yang digunakan untuk mengatasi missing data pada artikel ini Multivariate Imputation by Chained Equation (MICE). Penerapan MICE terdiri dari tiga langkah utama, yaitu imputasi, analisis, dan pooling. Hasil analisis terhadap data sekunder menghasilkan diperlukan lima kali imputasi untuk mengisi missing data. Langkah analisis menggunakan analisis regresi linear berganda, dengan lima model fit. Kemudian pada langkah pooling, ke-lima model fit regresi linear berganda yang dihasilkan digabungkan menjadi model pool. Selanjutnya model pool yang diperoleh dibandingkan dengan model regresi berganda data awal. Hasil perbandingan menunjukkan bahwa persamaan linear berganda dengan missing data yang diestimasi metode MICE mendekati persamaan liner berganda yang disusun dari data awal, dengan demikian estimasi missing data dengan metode MICE dapat dikatakan baik untuk digunakan.
2005
Tulisan singkat ini hendak menunjukkan suatu model untuk menilai kesediaan data spasial kita. Model ini berguna untuk mengukur kesesuaian nilai sumberdaya nasional (baca: anggaran) yang kita kerahkan dengan data spasial yang didapat, sekaligus untuk mendayagunakan data spasial yang sudah ada agar lebih bermanfaat lagi untuk menjadi instrumen pembangunan.
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.