Algoritma
Naive Bayes untuk Mencari Perkiraan Waktu Studi Mahasiswa
Keterangan :
Judul : Algoritma Naive Bayes untuk
Mencari Perkiraan Waktu Studi Mahasiswa
Penulis : Arief Janato
Volume : 18
Tahun : 2013
No : 1
Halaman : 1 s/d 8
1. PENDAHULUAN
Lama studi mahasiswa
sangatlah penting bagi mahasiswa, lamanya studi mahasiswa juga dapat
mempengaruhi dapat program studi serta perguruan tinggi yang bersangkutan.
Kualitas mahasiswa dapat dilihat dari aspek rata-rata lama waktu studi
mahasiswa itu sendiri. Banyak faktor yang mempengaruhi mengapa lamanya waktu
studi mahasiswa tersebut, maka dari itu ada gunannya digunakan program studi
yang kewajibannya memantau perkembangan studi dari mahasiswanya.
Sesuai dengan buku
peraturan akademik Universitas Stikubank (UNISBANK) Semarang
tahun akademik
2010/2011, Program Sarjana(S-1) reguler adalah program pendidikan akademik
setelah pendidikan menengah yang memiliki beban studi sekurang-kurangnya 144
sks dan sebanyak-banyaknya 160 sks yang dijadwalkan untuk 8 semester dan paling
lama 14 semester.
2. TUJUAN PENELITIAN
Tujuan penelitian ini adalah untuk memprediksi dengan
menggunakan algoritma naive bayes yang dapat dilakukan untuk prediksi terhadap
ketepatan waktu studi dari mahasiswa berdasarkan data training yang ada.
3. METODE PENELITIAN
Dengan menggunakan
teknik data mining. Dimana faktor nilai-nilai matakuliah yang telah ditempuh
hingga semester 4 (masa evaluasi tahap I) atau IPK sampai dengan semester 4 dan
faktor data induk mahasiswa yang berupa variabel prediktornya. Metode yang akan
digunakan adalah klasifikasi dengan algoritma naive bayes. Fungsi untuk
prediksi dibuat menggunakan Query pada MySql dalam bentuk function(fbayesian).
Obyek dan Tahapan penelitian dilakukan dengan cara menyiapkan data-data yang dibutuhkan sebagai topik utama untuk menyelesaikan permasalahan yang berkaitan. Dengan menggunakan algoritma, database, data mining yang digunakan untuk mengklsifikasi identitas mahasiswa tersebut.
Obyek dan Tahapan penelitian dilakukan dengan cara menyiapkan data-data yang dibutuhkan sebagai topik utama untuk menyelesaikan permasalahan yang berkaitan. Dengan menggunakan algoritma, database, data mining yang digunakan untuk mengklsifikasi identitas mahasiswa tersebut.
Evaluasi hasil belajar
dilakukan dengan cara mengolah data sesuai dengan peraturan akademik UNISBANK,
2010. Langkah proses data mining dapat dilihat sebagai berikut :
Gambar 1. Proses Data
Mining
- Persiapan data sebagai tahapan awal dilakukan dalam penelitian yaitu, proses Cleaning data yang digunakan untuk memining data apakah adata tersebut akan dihilangkan atau tidak ikut digunakan.
- Mengkonversi data untuk mempermudah proses mining.
- Algoritma Naive Bayes memprediksi probabilitas keanggotaan suatu class yang menampilkan hasil prediksi. Teorema Bayes memiliki bentuk umum sebagai berikut:
X
= Data dengan class yang belum diketahui
H = Hipotesis data X merupakan suatu class spesifik
P(H|X) = Probabilitas hipotesis H berdasarkan kondisi x
(posteriori prob.)
P(H)
= Probabilitas hipotesis H (prior prob.)
P(X|H) = Probabilitas X berdasarkan kondisi tersebut
P(X)
= Probabilitas dari X
4. HASIL dan PEMBAHASAN
Hasil dan Pembahasan meliputi :
- MySQL, dengan menggunakan MySql query browser dan function bayesian dapat memperoleh hasil prediksi.
- Microsoft Excel, digunakannya microsoft excel dilakukan untuk bantuan perhitungan data training dan data uji coba.
- Data Training, digunakan untuk mengambil data pada uji coba dan membuang record-recor yang mempunyai nilai field yang sama dari field sebelumnya.
Berikut diberikan contoh data yang belum diketahui kelasnya
sebagai berikut :
IPK
= 3
Jenis Kelamin = Perempuan
Kota Lahir = DALAM KOTA
Tipe Sekolah = Umum
Kota
Sekolah = LUAR KOTA
Gambar 2. Hasil uji coba procedure
bayesian
Selain
itu dilakukan perhitungan dengan menggunakan microsoft excel dengan data
training dan uji coba yang sama.
Tabel 1. Kesimpulan lama studi
Dimana hasil uji coba dilakukan
dengan mengambil data training dengan cara testing secara random dari master
data yang digunakan. Kemudian dilakukan uji coba sebanyak 5 kali dan jika
memperoleh hasil selisih kesalah maka akan tampak seperti tabel dibawah ini.
Tabel 2. Tingkat eror dengan data
training yang diambil secara random
Dari tabel diatas terlihat tingkat
eror atau kesalah prediksi, namun meski eror rata-ratanya rendah, sangat
dimungkinkan terjadi karena kondisi dari data yang dimasukan. Selanjutnya
menggunakan datatraining1_x digunakan untuk predikdi terhadap data testing pada
uji coba 1 hing uji coba 5, seperti tampak pada tabel dibawah ini.
Tabel 3. Daftar tingkat kesalahan
dari hasil uji coba yang dilakukan
Dapat dilihat
hasil tingkat kesalah prediksi pada saat menggunakan data yang mempunyai
tingkat inkonsitensi yang cukup tinggi. Dari hasil uji coba
diperoleh tingkat kesalahan prediksi berkisar 20% sampai dengan 50% dengan data
training dan testing yang diambil secara random. Namun rata-rata tingkat
kesalahan berkisar 20 % hingga 34%. Tinggi rendahnya tingkat kesalahan dapat
disebabkan oleh jumlah record data dan tingkat konsistensi dari data training
yang digunakan. Sedangkan hasil prediksi dari ketepatan lama studi dari
mahasiswa angkatan 2008 adalah sebesar 254 mahasiswa diprediksi ”Tepat Waktu”
dan sisanya yaitu 4 orang diprediksi ”Tidak Tepat Waktu”.
5. KESIMPULAN
Berdasarkan
uji coba yang telah dilakukan seperti pada gambar dan tabel sebelumnya, maka
dapat diambil kesimpulan bahwa, tingkat kesalahan klasifikasi yang digunakan
utuk memprediksi masih rendah yang memungkinkan dapat mempengaruhi hasil
testing yang dikeluarkan. Memanfaatkan teknik data mining menggunakan algoritma
naive bayes kita dapat mengetahui masa studi dari mahasiswa dengan menggunakan
uji coba testing yang telah diperoleh.
Jadi fakto yang mempengaruhi lama studi mahasiswa adalah ketetapan masa
studi setiap mahasiswa terhadap dari data akademik sekolah sebelum berada di
perguruan tinggi.
Arief Jananto. (2013). Program
Studi Sistem Informasi, Universitas Stikubank
Algoritma Naive Bayes untuk Mencari Perkiraan Waktu
Studi Mahasiswa. Jurnal Teknologi Informasi DINAMIK, Vol. 18, No.1, 8 halaman. Tersedia http://www.unisbank.ac.id/ojs/index.php/fti1/article/view/1669
0 komentar:
Posting Komentar