Definisi Data mining dan implementasi beserta rangkuman jurnal implementasi data mining
Sebelumnya Apa itu DATA MINING ?
1. Data mining
adalah proses penambahan data yang mana di dalamnya menggunakan metode-metode seperti matematika, statistika ataupun artificial
intelligence yang fungsinya untuk penambahan data dengan skala besar
2. Data mining
adalah proses menemukan anomali, pola, atau korelasi dalam kumpulan data yang besar untuk memprediksi hasil. Fondasi data mining itu sendiri berhubungan dengan bidang-bidang seperti statistik, AI, pembelajaran mesin, dan teknologi database. Data mining juga dikenal dengan nama lain Analisis data/pola, penemuan pengetahuan, ekstraksi pengetahuan, dan pengumpulan informasi
3. Data mining
adalah proses mengumpulkan informasi penting dari data besar. Pengumpulan informasi dilakukan dengan menggunakan beberapa proses, termasuk metode statistik, matematika, dan teknik kecerdasan buatan. Secara khusus, data mining didefinisikan sebagai alat dan aplikasi yang menggunakan analisis statistik data dan menyaring serta menyimpan data sebanyak mungkin.
Dalam Bahasa Inggris
1. Data mining, also known as knowledge innovation in data (KDD), is the process of uncovering patterns & other valuable information according to the formation of big data.
2. Data mining is the process of finding useful information in large data sets. Data mining uses mathematical analysis to find patterns and trends in data. Usually, this pattern cannot be detected using traditional data mining because the relationship is too complex or there is too much data.
3. Data mining is a process that is usually used by companies to convert raw data into information and usually uses software to access very large data.
Kesimpulan Definisi diatas
Jadi pada dasar nya data mining adalah penambahan data yang mana memiliki beberapa metode seperti statistika, matematika hingga artificial intelligence sehingga berhubungan dengan kecerdasaan buatan ataupun pembelajaran mesin guna mempermudah dalam mengakses data yang sangat besar, dan hal ini membutuhkan suatu perangkat lunak untuk meng aksesnya.
Implementasi data mining yang ada pada saat ini
1. Di bidang bisnis contoh pentingnya sistem persediaan barang di suatu Apotek dan jenis barang apa yang menjadi prioritas utama yang harus di stok untuk mengantisipasi kekosongan barang. Karena minimnya stok barang dapat berpengaruh pada pelayanan konsumen dan pendapatan Apotek. jadi ketersediaan berbagai jenis alat-alat kesehatan di Apotek sebagai salah satu supplier alat-alat kesehatan, untuk mendukung kelancaran penyalurannya kepada konsumen, sehingga aktivitas pelayanan konsumen berjalan dengan baik. Contoh algoritma nya yaitu algoritma Apriori.
2. Untuk informasi kelulusan, contoh memprediksi kelulusan mahasiswa sebagai acuan pengambilan kebijakan dan tindakan akademik di bidang Biro Administrasi Akademik danKemahasiswaan (BAAK) dalam mengurangi siswa yang lulus terlambat dan tidak lulus. Contoh algoritma nya yaitu algoritma C4.5
3. untuk mengevaluasi kinerja akademik mahasiswa, contoh untuk membentuk tabel probabilitas sebagai dasar proses klasifikasi kinerja akademik mahasiswa yang kelulusannya akan diklasifikasikan dan memberikan rekomendasi untuk proses kelulusan tepat waktu yang paling tepat dengan nilai optimal berdasarkan histori nilai yang telah ditempuh mahasiswa. Contoh algoritma nya yaitu algoritma Naive Bayes Classifier (NBC)
Rangkuman Jurnal
Implementasi Data Mining untuk Evaluasi Kinerja Akademik Mahasiswa
Menggunakan Algoritma Naive Bayes Classifier (NBC)
Penelitian ini berfokus untuk melakukan evaluasi kinerja akademik mahasiswa STMIK Dipanegara Makassar pada dua tahun pertama. Teknik yang di gunakan adalah teknik data mining algoritma Naive Bayes Classifier (NBC).mengapa, karna hal ini dapata berguna untuk proses kelulusan mahasiswa agar proses kelulusan nya tepat waktu tentunya dengan nilai yang optimal berdasarkan nilai-nilai mahasiswa sebelumnya.
Mahasiswa merupakan objeck sebagai penunjang keberhasilan terhadap penelitian ini guna mengevaluasi kinerja akademik nya.
Pada dasarnya akan dibuatkan sebuah sistem untuk mengklasifikasikan kelulusan mahasiswa dengan cara mengevaluasi kinerja pada tahun pertama dan tahun kedua. penggunaan teknik data mining untuk menemukan pola kelulusan mahasiswa yang sudah lulus, kemudian dijadikan dasar untuk mengklasifikasikan mahasiswa tahun kedua yang bisa lulus tepat waktu dan yang tidak.
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran computer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Data mining juga merupakan proses menemukan korelasi baru yang bermanfaat, pola dan trend dengan menambang sejumlah repositori data dalam jumlah yang besar, memanfaatkan teknologi pengenalan pola seperti statistik ataupun teknik matematika
penerapan proses data mining untuk mengevaluasi performa akademik mahasiswa dengan metode klasifikasi di Universitas Klabat. Metode yang digunakan pada penelitian ini adalah metode eksperimen dan deskriptif, Hasil yang didapat yaitu untuk mencapai semester akhir dalam 4 tahun seorang mahasiswa diawal semester berdasarkan pohon keputusan yang terbentuk yaitu mahasiswa yang mempunyai indeks prestasi 3.5 – 3.87. Dalam penelitian ini, Teknik yang digunakan adalah algoritma Naïve Bayes Classifier (NBC) yang merupakan sebuah pengklasifikasian probabilitas sederhana yang mengaplikasikan teorema bayes. Algoritma NBC dapat mengolah data kuantitatif dan data diskrit yang hanya memerlukan sejumlah kecil data pelatihan untuk perhitungan estimasi peluang yang dibutuhkan untuk klasifikasi
Algoritma adalah (1) teknik penyusunan langkah/tahap penyelesaian masalah dalam bentuk kalimat dengan jumlah kata yang terbatas, tetapi tersusun secara logis dan sistematis.
Naive Bayes Classifier adalah sebuah metoda klasifikasi yang berdasar pada teoremaBayes. Metode pengklasifikasian ini menggunakan metode probabilitas dan statistik yang pertama kali dikemukakan oleh ilmuwan Inggris bernama Thomas Bayes, yaitu suatu metode untuk memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya, sehingga metode ini dikenal sebagaiTeorema Bayes.
Dalam menguji akurasi dan ketepatan hasil pengklasifikasian pada penelitian ini digunakan 26 data alumni yang diambil secara acak.
Perhitungan yang dihasilkan dari rumus ini terdiri dari 4 jenis keluaran, antara lain recall, accuracy, precision, dan error rate.
1. Recall adalah proporsi kasus positif yang diidentifikasi dengan benar, rumus recall =
D/(C+D)
2. Accuracy adalah perbandingan kasus yang teridentifikasi benar dengan jumlah semua kasus,
rumus dari accuracy= (A+D)/(A+B+C+D)
3. Precision adalah proporsi kasus dengan hasil positif yang benar, rumus dari Precision =
D/(B+D)
4. Error Rate adalah kasus yang teridentifikasi salah yang dibandingkan dengan jumlah semua
kasus, rumus dari Error Rate = (B+C)/( A+B+C+D)
Keterangan:
A = jika hasil prediksi Terlambat dan data sebenarnya Terlambat.
B = jika hasil prediksi Tepat Waktu sedangkan nilai sebenarnya Terlambat.
C = jika hasil prediksi Terlambat sedangkan nilai sebenarnya Tepat Waktu.
D = jika hasil prediksi Tepat Waktu dan nilai sebenarnya Tepat Waktu.
Komentar ini telah dihapus oleh pengarang.
BalasHapus