Noviana Purnamasari: Konsep Data Mining

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI

Apotek sebagai salah satu organisasi yang menghasilkan data penjualan setiap hari, belum dapat memaksimalkan pemanfaatan data tersebut. Data penjualan hanya disimpan tanpa dilakukan analisis lebihlanjut. Diperlukan suatu aplikasi untuk menganalisis keranjang pasar data transaksi penjualan obat dengan menggunakan data mining sebagai suatu teknik analisis data yang dapat membantu apotek memperoleh pengetahuan berupa pola-pola penjualan dalam periode bulan tertentu. Aplikasi data mining dibangun menggunakan proses sekuensial linear dengan bahasa pemrograman PHP dan basis data MySQL.
Algoritma yang digunakan sebagai proses utama dari analisis keranjang pasar adalah algoritma apriori dengan menggunakan parameter minimum support, minimum confidence, dan periode bulan transaksi penjualan untuk menemukan aturan asosiasi. Aplikasi data mining menghasilkan aturan asosiasi antar item pada bulan Februari 2012 yaitu konsumen melakukan transaksi pembelian obat jenis obat darah dan analgesik secara bersamaan dengan support sebesar 2,08% dan confidence sebesar 45,45%. Dengan demikian, jika terdapat seorang konsumen membeli jenis obat darah maka kemungkinan terdapat 45,45% konsumen membeli jenis analgesik.

Data Mining

Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari berbagai basis data besar
Data mining sering juga disebut Knowledge Discovery in Database atau disingkat menjadi KDD, adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.

Tahapan proses KDD yaitu :

Data Selection

1) Data obat, merupakan data yang berisi jenis obat. Atribut data obat antara lain id, nama,keterangan.

2) Data transaksi merupakan data mengenai catatan transaksi penjualan suatu obat. Atribut data ini antara lain id, tgl, no_resep, jenis_penjualan, customer, nama_dokter, nama_pasien, resep.

3) Data detil transaksi merupakan data mengenai detil dari suatu transaksi penjualan. Atribut data detil penjualan terdiri atas id_transaksi dan id_obat.

Pre-procesesing

1) Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yang diperoleh dari basis data suatu perusahaan, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki.

2) Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai basis data ke dalam suatu basis
data baru. Data yang diperlukan untuk data mining tidak hanya berasal dari satu basis data tetapi juga berasal dari beberapa basis data. Integrasi data dilakukan pada atribut atribut yang mengidentifikasikan entitasentitas yang unik seperti atribut nama, jenis produk, nomor pelanggan, dan lainnya.

3) Seleksi data (data selection)

Data yang ada pada basis data seringkali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk proses analisis yang akan diambil dari basis data. Sebagai contoh, sebuah kasus yang meneliti faktor kecenderungan orang membeli dalam kasus analisis keranjang belanja, tidak perlu mengambil nama pelanggan, cukup dengan id pelanggan.

4) Transformasi data (data transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan.

5) Proses mining

Proses mining merupakan proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

6) Evaluasi pola (pattern evaluation)

Evaluasi pola bertujuan untuk menemukan pola-pola menarik ke dalam basis pengetahuan yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai.

7) Presentasi pengetahuan (knowledge presentation)

Presentasi pengetahuan merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh .

Algoritma Apriori

Apriori adalah algoritma yang digunakan dalam melakukan pencarian frequent itemset untuk mendapatkan aturan asosiasi. Sesuai dengan namanya, algoritma ini menggunakan prior knowledge mengenai frequent itemset properties yang telah diketahui sebelumnya untuk memproses informasi selanjutnya. Apriori menggunakan pendekatan secara iterative yang disebut juga sebagai level-wish search dimana k itemset digunakan untuk mencari (k+1)-itemset.
Pertama-tama dicari set dari frequent 1-itemset, set ini dinotasikan sebagai L1. L1 yaitu large itemset pertama yang digunakan untuk menemukan L2, kemudian set dari frequent 2-itemset digunakan untuk menemukan L3, dan seterusnya sampai tidak ada lagi frequent kitemset yang dapat ditemuka.

Cara kerja apriori :

1. Tentukan minimum support
2. Iterasi 1 : hitung item-item dari support(transaksi yang memuat seluruh item) dengan men-scan database untuk 1-itemset, setelah 1-itemset didapatkan, dari 1-itemset apakah diatas minimum support, apabila telah memenuhi minimum support, 1-itemset tersebut akan menjadi pola frequent tinggi,
3.Iterasi 2 : untuk mendapatkan 2-itemset, harus dilakukan kombinasi dari k-itemset sebelumnya, kemudian scan database lagi untuk hitung item-item yang memuat support. itemset yang memenuhi minimum support akan dipilih sebagai pola frequent tinggi dari kandidat
4. Tetapkan nilai k-itemset dari support yang telah memenuhi minimum support dari k-itemset
lakukan proses untuk iterasi selanjutnya hingga tidak ada lagi k-itemset yang memenuhi minimum support.

Sumber :
http://stmik-budidarma.ac.id/ejurnal/index.php/pelita/article/view/212

Noviana Purnamasari

Kamis, 05 April 2018

Konsep Data Mining

Tidak ada komentar:

Posting Komentar