Kamis, 22 Desember 2016

KLASIFIKASI DATASET "BLOGGER"

Disusun Oleh:
  1. 1403015032 - Fachriyana Putra
  2. 1403015114 - Yogi Fachriyatul Utama

Deskripsi Permasalahan
  • Latar Belakang
         Pada umumnya manusia mampu memprediksi atau memperkirakan suatu kejadian yang belum terjadi hanya dengan seringnya melihat pola dari suatu kejadian secara berulang, contohnya adalah prediksi terhadap pertandingan sepak bola antara tim A melawan tim B, dilihat dari sejarah pertandingan dari kedua tim tersebut dari 2 tahun terakhir, tim A lebih sering menang terhadap tim B. Dengan kenyataan tersebut maka kita bisa memprediksi petandingan berikutnya akan dimenangkan oleh tim A. Kemampuan ini jika diterapkan kedalam suatu sistem yang berupa perangkat lunak maupun perangkat keras, akan sangat berguna dalam banyak hal. Contoh aplikasinya adalah automatisasi dalam mengklasifikasikan objek atau barang dalam proses industri, analisis citra satelit, pencarian data citra di dalam halaman web atau basis data, peninjauan kualitas barang, dan lain-lain.
       Dalam percobaan ini akan dicari hasil dari dataset sebuah blogger yang memuat penggunanya menulis berbagai topik dengan mempelajari isi dari data tersebut. Pengujian ini dilaksanakan dengan menggunakan 6 metode klasifikasi, yaitu BayesNet, SimpleLogistic, IBk, Bagging, JRip, J48. Pengujian tersebut juga dilakukan dengan menggunakan bantuan tools mesin pembelajaran yang disebut “WEKA (Wakaito Environment for Knowledge Analysis)”.
  • Tujuan
      Tujuan utama penelitian ini adalah untuk memahami, menganalisa dan menerangkan secara ilmiah hasil dari pengujian yang dilakukan serta mengetahui tingkat akurasi dari teknikteknik penambangan data yang digunakan dalam percobaan.


Deskripsi Atribut
  1. Degree_high, medium, low. nominal. untuk mencari nilai yang tertinggi, terendah atau sedang
  2. Caprice_left, middle, right. nominal. untuk mencari nilai yang berada di kiri, kanan atau tengah
  3. Topic_impression, political, news, tourism, scientific. nominal. mengklasifikasikan jenis tema tulisan
  4. Lmt_yes, no. nominal. 
  5. Lpss_yes, no. nominal.
  6. Pb_yes, no. nominal

Hasil Eksperimen

No. Eksperimen Metode Classifier Metode Evaluasi F-Measure rata-rata
1 BayesNet Use training set 0.695
2 SimpleLogistic Use training set 0.585
3 Ibk Cross-validation 0.685
4 Bagging Percentage split 0.785
5 JRip Cross-validation 0.785
6 J48 Percentage split 0.716


Kesimpulan
  1. Akurasi dan performansi dari mesin pembelajaran sangat tergantung dari data yang ada serta pemahaman akan metode yang diterapkan, dalam penelitian ini diperoleh akurasi prediksi dengan angka tertinggi yang diraih oleh Bagging dan JRip.
  2. Pembelajaran mesin untuk memprediksi suatu pola, akan lebih baik performansinya jika data yang dianalisis atau diolah sangat banyak.

Referensi
  • https://codemath.wordpress.com/category/data-mining/
  • http://semangatkecil.blogspot.co.id/2015/03/membuat-file-arff-untuk-data-weka-data.html
  • http://www.dataminingreporting.com/blog/knime-and-big-data 
  • Jurnal "PREDIKSI KEPUTUSAN MENGGUNAKAN METODE KLASIFIKASI NAÏVE BAYES, ONE-R, DAN DECISION TREE", Bahrawi As’ad

Senin, 12 Desember 2016

LEARNING DECISION TREE

Hallo readers!! Di kesempatan kali ini kita akan membahas satu topik yang cukup menarik yaitu pohon keputusan atau Decision Tree pada data mining.

Secara sederhana Decision Tree ini merupakan sebuah metode klasifikasi yang dibangun untuk mendapatkan sebuah kesimpulan dari sejumlah data. Penarikan kesimpulan dibuat dalam bentuk pohon, dimana nantinya hasil kesimpulan berbentuk hirarki pohon yaitu dari akar, batang dan daun yang merepresentasikan hasil keputusan didapat.

Secara mendetail untuk lebih memahami konsep ini kita akan jabarkan pada penulisan dibawah ini



Berdasarkan materi diatas, ada sebuah kasus yang dapat diselesaikan dengan decision tree seperti berikut:


Training Set (data latih) yang disediakan ada 12  data. Contoh positif dari data latih adalah yang memiliki goal WillWait=yes sedangkan sisanya (WillWait=no) adalah contoh negatif.

Tujuan teori ini untuk membuat pohon sekecil mungkin. Pertama hitung dahulu keseluruhan entropi / training set nya lalu hitung gain masing-masing atribut dengan rumus entropi





  




Kita telah mendapat nilai patron dengan gain terbesar, Dan patron ini akan digunakan sebagai akar untuk mencari nilai selanjutnya







Langkah berikut kita akan gunakan hungry menjadi induk pohon dan menguji lagi nilai yang belum pasti dengan gain dan entropi




Terlihat bahwa type menjadi nilai gain yang terbesar, maka type digunakan untuk pohon berikutnya



Setelah menghitung kembali nilai gain dengan nilai yang berbeda-beda, langkah terakhir dipilih friday sebagai atribut pohon yang jelas nilai kebenarannya.

Bila ada kesalahan atau kekurangan silahkan beri masukan di kolom komentar ya!! cmiwww..




Referensi: 
  1. http://tutorcollection.com/konsep-pohon-keputusan-decision-tree-data-mining/
  2. http://newbiegameku.blogspot.co.id/2014/07/pengertian-decision-tree.html
  3. https://prezi.com/-mlsksa32fgq/decision-tree/

Pengantar Kecerdasan Tiruan (5B)

Dosen: Mia Kamayani Sulaeman, ST., MT. 

Oleh:
  • Fachriyana Putra - 1403015032
  • Ngasroh Vaim - 1403015085
  • Yogi Fachriyatul Utama - 1403015114