Hello Visitors!: Desember 2016

Kamis, 22 Desember 2016

KLASIFIKASI DATASET "BLOGGER"

Disusun Oleh:

1403015032 - Fachriyana Putra
1403015114 - Yogi Fachriyatul Utama

Deskripsi Permasalahan

Latar Belakang

Pada umumnya manusia mampu memprediksi atau memperkirakan suatu kejadian yang belum terjadi hanya dengan seringnya melihat pola dari suatu kejadian secara berulang, contohnya adalah prediksi terhadap pertandingan sepak bola antara tim A melawan tim B, dilihat dari sejarah pertandingan dari kedua tim tersebut dari 2 tahun terakhir, tim A lebih sering menang terhadap tim B. Dengan kenyataan tersebut maka kita bisa memprediksi petandingan berikutnya akan dimenangkan oleh tim A. Kemampuan ini jika diterapkan kedalam suatu sistem yang berupa perangkat lunak maupun perangkat keras, akan sangat berguna dalam banyak hal. Contoh aplikasinya adalah automatisasi dalam mengklasifikasikan objek atau barang dalam proses industri, analisis citra satelit, pencarian data citra di dalam halaman web atau basis data, peninjauan kualitas barang, dan lain-lain.

Dalam percobaan ini akan dicari hasil dari dataset sebuah blogger yang memuat penggunanya menulis berbagai topik dengan mempelajari isi dari data tersebut. Pengujian ini dilaksanakan dengan menggunakan 6 metode klasifikasi, yaitu BayesNet, SimpleLogistic, IBk, Bagging, JRip, J48. Pengujian tersebut juga dilakukan dengan menggunakan bantuan tools mesin pembelajaran yang disebut “WEKA (Wakaito Environment for Knowledge Analysis)”.

Tujuan

Tujuan utama penelitian ini adalah untuk memahami, menganalisa dan menerangkan secara ilmiah hasil dari pengujian yang dilakukan serta mengetahui tingkat akurasi dari teknikteknik penambangan data yang digunakan dalam percobaan.

Deskripsi Atribut

Degree_high, medium, low. nominal. untuk mencari nilai yang tertinggi, terendah atau sedang
Caprice_left, middle, right. nominal. untuk mencari nilai yang berada di kiri, kanan atau tengah
Topic_impression, political, news, tourism, scientific. nominal. mengklasifikasikan jenis tema tulisan
Lmt_yes, no. nominal.
Lpss_yes, no. nominal.
Pb_yes, no. nominal

Hasil Eksperimen

No. Eksperimen	Metode Classifier	Metode Evaluasi	F-Measure rata-rata
1	BayesNet	Use training set	0.695
2	SimpleLogistic	Use training set	0.585
3	Ibk	Cross-validation	0.685
4	Bagging	Percentage split	0.785
5	JRip	Cross-validation	0.785
6	J48	Percentage split	0.716

Kesimpulan

Akurasi dan performansi dari mesin pembelajaran sangat tergantung dari data yang ada serta pemahaman akan metode yang diterapkan, dalam penelitian ini diperoleh akurasi prediksi dengan angka tertinggi yang diraih oleh Bagging dan JRip.
Pembelajaran mesin untuk memprediksi suatu pola, akan lebih baik performansinya jika data yang dianalisis atau diolah sangat banyak.

Referensi

https://codemath.wordpress.com/category/data-mining/
http://semangatkecil.blogspot.co.id/2015/03/membuat-file-arff-untuk-data-weka-data.html
http://www.dataminingreporting.com/blog/knime-and-big-data
Jurnal "PREDIKSI KEPUTUSAN MENGGUNAKAN METODE KLASIFIKASI NAÏVE BAYES, ONE-R, DAN DECISION TREE", Bahrawi As’ad

Senin, 12 Desember 2016

LEARNING DECISION TREE

Hallo readers!! Di kesempatan kali ini kita akan membahas satu topik yang cukup menarik yaitu pohon keputusan atau Decision Tree pada data mining.

Secara sederhana Decision Tree ini merupakan sebuah metode klasifikasi yang dibangun untuk mendapatkan sebuah kesimpulan dari sejumlah data. Penarikan kesimpulan dibuat dalam bentuk pohon, dimana nantinya hasil kesimpulan berbentuk hirarki pohon yaitu dari akar, batang dan daun yang merepresentasikan hasil keputusan didapat.

Secara mendetail untuk lebih memahami konsep ini kita akan jabarkan pada penulisan dibawah ini

Berdasarkan materi diatas, ada sebuah kasus yang dapat diselesaikan dengan decision tree seperti berikut:

Training Set (data latih) yang disediakan ada 12 data. Contoh positif dari data latih adalah yang memiliki goal WillWait=yes sedangkan sisanya (WillWait=no) adalah contoh negatif.

Tujuan teori ini untuk membuat pohon sekecil mungkin. Pertama hitung dahulu keseluruhan entropi / training set nya lalu hitung gain masing-masing atribut dengan rumus entropi

Kita telah mendapat nilai patron dengan gain terbesar, Dan patron ini akan digunakan sebagai akar untuk mencari nilai selanjutnya

Langkah berikut kita akan gunakan hungry menjadi induk pohon dan menguji lagi nilai yang belum pasti dengan gain dan entropi

Terlihat bahwa type menjadi nilai gain yang terbesar, maka type digunakan untuk pohon berikutnya

Setelah menghitung kembali nilai gain dengan nilai yang berbeda-beda, langkah terakhir dipilih friday sebagai atribut pohon yang jelas nilai kebenarannya.

Bila ada kesalahan atau kekurangan silahkan beri masukan di kolom komentar ya!! cmiwww..

Referensi:

http://tutorcollection.com/konsep-pohon-keputusan-decision-tree-data-mining/
http://newbiegameku.blogspot.co.id/2014/07/pengertian-decision-tree.html
https://prezi.com/-mlsksa32fgq/decision-tree/

Pengantar Kecerdasan Tiruan (5B)

Dosen: Mia Kamayani Sulaeman, ST., MT.

Oleh:

Fachriyana Putra - 1403015032
Ngasroh Vaim - 1403015085
Yogi Fachriyatul Utama - 1403015114

Hello Visitors!

Kamis, 22 Desember 2016

KLASIFIKASI DATASET "BLOGGER"

Senin, 12 Desember 2016

LEARNING DECISION TREE

Popular Posts

Mengenai Saya

Arsip Blog

Labels