DATA MINING Output: Knowledge Representation

Pada kesempatan kali ini saya akan sedikit mereview tugas data minig dengan tema “Output: Knowledge Representation” terdapat di chapter 3 dari buku “Data Mining Practical Machine Learning Tools and Techniques Fourth Edition” karangan Ian H. Witten, Eibe Frank, Mark A. Hall dan Christopher J. Pal yang telah diberikan oleh Bapak Dr. Arya Adhyaksa Waskita.
Dalam hal ini saya akan mengambil beberapa topik dari tema yang saya ambil. Kita akan melihat bagaimana knowledge dapat diwakili oleh Decision Table dan Decision Trees.
Decision Table secara umum mirip dengan konsep Decision Tress yaitu sama-sama menggunakan konsep dasar if-else atau switch-case. Bedanya hanya pada bagian representasi dimana decision table menggunakan tabel.
Tabel akan dibagi menjadi 2 bagian besar, yaitu kondis dan aksi. Kondisi merupakan hal-hal yang mempengaruhi pengambilan keputusan sementara aksi merupakan keputusan yang diambil. Keputusan yang diambil bisa lebih dari 1.
Gunakan format yang sama dengan input dengan contoh Decision Table untuk data cuaca

OutlookHumidityPlay
SunnyHighNo
SunnyNormalYes
OvercastHighYes
OvercastNormalYes
RainyHighNo
RainyNormalNo
Kita hanya mencari kondisi yang sesuai untuk memutuskan apakah akan bermain atau tidak. proses yang sama dapat digunakan untuk prediksi numerik juga dalam hal ini, struktur kadang-kadang disebut sebagai tabel regresi. Kurang sepele untuk membuat keputusan atau tebel regresi mungkin melibatkan memilih beberapa atribut. jika suhu tidak relevan dengan keputusan, misalnya, tabel yang lebih kecil dan padat dengan atribut yang hilang akan menjadi panduan yang lebih baik. Masalahnya adalah memutuskan atribut apa yang harus ditinggalkan tanpa mempengaruhi keputusan akhir.
Decision Trees merupakan sebuah metode dalam memprediksi/menyimpulkan nilai sebuah item/kategori/kelas berdasarkan nilai-nilai item lain yang mempengaruhinya. Secara gampangnya menghasilkan kesimpulan terhadap sebuah item berdasarkan nilai beberapa input item.

Decision Tree di atas menunjukkan alur pengambilan keputusan seseorang berdasarkan beberapa nilai beberapa item yaitu Outlook, Humidity, dan Windy. Pada leaf node merupakan tindakan yang akan diambil sementara inner node menunjukkan item yang menjadi input dan tiap cabang dari inner node mewakili dari salah satu nilai yang dimiliki oleh inner node tersebut.

RULE

Aturan adalah alternatif yang populer untuk pohon keputusan, dan kami telah melihat contoh untuk data cuaca, lensa kontak, iris, dan kedelai.anteseden, atau prekondisi, aturan adalah serangkaian tes seperti tes di node dalam pohon keputusan, sedangkan konsekuen, atau kesimpulan, memberikan kelas atau kelas yang berlaku untuk contoh yang dicakup oleh aturan itu, atau mungkin memberikan distribusi probabilitas di atas kelas. Secara umum, prasyaratnya secara logis dan bersama, dan semua tes harus berhasil jika aturannya adalah untuk menembak.
Namun, dalam beberapa aturan formulasi prakondisi adalah ekspresi logis umum daripada konjungsi sederhana. Kita sering menganggap aturan individu sebagai efektif secara logis atau bersama-sama: jika ada yang berlaku, kelas (atau distribusi probabilitas) yang diberikan dalam kesimpulannya diterapkan pada instance. Namun, konflik muncul ketika beberapa aturan dengan berbagai kesimpulan berbeda berlaku; kami akan segera kembali ke ini.

Penggunaan Weka pada Decision Tree

disini saya menggunakan weka terbaru yakni versi 3.9 bisa didownload di situs resmi weka yaitu https://www.cs.waikato.ac.nz/ml/weka/
silahkan download geratis Setelah Weka dipasang dikomputer, selanjutnya kita dapat melakukan beberapa percobaan algoritma. Weka juga telah menyediakan dataset bawaan seperti iris, cpu, diabetes dan lainnya dalam format *.arff. berikut tampilan GUI  Weka

disini saya akan ambil contoh dataset bawaan dari weka sendiri yakni weather.nominal.arff

terlihat banyak dataset yang tersedia di weka, atau bisa mengambil dataset dari luar yakni salah satu situs penyedia dataset yaitu https://archive.ics.uci.edu/ml/datasets.html

langkah selanjutnya dari tampilan weka di atas silahkan pilih menu explorer

pilih open file lalu cari dimana letak dataset yang tersedia, disini saya ambil di direktori C:\Program Files\Weka-3-9\data

setelah dipilih datasetnya nanti akan menampilkan gambar seperti dibawah ini

dari gambar diatas pilih tab classify-choose pilih folder tree J48-C 0.25-M 2 lalu klik start tunggu proses selesai

klik kanan di dalam kotak result list lalu pilih visual tree nanti akan muncul gambar seperti ini

proses selesai.

Komentar

Postingan populer dari blog ini

Ensemble Learning - Boosting

Image processing histogram