Analisis Klasifikasi Penyakit Hewan dengan K-Nearest Neighbors (K-NN)
Analisis klasifikasi penyakit hewan menggunakan algoritma K-Nearest Neighbors (K-NN). Artikel ini mencakup dataset, konversi data kategorikal ke numerik, normalisasi data, perhitungan jarak Euclidean, dan prediksi menggunakan K-NN.
1. Dataset yang Digunakan
Dataset yang digunakan terdiri dari fitur-fitur sebagai berikut:
- Umur Hewan (dalam tahun)
- Jenis Kelamin (Jantan/Betina)
- Lingkungan (Indoor/Outdoor)
- Pola Makan (Seimbang/Tidak Seimbang)
- Kontak Hewan Sakit (Ada/Tidak Ada)
- Gejala
- Durasi Gejala (dalam hari)
- Tingkat Keparahan (skala 1-5)
- Jenis Penyakit (Menular/Tidak Menular)
Dataset Mentah:
| Umur Hewan | Jenis Kelamin | Lingkungan | Pola Makan | Kontak Hewan Sakit | Gejala | Durasi Gejala | Tingkat Keparahan | Jenis Penyakit |
|---|---|---|---|---|---|---|---|---|
| 3 tahun | Jantan | Indoor | Tidak Seimbang | Ada | Mata besar | 7 hari | 4 | Menular |
| 2 tahun | Jantan | Outdoor | Tidak Seimbang | Ada | Sering garuk-garuk | 10 hari | 4 | Menular |
| 5 tahun | Betina | Indoor | Seimbang | Tidak Ada | Demam | 3 hari | 1 | Tidak Menular |
| 1 tahun | Jantan | Indoor | Tidak Seimbang | Tidak Ada | Bersin-bersin | 5 hari | 4 | Menular |
| 2 tahun | Betina | Outdoor | Seimbang | Tidak Ada | Kehilangan nafsu makan | 5 hari | 3 | Tidak Menular |
2. Konversi Data Kategorikal ke Numerik
- Jenis Kelamin: Jantan = 1, Betina = 0
- Lingkungan: Indoor = 0, Outdoor = 1
- Pola Makan: Seimbang = 0, Tidak Seimbang = 1
- Kontak Hewan Sakit: Ada = 0, Tidak Ada = 1
- Jenis Penyakit (Target): Menular = 0, Tidak Menular = 1
3. Normalisasi Data
Normalisasi dilakukan dengan rumus:
Normalisasi untuk setiap fitur:
-
Umur Hewan
- ,
- Contoh: Untuk umur 3 tahun:
-
Durasi Gejala
- ,
- Contoh: Untuk durasi 7 hari:
Lakukan normalisasi ini untuk semua fitur dalam dataset.
4. Perhitungan Jarak Euclidean
Misalkan kita ingin mengklasifikasikan seekor kucing baru dengan fitur berikut:
| Umur Hewan | Jenis Kelamin | Lingkungan | Pola Makan | Kontak Hewan Sakit | Gejala (encoded) | Durasi Gejala | Tingkat Keparahan |
|---|---|---|---|---|---|---|---|
| 4 | 1 | 0 | 1 | 1 | 2 | 5 | 2 |
Menghitung jarak ke setiap data dalam dataset dengan rumus:
Contoh perhitungan jarak ke data pertama:
Perhitungan dilakukan untuk setiap titik dalam dataset.
5. Menentukan K dan Prediksi
Jika kita memilih , maka kita mengambil 3 tetangga terdekat berdasarkan jarak Euclidean. Jika mayoritas dari tetangga terdekat memiliki label "Menular", maka prediksi untuk kucing baru juga "Menular".
Dari hasil perhitungan jarak, jika lebih banyak tetangga terdekat memiliki penyakit Menular, maka kucing baru diprediksi juga memiliki penyakit Menular.
Metode K-NN ini membantu dalam mengklasifikasikan penyakit hewan berdasarkan pola gejala dan karakteristik lainnya. Model ini dapat dikembangkan lebih lanjut dengan penyesuaian nilai K, teknik penyaringan fitur, atau penggunaan model pembelajaran mesin lainnya untuk meningkatkan akurasi prediksi.
Apa Reaksi Anda?