Prediksi Kelulusan Mahasiswa dengan Random Forest
Analisis kelulusan mahasiswa menggunakan algoritma Random Forest untuk memprediksi keberhasilan akademik. Cocok untuk skripsi, tugas akhir, atau studi AI pendidikan dari ITS Academics.
Pendahuluan
Prediksi kelulusan mahasiswa semakin penting dalam dunia pendidikan, terutama di era digital saat ini. Institusi pendidikan seperti ITS Academics dan layanan akademik seperti jasa joki skripsi kini memanfaatkan teknologi AI dan machine learning untuk memantau performa mahasiswa secara proaktif. Algoritma Random Forest menjadi salah satu metode populer karena kemampuannya dalam menangani data kompleks dan memberikan hasil prediksi yang akurat.
Deskripsi Data
Dataset yang digunakan dapat mencakup:
-
ipk: Indeks Prestasi Kumulatif
-
jumlah_sks: Total SKS yang diambil
-
kehadiran: Persentase kehadiran
-
aktivitas_lms: Frekuensi akses platform pembelajaran
-
lulus: Label target (1 = Lulus, 0 = Tidak Lulus)
Implementasi Python dengan Random Forest
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score
# Contoh dataset sederhana
data = {
'ipk': [3.2, 2.5, 3.7, 2.0, 3.0, 3.6, 2.8, 3.1],
'jumlah_sks': [144, 110, 150, 90, 138, 148, 120, 140],
'kehadiran': [90, 70, 95, 60, 85, 98, 75, 88],
'aktivitas_lms': [50, 20, 65, 10, 45, 70, 30, 55],
'lulus': [1, 0, 1, 0, 1, 1, 0, 1]
}
df = pd.DataFrame(data)
# Fitur dan target
X = df[['ipk', 'jumlah_sks', 'kehadiran', 'aktivitas_lms']]
y = df['lulus']
# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Inisialisasi dan training model
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
# Prediksi dan evaluasi
y_pred = model.predict(X_test)
print("Akurasi:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))
Analisis & Visualisasi
Dari hasil evaluasi model, kita bisa melihat akurasinya berkisar 85–90% tergantung kompleksitas dan ukuran dataset. Fitur ipk dan kehadiran biasanya memiliki pengaruh tertinggi terhadap prediksi kelulusan.
Jika ingin menambahkan visualisasi feature importance:
import matplotlib.pyplot as plt
importances = model.feature_importances_
feature_names = X.columns
plt.figure(figsize=(6, 4))
plt.barh(feature_names, importances, color='skyblue')
plt.xlabel("Importance Score")
plt.title("Feature Importance - Random Forest")
plt.show()
Kesimpulan
Penggunaan algoritma Random Forest untuk prediksi kelulusan mahasiswa sangat efektif untuk diterapkan dalam pengelolaan akademik, baik oleh kampus seperti ITS, platform digital seperti itsacademics, maupun pihak penyedia layanan jasa joki skripsi yang ingin menawarkan bantuan berbasis data. Proyek ini juga sangat cocok untuk dijadikan topik skripsi atau tugas akhir di bidang teknik informatika atau data science.
Apa Reaksi Anda?