Prediksi Harga Rumah Menggunakan Linear Regression
Proyek ini membahas bagaimana algoritma Linear Regression dapat digunakan untuk memprediksi harga rumah berdasarkan berbagai fitur properti. Sangat relevan untuk pembelajaran machine learning, tugas akhir, dan skripsi bersama ITS Academics.
Pendahuluan
Prediksi harga rumah merupakan salah satu studi kasus paling populer dalam dunia data science dan machine learning. Algoritma Linear Regression dapat digunakan untuk membangun model prediktif berdasarkan fitur-fitur seperti jumlah kamar, ukuran tanah, dan lokasi. Proyek ini cocok dijadikan bahan skripsi, tugas akhir, maupun portofolio machine learning, terutama dengan dukungan dari ITS Academics dan layanan jasa joki skripsi.
Deskripsi Dataset
Dataset yang digunakan adalah Boston Housing Dataset, yang berisi informasi dari 506 rumah di daerah Boston dengan 13 fitur prediktor.
| Fitur | Deskripsi |
|---|---|
| CRIM | Tingkat kejahatan per kapita |
| ZN | Proporsi tanah dengan zonasi residensial |
| INDUS | Proporsi bisnis non-retail per kota |
| CHAS | Dummy variable untuk sungai Charles |
| NOX | Konsentrasi nitrogen oksida |
| RM | Jumlah rata-rata kamar per rumah |
| AGE | Proporsi rumah yang dibangun sebelum 1940 |
| DIS | Jarak ke lima pusat kerja utama |
| RAD | Aksesibilitas ke jalan raya |
| TAX | Tarif pajak properti per $10,000 |
| PTRATIO | Rasio murid-guru per kota |
| B | 1000(Bk - 0.63)^2 di mana Bk = proporsi kulit hitam |
| LSTAT | Persentase status sosial ekonomi rendah |
| MEDV | Nilai median rumah (dalam ribuan dolar) |
Rumus Linear Regression
Model regresi linear sederhana dapat dinyatakan sebagai:
Dimana:
-
adalah target (harga rumah)
-
adalah fitur prediktor
-
adalah koefisien regresi
-
adalah error model
Implementasi Python dengan Linear Regression
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
# Load dataset
boston = load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['MEDV'] = boston.target
# Fitur dan target
X = df.drop('MEDV', axis=1)
y = df['MEDV']
# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Model
model = LinearRegression()
model.fit(X_train, y_train)
# Prediksi dan evaluasi
y_pred = model.predict(X_test)
print("RMSE:", np.sqrt(mean_squared_error(y_test, y_pred)))
print("R^2 Score:", r2_score(y_test, y_pred))
Visualisasi Korelasi Fitur
plt.figure(figsize=(12, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.title("Korelasi Antar Variabel pada Dataset Boston Housing")
plt.show()
Plot Hasil Regresi
plt.scatter(y_test, y_pred)
plt.xlabel("Actual Price")
plt.ylabel("Predicted Price")
plt.title("Prediksi Harga Rumah vs Nilai Aktual")
plt.show()
Kesimpulan
Algoritma Linear Regression sangat cocok digunakan untuk prediksi harga rumah karena mudah diinterpretasikan dan memiliki performa cukup baik untuk data numerik. Proyek ini cocok untuk mahasiswa yang ingin belajar machine learning secara praktikal dengan bimbingan dari ITS Academics atau layanan jasa joki skripsi yang terpercaya. Dataset ini juga dapat dikembangkan lebih lanjut menggunakan algoritma lain seperti Random Forest atau Gradient Boosting untuk hasil lebih akurat.
Apa Reaksi Anda?