Prediksi Harga Rumah Menggunakan Linear Regression

Proyek ini membahas bagaimana algoritma Linear Regression dapat digunakan untuk memprediksi harga rumah berdasarkan berbagai fitur properti. Sangat relevan untuk pembelajaran machine learning, tugas akhir, dan skripsi bersama ITS Academics.

Prediksi Harga Rumah Menggunakan Linear Regression

Pendahuluan
Prediksi harga rumah merupakan salah satu studi kasus paling populer dalam dunia data science dan machine learning. Algoritma Linear Regression dapat digunakan untuk membangun model prediktif berdasarkan fitur-fitur seperti jumlah kamar, ukuran tanah, dan lokasi. Proyek ini cocok dijadikan bahan skripsi, tugas akhir, maupun portofolio machine learning, terutama dengan dukungan dari ITS Academics dan layanan jasa joki skripsi.

Deskripsi Dataset
Dataset yang digunakan adalah Boston Housing Dataset, yang berisi informasi dari 506 rumah di daerah Boston dengan 13 fitur prediktor.

Fitur Deskripsi
CRIM Tingkat kejahatan per kapita
ZN Proporsi tanah dengan zonasi residensial
INDUS Proporsi bisnis non-retail per kota
CHAS Dummy variable untuk sungai Charles
NOX Konsentrasi nitrogen oksida
RM Jumlah rata-rata kamar per rumah
AGE Proporsi rumah yang dibangun sebelum 1940
DIS Jarak ke lima pusat kerja utama
RAD Aksesibilitas ke jalan raya
TAX Tarif pajak properti per $10,000
PTRATIO Rasio murid-guru per kota
B 1000(Bk - 0.63)^2 di mana Bk = proporsi kulit hitam
LSTAT Persentase status sosial ekonomi rendah
MEDV Nilai median rumah (dalam ribuan dolar)

Rumus Linear Regression
Model regresi linear sederhana dapat dinyatakan sebagai:

Y=β0+β1X1+β2X2+...+βnXn+ϵY = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n + \epsilon

Dimana:

  • YY adalah target (harga rumah)

  • XiX_i adalah fitur prediktor

  • βi\beta_i adalah koefisien regresi

  • ϵ\epsilon adalah error model

Implementasi Python dengan Linear Regression

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Load dataset
boston = load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['MEDV'] = boston.target

# Fitur dan target
X = df.drop('MEDV', axis=1)
y = df['MEDV']

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Model
model = LinearRegression()
model.fit(X_train, y_train)

# Prediksi dan evaluasi
y_pred = model.predict(X_test)
print("RMSE:", np.sqrt(mean_squared_error(y_test, y_pred)))
print("R^2 Score:", r2_score(y_test, y_pred))

Visualisasi Korelasi Fitur

plt.figure(figsize=(12, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.title("Korelasi Antar Variabel pada Dataset Boston Housing")
plt.show()

Plot Hasil Regresi

plt.scatter(y_test, y_pred)
plt.xlabel("Actual Price")
plt.ylabel("Predicted Price")
plt.title("Prediksi Harga Rumah vs Nilai Aktual")
plt.show()

Kesimpulan
Algoritma Linear Regression sangat cocok digunakan untuk prediksi harga rumah karena mudah diinterpretasikan dan memiliki performa cukup baik untuk data numerik. Proyek ini cocok untuk mahasiswa yang ingin belajar machine learning secara praktikal dengan bimbingan dari ITS Academics atau layanan jasa joki skripsi yang terpercaya. Dataset ini juga dapat dikembangkan lebih lanjut menggunakan algoritma lain seperti Random Forest atau Gradient Boosting untuk hasil lebih akurat.

Apa Reaksi Anda?

like

dislike

love

funny

angry

sad

wow