Skip to content

Boston Housing Data: This dataset was taken from the StatLib library and is maintained by Carnegie Mellon University. This dataset concerns the housing prices in housing city of Boston. The dataset provided has 506 instances with 13 features.

License

Notifications You must be signed in to change notification settings

gokhangemici/PredictingThePricesOfBostonHouses

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Bostondaki Ev fiyatlarını tahmin etmeye çalışan program

Proje öngereksinimleri:

  • Numpy, Pandas, Scikit-learn, Matplotlib, Jupyter Notebook

Proje Konusu:

  • Bu projede sklearn kütüphanesi içerisinde yerleşik olarak gelen veri setlerinde load_boston isimli veri setini kullandık.
  • Bu veri kümesinde toplamda 506 tane kayıt ve 13 tane özelliğimiz var. Bu özellikler ise şu şekildedir: gokhan
  • Veri kümemize ev fiyatlarını tahmin etmek için price adında yeni bir sütun ekledim. price
  • Veri setime ait bilgiyi info metodu ile, veri setimde yer alan özelliklerin standart sapması, ortalaması, maksimum ve minimum değerlerini almak içinse describe() metodunu kullandım. describe info
  • Veri kümemde yer alan değerleri eğitim ve test verisi olmak üzere iki kategoriye böldüm. Veri kümemin yüzde 20'sini test, yüzde 80'ini eğitim için kullandım.
  • Bu durumda 102 kayıt test için geriye kalan 404 kayıt ise eğitim verisi olarak kullanıldı.

Proje Amacı:

Kısaca özetlemek gerekirse sklearn kütüphanesi içinde hazır olarak bana gelen veri kümelerinden load_boston veri setini kullanarak boston şehrindeki ev fiyatlarını 13 özelliğe bağlı olarak gerçek hayattaki değerlerine yakın olacak şekilde tahmin etmesi için makine öğrenmesi algoritmalarından sadece biri olan linear regression yani doğrusal regresyon algoritmasını kullandık. Kısaca doğrusal regresyon analizi, bir değişkenin değerini başka bir değişkenin değerine göre tahmin etmek için kullanılır. Programın sonunda gerçek değerler ve tahmin edilen değerler arasındaki korelasyonu matplotlib kütüphanesinin içinde yer alan çizgi grafiğiyle gösterdik.

Proje Çıktısı:

output

Doğrusal Regresyonun Sonuçları:

from sklearn.metrics import mean_squared_error mse = mean_squared_error(ytest, y_pred) print("Mean Square Error : ", mse) mean

  • Bu fonksiyon matematiksel olarak aşağıdaki resimde gösterildiği gibi hesaplanır.

formul

Proje Sonucunu Yorumlama:

Kurmuş olduğumuz modelimizin fiyatları ne kadar büyük bir doğrulukla tahmin ettiğini görmek için mean_squared_error() fonksiyonunu kullandık ve sonuç olarak bu fonksiyon bize 33.45 değerini döndürdü. Bu şu anlama geliyor. Bizim kurduğumuz model ev fiyatlarını tahmin etmekte sadece yüzde 66 oranında doğru sonuç veriyor ki bu çok iyi bir oran değil. Bu veri kümesi üzerinde başka makine öğrenmesi algoritmaları veya teknikleri uygulayarak tahmin değerlerini artırmak ve metrik hatasını olabildiğince azaltarak ev fiyatlarını gerçek hayattaki değerlerine olabildiğince yakın bir şekilde tahmin edebilirim. Bu model ev fiyatlarını diğer 13 özelliğe bağımlı olarak tahmin etmekte sadece yüzde 66 oranında doğru sonuç vermektedir.

About

Boston Housing Data: This dataset was taken from the StatLib library and is maintained by Carnegie Mellon University. This dataset concerns the housing prices in housing city of Boston. The dataset provided has 506 instances with 13 features.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published