Modele de maison et leur prix

Le tracé que nous avons utilisé ci-dessus est appelé diagramme de dispersion, le diagramme de dispersion nous aide à voir comment nos points de données sont dispersés et sont généralement utilisés pour deux variables. De la première figure, nous pouvons voir que plus la surface habitable, plus le prix bien que les données sont concentrées vers une zone de prix particulière, mais à partir de la figure, nous pouvons voir que les points de données semblent être dans la direction linéaire. Merci à la parcelle de dispersion, nous pouvons également voir quelques irrégularités que la maison avec les pieds carrés les plus élevés a été vendue pour très moins, peut-être il ya un autre facteur ou probablement les données doivent être fausses. Le deuxième chiffre nous raconte l`emplacement des maisons en termes de longitude et il nous donne tout à fait une observation intéressante que-122,2 à-122,4 vend des maisons à un montant beaucoup plus élevé. Les prix varient en fonction de la taille de la trame A, avec le plus grand modèle-le trio 120-coûtant environ $35 000. Ce concours a impliqué des données sur les caractéristiques de la maison et les prix du logement à Ames, Iowa. C`était un peu plus loin de Manhattan que je l`espérais, mais c`était un bon endroit pour commencer. 3. j`ai ramené le journal de LotArea variable de retour, mais j`ai enlevé un couple d`autres variables numériques qui avaient une faible corrélation à prix de vente: année de construction, année Remodel ajouté, chambre à coucher au-dessus du sol, cuisine au-dessus du sol. Nous utilisons les données de train et les données de test, formons les données pour former notre machine et les données de test pour voir si elle a bien appris les données ou non. Avant tout, je veux que tout le monde se souvienne que la machine est l`étudiant et les données de train est le programme et les données de test est l`examen.

Nous voyons combien la machine a marqué et si elle marque bien sont modèle est réussie. Maintenant, le moment de vérité, pour exécuter notre modèle contre le jeu de données de test. Une autre grande chose au sujet de l`utilisation de Kaggle est qu`ils fournissent un ensemble de test de données pour valider le modèle contre, et apporte également un avantage concurrentiel au travail de données parce que votre score peut être comparé à d`autres essayant de construire un modèle fort de leur propre. Une étape importante à retenir est que toutes les données de test doivent être transformées de la même manière que les données de formation, puisque le modèle a été réglé pour accepter les données dans la même forme que l`ensemble de formation. Par exemple, nous devons prendre le journal de LotArea puisque notre modèle a été formé sur cette entrée. Avrame vend maintenant 11 modèles différents de A-frames, de petits hangars d`arrière-cour à de plus grandes versions qui peuvent confortablement adapter une famille. Tous les modèles disposent de fenêtres pleine longueur pour fournir la lumière naturelle le duo 100, par exemple, est sur la plus petite taille à environ 613 pieds carrés, avec une chambre et une salle de bains sur le niveau principal et un loft de couchage au-dessus.

Non classéPermalink

Comments are closed.