积分机

如何用机器学习预测新房积分

发布时间:2022/8/9 20:00:32   
北京青春痘最好的医院 http://m.39.net/pf/a_9113231.html

大家好~!这里是魔都小房弟团队

买房记得找小房弟哦,以下是正文:

在上海买新房,既要算钱也要算分。通常情况下,我们只能通过销售或者网上看看别人的估分来大概猜一下多少分。

那么,有没有什么方法,让我们可以自己预测一下新房积分区间呢?

本文就带你用机器学习的方法来预测新房积分。提前说明,文章不涉及数学公式,也不涉及代码编程,对小白非常友好。只要你能大概了解基本概念,就完全可以照着操作。

Part1机器学习基本概念

机器学习,顾名思义,就是让它根据我们提供的数据,自己学习规则。

按照我们提供数据的不同,又分为监督式学习(学习的数据有标签)和非监督式学习(学习的数据无标签)。

监督式学习主要解决分类和拟合问题,非监督式学习主要解决聚类问题。

我们将要用到的支持向量机(SVM,supportvectormachine)就是一种非常流行的解决分类问题的监督式机器学习模型。

它的原理非常简单,就是找一个平面把两类物体分开。

如图所示,我们只要找到这样一条直线,就可以把红色的点和蓝色的点分开。

那如果红色和蓝色混合在一起,我们找不到这样的直线呢?二维找不到我们可以放到三维空间。

假设红颜色的球比较重,蓝颜色的球比较轻,我们一拍桌子,蓝色弹起来比较高,红色弹起来比较低,这样我们就可以找一个平面把两者分开了。

再复杂的情况,我们都可以通过函数映射到高维度空间,然后在这个空间中,找一个“平面”把两者分开。

听起来好像支持向量机只能做两分类,多分类可以吗?当然可以啦,我们多找几个“平面”,多分几次,不就可以多分类了么。

以上只是简单的原理介绍,没看懂也没有关系,我们只需要知道支持向量机这个工具适合用来做分类就可以啦,下面我们就用它来建立我们自己的积分预测模型。

Part2搜集数据

我们首先来头脑风暴一下哪些因素跟积分相关呢?地段,价格等等各种因素都跟积分有关。

经过讨论,我们选取了这几个影响因素:板块,套数,价格,入围比,与周边二手房的到挂率(新房价格/二手房价格)。

根据以上因素,我们开始在网上找年的数据。我们知道,数学模型只能处理数字,板块这个因素怎么考虑进来呢?我们可以定义一个和数字之间的映射关系。

当然不同的区域可以可以进行微调。比如虹桥板块,虽然地处外环外,地段配套完全不输外环内。

同样前滩,唐镇板块都可以相应上调,北上海可以根据环线相应下调。这样相同的数字大概能够代表相同的地段水平。

我们再根据不同的积分来打上相应的标签,为了方便,我们统一用社保分数0.1,60分作为基准。

(整理的部分数据)

Part3模型建立

支持向量机工具,我们用网上比较流行的libsvm(

转载请注明:http://www.aideyishus.com/lkyy/1197.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章