中文核心期刊咨询网权威的中文核心期刊目录大全,最新2015中文核心期刊目录查询,投稿征稿,论文期刊发表咨询。
中文核心期刊咨询网

基于数据挖掘的房价如何预测

作者: 中文核心期刊2018-06-26阅读:文章来源:中文核心期刊咨询网

  房地产价格是由多种因素相互作用形成的,是房地产业自然,经济,社会和管理因素综合作用的结果。位置因素是影响房地产价格的重要因素。接下来小编简单介绍一篇优秀数据挖掘电力论文。

数据通信

  1项目实施过程

  项目实施主要包括以下三个阶段:

  1)用爬虫知识从“房天下”网站爬取房源信息。

  2)利用获得的房源信息在百度API获取所有房源周边学校,医院,车站和超市的数量。

  3)对数据进行归一化处理。

  4)按照手工标记的方法,将房子按房价分为(0,7000],(7000,12000],(12000,17000],(17000,22000](22000,40000]五类。

  5)创建KNN,决策树,贝叶斯三种分类器,并使用训练数据进行训练。

  6)利用测试集预测,计算模型整体的准确率和召回率,评测模型。

  2数据获取阶段

  1)获取初始数据,该阶段主要有两个阶段。第一个阶段是房源搜索阶段,该阶段使用Spider从网站房天下获取在售楼盘的名称,地址和价格。第二阶段调取百度地图API GeoCoding进行经纬度转换。Geoeoding API已全面支持HTTP/HTTPS两种请求形式。

  2)归一化处理,将四维数据每一维度的数值总和视为1,每一维度数值占四个维度数值总数的比例用来表示该维度数据。

  3分类阶段

  该阶段采用KNN,贝叶斯,决策树三种方法构建分类器,分类结果如下:

  4分析与讨论

  从结果来看,决策树表现最佳,精确度有0.69,所以,决策树是我们应该选用的方法。我们认为选取的特征(教育质量,交通条件,医疗条件,生活配套)模糊和有限是造成预测精确度不高的主要原因。如教育质量不能单纯用学校数量来衡量,学校质量同样重要;超市数量不能代表一个地区的生活配套质量,还应包括餐馆、公园等因素。

  除本文选取的四个房价影响因子外,影响房价的因素还有很多,如地區居民收入、地方政策、环境质量和房地产生产成本、质量、品位、房型、结构、朝向等内在因素。

  阅读期刊:数据通信

  《数据通信》(双月刊)创刊于1980年,由信息产业部数据通信科学技术研究所主办。本刊主要内容涉及下一代网络技术、宽带网络技术、多媒体通信、无线通信、网络与信息安全、数据处理、数据传输、测试与维护。荣获信息部优秀科技期刊二、三等奖、中文核心期刊(1992)。

相关论文

联系我们

十年专注论文发表 推荐发表
全国服务热线:400-6800-558
工作时间:9:00 - 23:00

李老师 QQ :2320787095
投稿邮箱:sdwh_2001@126.com
点击这里给我发消息

赵老师 QQ:2794063374
投稿邮箱:sdwh_2001@126.com
点击这里给我发消息