基于大数据背景下的住宅价格指数的编制方法探讨发布解读

关键词:大数据住宅价格指数Hedonic模型链式指数法随机森林

目录

一、问题的提出

二、研究背景

三、研究思路及创新点

(一)研究思路

(二)创新点

(二)数据质量考察与预处理

五、数据描述与特征分析

(一)特征因素的量化

(二)数据特征分析

1.交易量与价格变化特征

2.建筑结构与住宅价格变化特征

3.邻里环境与住宅价格变化特征

4.区位条件与住宅价格变化特征

(三)发现与结论

六、模型构建与分析

1.选取模型形式

2.基于某市2013年住宅交易数据的模型估计

3.基准期月度特征价格指数的计算

4.考察期(2014年1-2月)月度特征价格指数的链式更新计算

(二)分月特征价格指数法

2.模型参数选择

3.预测住宅价格

4.指数编制

(三)模型结果比较

七、模型的评价、改进和展望

(一)模型优点

(二)模型的局限

(三)前景展望

八、结论及建议

参考文献

现行的住宅价格指数编制方法—加权平均法,我们认为存在两个值得商榷的地方:一是由于未考虑样本的异质性特征,难以完全满足建立价格指数时“同质可比”的要求;二是仅以住宅销售面积和销售额双加权计算价格指数,没有考察住宅涵盖的环境、区位、交通、教育、商贸、医疗等大量特征因素,无法体现住宅品质对价格的影响,计算的住宅价格指数难免会有偏差。探索新的住宅价格指数编制方法势在必行。为此,本文采用以消除商品“异质性”为目标的Hedonic法计算住宅价格指数,具有同质化程度高、经济意义明确等优点,能够充分利用住宅所涵盖的大量特征因素,计算精度高,是目前较为理想的住宅价格指数编制方法。

本文以消除住宅商品“异质性”、加入大量住宅特征因素为切入点,以网签数据为基础,同时加入住宅环境、区位、交通、教育、商贸、医疗等大量特征因素,并利用“网络爬虫技术”获取这些特征因素数据,形成住宅价格统计“大数据”库。在大数据背景下,运用Hedonic法编制住宅价格指数,对于优化和改进现有住宅价格指数编制方法,准确反映住宅价格变动趋势和程度具有重要的理论价值和现实意义。

Hedonic法最初的思想起源于20世纪30年代,Court于1939年首次提出Hedonic法的概念,1961年Griliches将该方法运用在价格指数计算上,1974年Rosen完善了该方法的经济学基础,即在一个均衡的市场中,消费者是根据商品所具有的性能来购买商品,商品价格则可以由这些性能的均衡价格所代表。1978年Goodman和Allenc提出运用Hedonic法编制住宅价格指数,用来反映房地产市场的价格变动趋势,为Hedonic法住宅价格指数的编制打下了坚实的基础。JohnM.(1998)介绍并比较了Hedonic法、重复销售法及混合法在编制住宅价格指数方面的异同。2008年RobertJ.Hill在住宅价格指数的计算中采用Imputation方法,用于推算不可比产品的缺失价格数据,以提高Hedonic法的稳健性。

相较于国外Hedonic法的原创性研究而言,国内更多的是应用性实证研究,其中涉及住宅价格指数研究的有三类:

一是Hedonic法的引荐。蒋一军、龚江辉(1996)在房地产价格指数的计算中引入Hedonic法,重点介绍了应用特征价格模型编制住宅价格指数的理论方法。王力宾(1999)重点介绍了特征价格指数的基本原理和编制方法,并以莫斯科1994-1996年住宅交易资料为例,就函数的确定、变量的选取、标准住宅价格的计算等问题进行了实证分析。

二是Hedonic法与传统住宅价格指数编制方法的比较。李国柱(2003)等介绍并比较了传统指数编制方法(简单加权法)和流行指数编制方法(Hedonic法与重复销售法)的异同,并分析了我国现有指数在编制方法上存在的缺陷。吴璟、刘洪玉等(2007)从指数编制过程中质量调整的角度出发,对现有住宅价格指数编制方法进行归纳和分析,讨论了指数编制方法的选择原则,并对我国住宅价格指数编制方法提出建议。

三是基于Hedonic法的住宅价格指数编制实证研究。孙宪华等(2008)根据天津市2006、2007年住宅销售数据,利用特征价格模型中的imputation方法构建住宅价格线性模型,以此考察住宅价格指数变动情况。孙玉环(2009)系统总结了房地产价格指数的编制方法,并以大连市为例,选取22项影响住宅价格的特征因素构建了对数线性特征价格模型,深入探讨了特征价格模型在住宅价格指数编制方面的应用。

2、在大数据背景下,应用Hedonic法编制住宅价格指数。

3、利用随机森林、支持向量机等算法模型对住宅价格与各影响因素之间的非线性关系进行实证研究。

图1研究流程图

基于上述观察,对数据进行预处理,剔除异常值,具体步骤如下:

第一,数据集成:鉴于数据存储格式的不一致、不规范,进行规范化存储统一存储。再将网络搜索数据和网签数据按照住宅小区名称进行对应匹配与整合,形成完整、准确、统一、规范的数据库。

第二,数据清除:直接删除存在明显登记错误的记录;删除保障性住宅和年销售量不足100套的尾盘楼盘;

第三,数据完善:补充、修正数据库中的缺失值,对于数据库中的离散变量(如是否有车位、是否通双气等虚拟变量)使用最高频率值——众数值补充缺失值;对于连续变量(如绿化率、容积率等实测值)则使用能够代表中心趋势的值——平均值,补充缺失值。

第四,数据标准化清理:1、按照小区及层高类别复合分组后,计算各组均值和总体标准误差,按照计算成交均价的标准化值,把标准化值在[-3,3]区域外的交易记录作为异常值剔除掉;2、分月计算成交均价和建筑面积的标准化值,将标准化值在[-3,3]区域外的交易记录作为异常值加以剔除;

通过以上四步骤处理之后,最终得到有效数据记录111662条。图2显示了数据异常值剔除前后的对比效果。剔除后的数据量占原始数据量的83.7%。对预处理后的数据进行了各统计量的考察,取自然对数的住宅价格均值是8.74,标准差是0.238,方差是0.057,数据序列达到连续、规范、完整的建模质量要求。在数据预处理以及后续的模型分析过程分别使用了Mysql数据库、SPSS、R软件。

(a)住宅价格剔除前后对比散点图

(b)分月住宅价格剔除前后对比箱线图

图2剔除前后住宅价格散点图及箱线图

第五,数据归约:当数据量非常大的时候,如数据量达到千万或更高级别,普通的计算机难以处理。此时有必要对数据进行归约处理,如参数方法或非参数方法进行处理。本文数据量达到五百多万个,普通计算机尚可处理,故未对大数据进行归约化处理。

表1住宅特征因素的量化

特征分类

特征因素

量化方法

变量

变量的量化

建筑结构

特征

开发商资质

虚拟变量

1为一级资质,0为其它

现房

是否现房

1为现房,0为其它

建筑类别

1为普通住宅,0为公寓

建筑面积

实测值

合同注明建筑面积值

层高类别

是否多层

1为多层(7层及以下),0为其它

是否小高层

1为小高层(8-11层),0为其它

装修程度

评价打分

1为毛坯房,2为简装房,3为精装房

所在层

所在楼层

所在楼层的层数

是否一层

1为一层,0为其它

是否顶层

1为顶层,0为其它

配套车位

小区有无车位

1为有车位,0为无车位

邻里环境

容积率

小区的地上总建筑面积与规划建设用地面积的比率

绿化率

小区绿化面积与规划建设用地面积的比率

双气情况

是否市政供暖及配备天然气

1为是,0为否

生活配套

生活配套得分

小区附近1000米内有无菜市场、超市、银行、邮局、医院,有一项计1分,总计5分

教育配套

教育配套得分

小区附近1000米内有无幼儿园、小学、中学,有一项计1分,总计3分

临近大学

是否临近大学

小区附近1000米内有无大学,1为有,0为无

交通条件

公交线路条数

在小区附近500米内公交车站停靠的公交车线路的条数

地铁

是否临近地铁

小区附近1000米内有无地铁站,1为有,0为无

商业中心距离

到商业中心最近距离

小区到XX市最近成熟商圈距离(千米)

区位条件

特殊区域

是否特殊区域1

是否特殊区域2

行政区划

是否行政区划1

是否行政区划2

是否行政区划3

是否行政区划4

是否行政区划5

是否行政区划6

交易年月

图3可见,住宅交易量及均价因月度而变化明显,2013年住宅均价总体变化趋势呈现M型走势,两个高点分别出现在上半年的5月和下半年的10月。2014年住宅均价呈现低位运行态势。一般来看,住宅交易量、价同向变化,个别月份出现量价背离。这种量价变化趋势准确地反映了住宅交易市场变化的特征。

图3住宅交易量与价格变化特征

图4显示,建筑结构差异对住宅价格变化具有显著影响。比如,是否一级资质影响住宅价格达到7.6%,是否现房达到4.2%,是否有配套车位达到9.9%。从建筑面积来看,按照面积划分为小户型(90平米以下)、中户型(90-144平米)、大户型(144平米以上)三组,三组住宅比例分别为43.5%、50.0%、6.5%,均价分别为6375元/平方米、6322元/平方米、7738元/平方米,小户型和中户型的住宅数量、均价差异不大,大户型占比少、单价高。

图4不同建筑结构特征住宅分布及均价气泡图

图5不同邻里环境住宅分布及均价柱状图

表2显示,行政区域和特殊开发区域对于住宅价格有着明显的影响。行政区域差异影响住宅价格最高可达17.9%。特殊开发区的住宅价格明显高于一般行政区域,最高差异可达27.9%。

表2不同区位条件住宅分布及均价

分类指标

比例(%)

均价(元/平方米)

特殊区域1

10.6

7239

特殊区域2

10.2

7477

行政区划7

12.8

6679

行政区划1

11.2

6741

行政区划2

12.9

6333

行政区划3

15.2

5844

行政区划4

18.2

6097

行政区划5

28.2

6890

行政区划6

1.5

6038

综上分析,发现由于城市地铁建设处于起步阶段,对住宅价格影响不明显,其影响呈现滞后性。其他特征变量均对住宅价格有显著影响。

通过比较每个特征变量不同分组的住宅均价差异(以分组最高值-分组最低值大于500为标准),可以发现,对住宅价格影响较大的变量分别为与商业中心距离、生活配套、教育配套、特殊区域、行政区划、是否有双气、装修程度、是否配套车位、是否小高层。

住宅是一种最典型的异质性商品,严格意义上没有任何两个住宅单元是完全一致的,建筑本身和周边环境等的差异都会对住宅价格产生影响。市场供求情况的改变、住宅品质整体提升、住宅聚集地的整体变化、住宅特征结构的变化等都会引起不同时期住宅市场价格水平的波动。这就违背了价格指数编制中的“同质可比”前提条件,因而需要在指数编制过程中剔除不同样本(住宅单元)之间的质量差异,即进行“质量调整”。

Hedonic模型正是实现这种质量调整的一种有效工具,将异质性商品视为一系列同质的特征聚合而成的“特征束”。不同特征在各自的隐含市场上有其特征价格,这些特征价格聚集最终构成异质性商品的价格。

具体操作方法是:设考察期为,对于每一个考察期,分别在T期与T-1期、T期与T-2期、T期与T-3期样本的基础上,建立三个Hedonic模型,再结合基准期模型的拟合结果,分别求取T期与T-1期、T-2期、T-3期同质价格的比例关系,将三个比值分别换算为对期同质价格的估算值并求几何平均,即得到该期的同质价格值,再将其与基期的特征价格值进行对比,得到该期的定基价格指数。

表3三种模型统计量对比

模型

调整的R2

F值

P值

线性模型(Linear)

0.295

1074.26

0.0000

半对数模型(Semi-Log)

0.484

1024.79

对数模型(Log-Log)

0.276

967.58

构建基于2013年某市商品住宅交易记录建立的Semi-Log形式Hedonic模型如下:

(1)

表4基准期(2013年)Hedonic模型的回归系数和显著性检验

非标准化系数

标准系数

t值

P

多重共线性统计量

系数

标准误差

容差

VIF

常数项

8.057

.009

910.238

.000

.002

.012

4.729

.824

1.213

.042

.001

.080

30.275

.726

1.377

-.036

-.056

-21.947

.761

1.314

.153

62.518

.838

1.194

.165

.044

19.252

.950

1.052

.078

.005

.035

14.973

.929

1.077

.069

.147

59.934

.836

1.196

-.014

-5.978

.884

1.131

是否一楼

-.010

-.004

-1.868

.062

.945

1.058

-.043

.004

-.023

-10.004

.947

1.056

是否有配套车位

.051

-.030

-12.431

.866

1.155

-.028

-.157

-50.992

.532

1.880

.030

3.336

.722

1.385

是否市政双气

.050

19.675

.785

1.274

.024

.103

32.779

.506

1.978

.011

10.809

.631

1.584

.014

5.482

.737

1.356

.006

.176

51.830

.433

2.309

是否临近地铁站

.003

1.696

.090

.750

1.333

-.026

-.270

-88.760

.544

1.838

.107

.122

41.923

.594

1.683

.175

.193

65.588

.577

1.732

-.041

-.047

-14.109

.444

2.254

-.045

-.059

-17.966

.463

2.160

.049

.071

18.917

.355

2.817

-.003

-.005

-1.403

.161

.345

2.895

6.495

.360

2.776

-.053

-.025

-9.937

.817

1.224

2013年2月

-.008

-.006

-2.295

.022

.707

1.414

2013年3月

.010

3.731

.498

2.006

2013年4月

.037

13.699

.495

2.019

2013年5月

.047

.054

16.993

.504

1.984

2013年6月

3.280

1.837

2013年7月

.023

.026

8.399

.513

1.951

2013年8月

.021

7.492

.534

1.874

2013年9月

1.240

.215

.562

1.780

2013年10月

.038

12.573

.576

1.736

2013年11月

.039

13.639

.529

1.892

2013年12月

-.015

-.017

-5.228

.502

1.991

(2)回归模型的总体显著性检验。方差分析的检验统计量F值为1024.79,伴随概率小于0.001,拒绝自变量系数均为0的原假设,表明全部进入模型的自变量对因变量的共同影响具有显著性,即回归方程总体是有效的。

(3)回归系数的显著性检验。除“2013年9月”和“行政区划4”外,进入模型的其他37个特征变量的回归系数,在5%的显著性水平下均能通过t检验,其符号方向也与预期相符,表明回归方程中各特征变量的偏回归系数具有显著性。

(4)多重共线性检验。各特征变量的方差膨胀因子VIF均小于5,可以认为模型中不存在明显的多重共线性问题。

(5)对模型回归残差描图。通过P-P图和直方图,可以看到模型残差近似成正态分布。

图6残差图

综上,可以认为所构建的基准期某市商品住宅对数线性特征价格模型具有良好的拟合优度和较高的解释能力,各特征变量的回归系数具有统计意义上的显著性,可以用来分析和解释住宅特征变量对住宅价格的影响。

(1)标准住宅的特征值及特征价格值的确定

标准住宅是Hedonic模型中最具典型性的一簇住宅特征的虚拟组合,代表着市场中在售住宅的普遍水平,可以认为是房地产市场中最具一般性和代表性的住宅。选取标准住宅是去除住宅异质性的关键。

本文选取标准住宅的方法是,取考察期各个特征变量的众数值作为各变量在标准住宅中的取值。因此,确定的某市2013年一套标准住宅为:高层普通住宅中的15层期房,建筑面积为97.55m2、非顶层、市政双气、容积率为3.73、绿化率为0.4、生活配套5、教育配套3、开发商资质为一级以下、周围没有地铁,0.5千米内公交线为7条、不临近大学、距离商业圈的距离为4.52km的住宅。

利用模型拟合结果和标准住宅各特征变量的取值,即可计算得到基准月份(2013年1月)的平均价格,计算公式为:

(2)

式(2)中,P0是标准P0住宅的平均价格,Xoi是标准住宅中第i项特征变量的取值,a0和ai分别是回归模型中的常数项和第i项特征变量的非标准化回归系数。

除基准月份外,2013年其他各月份标准住宅平均价格的计算公式为:(3)

式(3)中,P0j为第j月标准住宅的平均价格,Mj为第j月交易月份变量在特征价格模型中的非标准化回归系数,8.755为2013年1月标准住宅特征价格的对数值。

(2)基准期各月份特征定基价格

(4)

式(4)中,P0j为第j月的标准住宅价格,P0为基准月份的标准住宅价格。

分别计算得到2013年2-12月的标准住宅平均价格,结果见表5。

表5基准期各月标准住宅的特征价格及定基指数计算结果

月份

未标准化

系数B

特征价格

对数值

标准住宅

平均价格

(元)

定基特征

价格指数

(%)

2013年1月

-0.008

8.75454

6339.40

100.00

0.01

8.74628

6287.26

99.18

0.037

8.76475

6404.46

101.03

0.047

8.79194

6580.99

103.81

0.009

8.80174

6645.80

104.83

0.023

8.76401

6399.72

100.95

0.021

8.778

6489.88

102.37

0.004

8.77597

6476.72

102.17

0.038

8.75818

6362.52

100.36

0.039

8.7924

6584.01

103.86

-0.015

8.79329

6589.88

103.95

0.051

8.73988

6247.15

98.54

计算结果表明,基准期2013年内某市各月的商品住宅特征价格定基指数呈现波动下降趋势。此外,除2月份和12月份价格低于基期价格,其余月份价格均高于基期。

比照2013年基准期建模方法,采用两期链式更新法进行改进,可计算得到2014年1月份和2月份标准住宅的特征价格以及以2013年1月为基准期的定基价格指数,计算结果如表6所示。

表62014年1-2月某市商品住宅特征价格指数计算结果

2014年

T/(T-1)

T/(T-2)

T/(T-3)

均值

链式更新

COEF

P1

P2

P3

定基指数

1月

0.002

8.74154

-0.044

8.74954

-0.025

8.76754

6329.22

99.84

2月

0.008

8.76087

0.02

8.75954

8.76854

6393.21

100.85

对2013年1月到2014年2月份各月份的住宅价格趋势做整体描述,如图7所示:

基本思路:在每个报告期分别建立Hedonic模型,再将标准住宅的各个特征变量取值分别带入训练好的每个报告期模型,即可得到标准住宅在各报告期的同质价格,并以此为基础进行指数编制。

分月特征价格指数法运用每个报告期的Hedonic模型预测标准住宅的价格,所以并不一定需要计算出各个特征变量的特征价格指数(即回归系数)。同时,考虑到线性模型假定自变量和因变量之间具有线性关系,而且对数据的分布及特征要求比较严格,而算法模型在解决非线性和数据分布不规则方面具有优越性。因此,本文分别尝试了普通线性模型、决策树模型、支持向量机(SVM)模型、神经网络模型和随机森林模型,通过不同模型的比较,选择预测精度高的模型对住宅价格做预测,进而编制住宅价格指数。

鉴于数据量较大,选取2013年1月份的8510条交易记录采用五折交叉验证法,分别对半对数模型、决策树模型、支持向量机模型、神经网络模型和随机森林模型进行训练和测试。将正则均方误差(NMSE)作为衡量模型精度的标准,NMSE越小,模型的预测精度越高。

表7五种模型五折交叉验证NMSE结果

半对数模型决策树模型支持向量机模型神经网络模型随机森林模型

10.44171260.36791030.16021320.41456860.09322280

20.47766550.30322100.17040370.47769590.09253903

30.50832600.32320690.19520080.30393810.10623927

40.44952120.31120340.17426330.35097650.08398353

50.46687170.37324250.17439680.46687200.10072333

M0.468819380.335756810.174895580.402810220.09534159

由表7可以看出,线性回归的预测精度最低,随机森林和支持向量机的预测精度较高,我们选择这两种模型做进一步的研究。

随机森林模型是一个用随机方式建立的,包含多个决策树的分类器。其输出的类别是由每个树输出的类别的众数而定。它具有不显著增加运算量但大幅度提高预测精度的优点。

支持向量机模型建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,实现了高效的从训练样本到预报样本的“转导推理”,大大简化了通常的分类和回归等问题。

随机森林有两个重要参数,树节点预选的变量个数mtry和随机森林中树的个数ntree。从图8知,ntree大于400后,rsq和mse基本保持平稳。模型中变量共有40个,依次将mtry从1到40取值,分别得到模型的预测精度OOBEroor值,当mtry大于30时,OOBEroor值显著下降,当mtry在30以内时,取值为9,13,25时精度较高,综合考虑精度和效率,我们取mtry=9,ntree=500。

图8随机森林mse和rsq随树的个数变化趋势图

支持向量机回归选择eps-svr方法,kernel函数选择rbfdot,通过多次测算,取惩罚因子C=10。

以2013年1月份为例,采用已设定参数的两种模型预测当月标准住宅价格。将其中80%作为训练集,20%作为测试集。

随机森林的均方误差为0.00724,变量解释度为88.32%,测试集误差率为0.0972234,同时得到各变量的重要性程度,见表8。

表8随机森林模型中各变量重要性描述

%IncMSE

IncNodePurity

0.0420

78.9922

0.0065

8.4022

0.0367

58.7719

0.0060

7.3820

0.0290

54.0816

市政双气

0.0042

7.1017

0.0118

44.1958

0.0041

6.5042

0.0218

41.2036

轨道交通

0.0045

6.0058

0.0237

38.9544

0.0038

5.7265

0.0107

22.8354

0.0017

3.6414

0.0095

22.5636

0.0019

3.0247

0.0061

12.6303

0.0006

1.9227

商业配套

0.0077

12.3579

多层

0.0002

1.4489

0.0015

11.3987

一楼

1.2425

0.0059

11.1560

顶层

0.0001

0.8561

9.3595

小高层

0.7824

9.0135

车位

0.5408

商业中心距离作为住宅价格最重要的因素,其对模型精度的影响达到4.2%。其次是交通条件、容积率、建筑面积、绿化率、行政区划5、装修程度,重要性依次减弱,剩余其他变量的影响相对较小,影响在1%之下。

支持向量机模型的支持向量为5275个,训练误差率为0.128739,测试集误差为0.1742935,测试集准确率低于随机森林模型的结果。

将2013年2月份至2014年2月份各个月份作为样本,分别建立随机森林和支持向量机模型以预测标准住宅价格,结果如表9所示,支持向量机模型预测的价格波动比随机森林预测值波动更明显。

表9标准住宅预测价格和定基指数

随机森林RandomForest

支持向量机svm

日期

对数价格

价格

rf基期比

svm基期比

2013/1

8.8246219

6799.62

8.8812801

7196.00

2013/2

8.7976924

6618.95

97.34

8.7750331

7151.18

99.38

2013/3

8.8329062

6856.18

100.83

8.8255958

7522.06

104.53

2013/4

8.7938468

6593.55

96.97

8.7713783

7125.09

99.01

2013/5

8.8601051

7045.22

103.61

8.8067211

7381.42

102.58

2013/6

8.914445

7438.65

109.40

8.8257742

7523.41

104.55

2013/7

8.8477194

6958.50

102.34

8.7116226

6711.80

93.27

2013/8

8.8155531

6738.23

99.10

8.7228327

6787.46

94.32

2013/9

8.8003723

6636.71

97.60

8.7528424

6994.24

97.20

2013/10

8.8378335

6890.05

101.33

8.738018

6891.32

95.77

2013/11

8.8651705

7081.00

104.14

8.6922196

6582.83

91.48

2013/12

8.8368652

6883.38

101.23

8.7045043

6664.19

92.61

2014/1

8.8171969

6749.32

99.26

8.5817909

6514.53

90.53

2014/2

8.7994061

6630.31

97.51

8.5873128

6550.61

91.03

图9随机森林和SVM模型编制定基住宅价格走势

上述编制的三种住宅价格指数中,线性模型下的指数最为平滑,支持向量机模型编制的指数最为敏感,随机森林模型介于二者之间。总体来看,2013年前半年住宅价格曲折上涨,并在5-6月份达到一个峰值,而后震荡下跌,在10月和11月出现较小的反弹。根据简单均值编制的定基指数也与该趋势相似。

图10不同方法编制的住宅价格定基指数比较

1.避免样本选择性偏误。存在样本选择性偏误一直是困扰房地产价格指数编制理论与应用实践的难点问题。本文所使用的两种编制方法均不存在样本的代表性问题,都是基于房地产市场实际交易和网络搜索大数据全库进行编制,不需要抽选房地产样本,可以最大限度地避免客观因素和人为因素对房地产价格指数的干扰。

2.消除异质性。编制价格指数的一个基本要求是商品的“同质可比”,而住宅是典型的异质性商品,它的价格直接受到区位、环境、交通等等特征因素的影响。Hedonic法下的两种模型充分利用回归分析,将各项住宅特征因素的隐含价格从总价格中分离出来,选取统一的标准住宅进行价格指数编制,消除了异质性的影响,使得各期住宅价格可比性强。

3.对市场供求变化反映更为敏锐。与现行编制方法相比,特征价格法的计算结果对市场供求变化反映更为敏锐,传递信息更为迅速,综合体现了不同时期、不同特征因素的供应区别所导致的价格变动实况,更能反映价格指数编制的目的,具有较强的参考性和价值性。

4.经济意义明确。编制特征价格指数的基础是构建特征价格模型,通过模型能够对住宅价格进行比较直观的经济意义分析。如分析住宅特征因素的隐含价格、特征因素对住宅价格的影响程度、价格弹性及边际价格等等。

5.利用算法模型考察了非线性关系。鉴于在真实市场中住宅价格影响因素的复杂性,住宅价格与各特征因素的关系不是单纯的线性关系,还应包含非线性关系,本文在线性模型的基础上更为合理的引入了算法模型——随机森林模型和支持向量机模型,考量特征因素和住宅价格的非线性关系,作为对线性模型的补充。

1.住宅特征因素的确定具有主观性。影响住宅价格的特征因素有很多,现有文献对影响住宅价格的特征因素没有形成统一观点,因此,在建立特征价格模型时,特征因素的选择易受人为因素影响,具有一定的主观性。

2.对数据要求高。Hedonic法要求样本数据的特征因素尽可能多,而且需要准确量化,因此数据的收集工作耗时费力。另外,由于数据量非常大,对大数据的匹配、剔除、筛选、挖掘等预处理也是一项非常复杂的过程。

3.模型计算相对复杂。链式更新Hedonic法和算法模型编制房地产价格指数计算过程相对复杂,对统计人员统计知识的掌握和数据处理硬件设备的要求都很高。

本文目前使用的方法对于各期交易的波动敏感度过高,使得在中短期难以明确市场趋势。在技术上如何平衡高敏感度和平滑性,如何将非线性的算法模型和线性的链式更新Hedonic法相结合,以寻求一种更为平稳且实用性强的模型来编制指数,是一个可以改进的方向。

伴随着统计软件的广泛应用,以及国家房地产交易网签制度的完善,使用房地产交易网络大数据,利用统计模型编制住宅价格指数正在成为一种必然的趋势。本文应用三种统计模型编制住宅价格指数方法在反映住宅价格变化趋势上更加敏锐和准确,是一种统计技术上的有益探索。伴随着模型的进一步优化,必将为依托房地产网络大数据、利用统计模型编制住宅价格指数找到更科学的方法。

[1]CourtAT.“HedonicPriceIndexeswithAutomobileExamples”TheDynamicsofAutomobileDemand[M].NewYork:GeneralMotorCorporation,1939.

[2]Griliches.HedonicPriceIndexesforAutomobiles:AnEconometricAnalysisofQualityChange:ThePriceStatisticsoftheFederalGovernment[M].NewYork:NBER,1961.

[3]Rosen,Sherwin.HedonicPricesandImplicitMarkets:ProductDifferentiationinPureCompetition[J].TheJournalofPoliticalEconomy,1974(1).

[4]AllenC.,Goodman.Hedonicprices,priceindicesandhousingmarkets[J].1978(3):471-484.

[5]RobertJ.Hill.HedonicImputationandThePriceIndexProblem:AnApplicationtoHousing[J].EconomicInquiry,2008(9):593-510.

[6]蒋一军,龚江辉.异质商品价格指数与Hedoni方法[J].中国统计,1996(4):37-39.

[7]孙玉环.改进住宅销售价格指数编制质量的一种思路探讨[J].统计研究,2011(10):28-35.

[8]李国柱,孙焕民.编制城市房地产价格指数的若干问题[J].统计研究,2003(8):28-30.

[9]王力宾.住宅特征价格指数编制方法与实证分析[J].数量经济技术经济研究,1999(7):37-40.

[10]周丽萍,李慧民,肖静.神经网络在特征价格模型中的应用[J].西安工业大学学报,2008(4):189-192.

[11]孙宪华,刘振惠,张臣曦.Hedonic法在房地产价格指数中的应用[J].现代财经.2008(5):61-65.

[12]周丽萍.商品住宅特征价格模型与指数的应用研究[D]:[博士学位论文].西安建筑科技大学.2008.

[13]吴璟,刘洪玉,马亚男.住宅价格指数的主要编制方法及其选择[J]:建筑经济.2007(7):27-30.

[14]罗晓娟.特征价格模型的发展应用研究[J]:技术经济与管理研究.2012(6):11-15.

[15]张宏斌,贾生华.编制城市房地产价格指数的理论模型和实用方法[J]:中国软科学.2000(4):64-67.

[16]吴璟,郑思齐,刘洪玉.编制住宅价格指数的Hedonic法细解[J]:统计与决策.2007(24):16-18.

THE END
1.判断题每日一刷10.商品发布的形式有三种,分别是:一口价,拍卖,团购( ) 对 错 11.淘宝中在发货时,如果正确填写了运单号后确认,交易状态就会变成“卖家已发货”,如果下单时没有运单号,也可以在物流公司取件后再填写运单号。() 对 错 12.域名是由一串用逗号分隔的名字组成的Internet上某一台计算机或计算机组的名称。( ) ...https://www.wjx.cn/jq/50741318.aspx
2.资产评估商品是用来交换的劳动产品,包含使用价值和价值两个要素,是使用价值和价值的统一。 使用价值:物品和服务能够满足人们某种需要的属性,即物品和服务的有用性,由自然属性决定。商品的使用价值是交换价值的物质承担者。 交换价值:商品能够通过买卖同其他商品相交换。交换价值是价值的表现形式。 https://blog.nowcoder.net/n/6c03eb14fe1e4b538e9196ca77db8f12
3.土库曼斯坦经贸指南政体: 1995年12月12日,联合国185个成员国一致通过了《土库曼斯坦永久中立》的决议。根据土宪法规定,土库曼是一个民主、法制、世俗的国家,自主实施内外政策,国家管理形式为总统制的共和国。国家权力建立在立法、执法和司法三种管理体制之上。 国家政权的最高代表机构为全民族复兴运动人民委员会,又称“大国民会议”,...http://euroasia.cssn.cn/zyyjw/zygq/tkmst/tkmstjj/200608/t20060828_1886738.shtml
4.论“变相吸收公众存款”——以三种商品交易形式为例当前,有两种商品交易行为是否属于非法吸收公众存款罪中的变相吸收公众存款行为存在疑问。即经营者以赊购的形式向公众收购某种实物,每月付息,到期后交付货物价款(以下简称“赊购付息”);以及经营者和消费者签订买卖合同时,同时签订回租或委托经营合同,租赁期或委托经营期内经营者向消费者支付租金或委托经营所得,期限届满后...http://www.110.com/ziliao/article-242524.html
1.全网最全商品模型设计方案,不接受反驳!组合商品:组合商品是由多个单独售卖的商品组成的捆绑销售商品,例如:下午茶套餐(包含咖啡、蛋糕、小食)、七夕美妆组合(包含口红、香水、护肤品)等。 多规格商品:多规格商品是由多个 SKU 组成的商品集合,消费者只能选择其中一个 SKU。例如,以iphone16为例,关键规格有颜色(黑色、红色、银色、金色)、容量(128G、256G...https://blog.csdn.net/dsgdauigfs/article/details/143873057
2.网络营销如何让客户留恋并产生交易?B2C商业模式解析怀旧:要真正达到网络营销的效果,需要有人对网络营销的“流量”、“展示”、“传播”等方面的数据进行监控,及时发现和解决问题,努力让客户“怀旧”,停留在网站上并产生交易。 2、B2C是-to-的缩写,指直接向消费者销售产品和服务的商业模式。典型企业代表有天猫、京东、亚马逊等。 https://m.bjhwtx.com/h-nd-355034.html
3.电子商务商品分析电子商务是一个商品数据化的过程,通过在线销售平台、供应链数据化和消费者互动等手段,将商品的各种信息以数字形式进行记录和分析,从而帮助商家更好地了解市场需求,优化产品设计,提高销售效率。在如今的商业环境下,电子商务已经成为了不可或缺的一部分,对于企业的竞争力和发展具有重要意义。随着技术的不断进步,电子商务...http://www.flash2.cn/ds/36340.html
4.海外商场广告发稿平台支持哪些类型的媒体发布?户外广告牌、路标广告等实体广告形式,在繁华商圈和交通枢纽地带具有较高的曝光率,对于提升品牌知名度具有显著效果。 六、邮件营销与合作伙伴推广 邮件营销、合作伙伴推广等方式,能够精准触达目标受众群体,提高广告转化率和营销效果。 七、结尾 海外商场广告发稿平台支持多种类型的媒体发布方式,包括社交媒体平台、新闻媒体...https://www.mtwanmei.com/index/news-detail-5585.html
5.网络营销产品的特点和分类内容类的网络营销产品主要是通过各种精彩的内容吸引用户的关注与参与。通过提供有价值的内容,企业可以增加用户的粘性和忠诚度。 网络营销产品具有广泛性、定制性、互动性和实时性等特点,通过文字类、图片类和视频类以及商品类、服务类和内容类的分类方式来满足用户的多样化需求。随着互联网的不断发展和创新,网络营销产品...http://www.zhongxinlm.com/yinxiao/13697.html
6.新产品发布包括哪些内容开普云:公司AI大模型与算力产品及AI内容安全产品2023年实现1.20亿元...金融界11月18日消息,有投资者在互动平台向开普云提问:董秘您好,贵公司抖音官方账号宣传,开普云是全球唯二的AI业务盈利的人工智能公司,请问贵公司AI业务营收及利润占比分别是多少?公司回答表示:公司未曾在抖音等平台发布过您所述的内容。公司AI大...https://mip.d2film.com/eb4qdl3g.html
7.淘宝天猫商城电子商务运营考试试题2、商品发布的形式有三种,分别是:一口价,拍卖,团购。 ( 否 ) □是□否 3、在买家签收之前,货物丢失或者损毁的风险,由卖家承担。 ( 是 ) □是□否 4、淘宝有权删除任何有炒作信用度行为的会员在淘宝网上发布的所有信息。 ( 是 ) □是□否 https://m.oh100.com/kaoshi/peixun/375296.html
8.广告活动策划书精选15篇3、活动采用新闻发布会、户外高尔夫球竞赛活动、联谊宴会三种形式贯穿进行: A.新闻发布会:邀请企业家协会领导致辞,由开发商代表回顾企业十年成就,并对项目和俱乐部做宣传介绍,建议邀请有广东知名俱乐部组建经验的权威人士或是属于某俱乐部成员的名流畅谈俱乐部。 https://www.ruiwen.com/guanggaocehuashu/6369139.html
9.中药的三种主要商品形式包括()商品检验方法的种类有很多,可归纳为( )俩大类。 A. 感官检验、仪器检验 B. 商业监验、公证检验 C. 感官检验、理化检验 D. 品质检验、物理检验 查看完整题目与答案 OSI参考模型将整个网络的功能划分( ) A. 1 B. 3 C. 5 D. 7 查看完整题目与答案 国家工商总局公布的《广告发布登记管理...https://www.shuashuati.com/ti/e00dd0afdba143c0bec90687b50c1b4b.html
10.「得物」抢占Z时代心智和口袋,值得运营人学习的要点有哪些?得物app一共有三种形式的积分:第一种是极光,第二种是潮金币,第三种是钻石。每种积分后承载的激励模式都不一样,日常任务加上兑换商店、趣味游戏结合现金券和实物礼品、互动捏脸社群赋能虚拟形象世界,分别对应了得物app购物、潮玩、社交三大属性。再加上大手笔的去上线了对于创作者的激励动作,直接给到用户现金的奖励...https://www.shangyexinzhi.com/article/6508217.html
11.帮助中心(1) 用户承诺其所发布的所有信息符合国家法律法规的相关规定,不侵犯任何第三方的合法权益; (2) 用户保证其所发布的所有信息的版权的完整性和合法性,为自有版权或已获得版权所有人的同意;如用户违反前述保证,中国统一教育网知学爱问有权删除该等违反规定之信息,并可以暂停或终止本服务。 3.用户应妥善保管自身的...https://www.tongyi.com/index.php/helpp/search
12.2022年双十一促销活动策划方案范文(通用15篇)3、活动采用新闻发布会、户外高尔夫球竞赛活动、联谊宴会三种形式贯穿进行: a.新闻发布会:邀请xx企业家协会领导致辞,由开发商代表回顾企业十年成就,并对xx项目和俱乐部做宣传介绍,建议邀请有广东知名俱乐部组建经验的权威人士或是属于某俱乐部成员的名流畅谈俱乐部。 https://www.yjbys.com/cehuashu/3286787.html
13.订货会促销活动方案(通用16篇)具体的时间段可选在8点开始到14点结束。上午站前客流量相对较少,为了吸引人群从上午就关注凯特,所以选在8点开集。此项活动需经过有效媒介形式提前对外发布通告,以吸引有兴趣的人参加进来。 9、超值预售 但凡进入8月,各商家都要开始提前订购秋冬两季的商品,特别是衣帽服饰类。如果敦促商家缩短上货和进货时间,并从...https://www.yuwenmi.com/fanwen/huodongfangan/2319240.html
14.民防(人防)知识竞赛题库思政普法31、核武器的爆炸方式有哪几种? 答:三种。地面(水面)爆炸、空中(低空、中空、高空)爆炸、地下(水下)爆炸。 32、什么是光辐射?特点有哪些? 答:光辐射又称热辐射,是核爆炸的闪光以及高温火球辐射出来的强光和热。其特点是火球中心温度可达几千万度,比照射到地球上的太阳光强千万倍,不断地以光和热的形式向外...https://xcb.ntvu.edu.cn/2011_05/24_00/content-10558.html