数目字生存

既然查不到,干脆自己算——用basicTrendline 预测年

2019-07-26  本文已影响0人  askka
a-virtual-look-inside-apples-cupertino-spaceship-campus-design

绿色建筑标识项目

自2007年主管部门发布《绿色建筑评价标识实施细则(试行)》的通知,启动了绿色建筑评价相关工作之日起,绿色建筑认证便是一项贯彻执行资源节约和环境保护的国家发展战略政策,引导绿色建筑健康发展的重要举措之一。
按照我国的绿色建筑标识体系与相关政策,绿色建筑评价标识是依据 《GB/T 50378 绿色建筑评价标准》等技术文件对建筑物进行评价及信息性标识。获绿色建筑评价标识的项目数量,以及项目建筑总面积是衡量绿色建筑发展规模的关键指标。《中国绿色建筑发展回顾与展望》报告中提供了2015年之前的绿色建筑评价标识项目相关汇总数据。

《中国绿色建筑发展回顾与展望》
绿色建筑评价标识网中也公示了2016年9月之前的项目信息。
绿色建筑评价标识网
但2016年9月之后的数据,国内的绿色建筑评价标识项目数量便无从考证了。原因在于根据《住房城乡建设部办公厅关于绿色建筑评价标识管理有关工作的通知》(建科〔2015〕53 号),获评项目不再统一公示。

一、自本《通知》发布之日(注:2015-10-21)起,住房城乡建设部不再对各地住房城乡建设行政主管部门及有关评价机构审定的绿色建筑标识项目进行公示、公告和统一颁发证书、标识。……

虽然不再统一公示公告,但相信相关的数据整理工作会持续进行下去。实际上住建部《建筑节能与绿色建筑“十三五”规划》中,对于绿色建筑整体推进早有安排,只不过相关的数据暂未发布罢了。

建筑节能与绿色建筑“十三五”规划

利用basicTrendline预测绿色建筑标识项目数

既然主管部门未发布权威的统计数据,不妨用历史数据来预测下可能的绿色建筑认证标识项目总数。闲来无事,就当是练习下R。
所用到的basicTrendline是由梅卫平等人开发数据拟合的R程序包,相关的程序包安装、命令等介绍可参见简单线性回归分析
将《中国绿色建筑发展回顾与展望》中2008-2015年的绿色建筑认证标识项目总数作为作为拟合的历史数据,分别采用线性模型"line3P"(y=a*x^2+b*x+c)、幂函数模型"exp3d"(y=a*e^{b*x}+c)、指数函数模型"power3P"(y=a*x^b+c)加以拟合,结果如下。横坐标为开展绿色建筑评价标识工作以来的年份数,亦即为年份减去2007的差值。

中间结果
将拟合及预测结果利用ggplot重新绘制在同一幅图中,如下所示。
basicTrendline预测年度绿色建筑认证标识项目数
从结果来看预测值明显偏保守,远远赶不上当今大干快上、如火如荼的大好形势。根据住房城乡建设部办公厅《关于2016年建筑节能与绿色建筑工作进展专项检查情况的通报》公布的结果,2016年新增绿色建筑评价标识项目为3164个,而此处对于2016年的最高预测值也仅2289个。

关于绿色建筑评价标识。截至2016年底,全国累计有7235个建筑项目获得绿色建筑评价标识,建筑面积超过8亿平方米;其中,2016年获得绿色建筑评价标识的建筑项目3164个,建筑面积超过3亿平方米。

改用累加的项目总数重新回归预测后的结果有所改进。对截至2016年度的累加项目总数指数函数模型exp3d预测值结果为6807个,与实际值7235相比已相当接近。 basicTrendline预测绿色建筑认证标识项目累计总数

据此,对2017-2019年的绿色建筑认证标识项目总数预测如下:

年度 2017年 2018年 2019年
累计项目总数 11180 18275 29786
当年新增项目 4373 7095 11511

尽管现在已经是2019年了,也不能再说是预测,大概只能算是在乱蒙一气吧。姑妄言之。预测值准确与否拭目以待官方的权威数据就是。
不过,说起来,啰啰嗦嗦这么多,当然不是为了预测个数字就完事了。安利下basicTrendline才是正事。根据basicTrendline函数包中文介绍入口的说法。

  • 我们(注:作者)已经检测了我们的R函数包“basicTrendline”, 它工作性能稳定;
  • 更重要的是它的拟合结果和商业软件OriginPro完全相等;
  • 甚至对幂函数power函数(y=a*x^b +c)比OriginPro软件更好。(更高的R2,更低的p值,因为我们采取了优于Origin软件的selfStart计算方法)!

basicTrendline用起来确实挺方便的,代码也是相当的简单!所以,有考虑在R中进行线性非线性回归拟合的小伙伴不妨一试哦。

gbstar <- fread('gbstar.csv', header = T)
#将逐年数据转换为累加项目总数
predict_y <- cumsum(gbstar$all)[1:8]
# “exp3P” : y=a*exp(b*x)+c
trendline(1:8, predict_y, model="exp3P", ePos.x = "topleft", CI.color = NA,
                  summary=FALSE, eDigit=5, linecolor="red", lty=2)

可能有人会说,拟合个函数这点能耐,Excel就做了,哪里用得着R来大费周章的。话虽如此,至少本人还是更喜欢这种敲下一行命令然后回车,看着运行结果鱼贯而出,施施然以为自己运斤成风的感觉。

补记

这两天无意中看到雕爷的雄文[“新消费巨浪”第二弹]:(http://www.sohu.com/a/336359693_354999)

Google曾有一句名言,工程师们把这句印在了T恤衫上,这句话我觉得用在今天“新消费大潮”里也无比适用——在上一篇讲的三浪叠加和完美天气加持,这篇讲的“从模拟时代过渡到算法时代”+中国无数“亚文化群体精准打法”,初一看是Low的不得了的“高性价比”便宜而已,细一看是维度攻击下的合理利润还细节体贴,这时,“新品牌”的诞生,就不是撞运气了,而是Google那句话——

如果我能算出答案,为什么还要靠猜呢?

文末的这一句:如果我能算出答案,为什么还要靠猜呢?据雕爷所说是google的名言。虽然我本人对作者引用的这句话颇不以为然,因为作为工程师,我们从来就是靠的有凭有据的计算而不是靠的瞎蒙啊,就像电影《隐藏人物》(Hidden Figures)中的主人公们所做的一样。但怕自己是孤陋寡闻,去试着在网上查了下这一句的出处也不可得。不清楚原文的上下文语境,索性就不纠结了。
只是被雕爷口中google工程师们印在T恤衫上的名言一启发,赶忙记着把自己的标题给改成了“既然查不到,干脆自己算”!原来的是“既然查不到,干脆自己编”,显得是在胡编滥造一样。好吧,我就是算出来的,谁说我是在编了。

追计

今日得空,又去查了下住建部公布的绿色建筑标识项目总数,中华人民共和国住房和城乡建设部 - 绿色建筑:添彩美丽中国(摘自《中国建设报》 2019.08.26 记者 任佳)提到了“截至2018年底全国获绿色建筑评价标识的项目总数10139个”,比起这里的预测值18275项少了一大截,看来还是冒进了,下次找机会去修正下结果才好。

截至2018年底项目总数10139个
参考资料

[1] 王清勤. 我国绿色建筑发展和绿色建筑标准回顾与展望[J]. 建筑技术, 2018, 49(4): 340-346
[2] 翟博文,陈辉林,马丽丽. 绿色建筑增量成本可视化设计与应用研究[J]. 建筑经济,2019,40(04):87-92.
[3] basicTrendline: an R package for adding trendline of basic regression models to plot
[4] 简单线性回归分析
[5] 住房城乡建设部关于印发建筑节能与绿色建筑发展“十三五”规划的通知
[6] 住房城乡建设部办公厅《关于2016年建筑节能与绿色建筑工作进展专项检查情况的通报》
[7] 新华网:2018中国绿色地产指数报告
[8] 未来5年中国绿色建筑行业面积预测分析
[9] 中华人民共和国住房和城乡建设部 - 绿色建筑:添彩美丽中国

上一篇下一篇

猜你喜欢

热点阅读