对于信息用户来说,信息首要保证的是真实。否则,即便使用了再优秀的分析方法,也是“垃圾入垃圾出”。而农业经济商业智能信息系统的建设确保了数据的正确性。首先,农业经济商业智能信息系统的数据主要源于OLTP(联机分析)系统,而OLTP的数据直接生成于业务处理时原始的数据,而非经过了处理加工了信息。其次结合技术手段,每一个通过ETL(抽取、转换、加载)的数据都能回寻到其原始数据源,使得每一个来到数据仓库的数据都有据可查,增加了数据的可信度。
(二)提供实时、多维分析服务
(三)提供基于历史的数据分析
原有的系统,例如农经网系统,为了平衡系统效率,只能提供给用户6-12个月的数据,之前的信息被闲置,而这些信息对于经济分析,趋势预测十分重要。农业经济商业智能系统的一大优点就是通过对于历史数据的清理整合,使得用户能够获取长期(超过5年)的历史数据,实现进行基于历史的分析。
(四)面向不同的用户
农业经济信息的用户范围十分广泛,从政府政策制定者到个体农户、农产品经营者都需要农业经济信息,但之前的分析服务用户面狭窄,其分析只能事先设计、定期推送,局限了用户群体。而农业智能信息系统却可以提供面向不同用户的差异服务。(五)开放性贵州省农业经济智能系统提供了一个开放的平台。首先,其预留了未来与其他数据仓库整合的可能,例如与贵州省的气象数据、地理信息数据的整合,以及通过web数据抓取整合web上的信息,例如其他省份的农业经济数据,农业期货数据等。而这些信息的加入,能大大扩充数据以及信息观察的角度,满足更多分析需求。
二、贵州省农业经济智能信息系统的设计
(一)数据源特点
(二)需求分析
2.功能分析。综上所属,不同类型的用户需求虽有差别,但是也存在共通点。通过需求分析,最终贵州省农业经济智能信息系统计划实现以下功能:
对农产品价格数据进行旋转、切片、切块、向上综合和向下钻取等多维分析,以获得多角度、多粒度历史数据;
进行多种农产品价格指数的计算;
实现对于农产品价格的数据挖掘,并实现对于农产品价格的预测;
实现分析数据的可视化展示平台。
(三)后台数据仓库的概念设计
数据仓库是贵州省农业经济信息系统的核心,也是信息分析以及数据挖掘的基础。数据仓库的概念模型设计必须基于实际调查,结合实际信息分析需要以及数据源的结构,设计错误的数据仓库模型将会导致整个智能信息系统的失败,产生错误的信息。数据仓库模型的概念设计主要涉及设计维度表、事实表以及维度表与事实表、维度表之间的关系。
1.关键维度
2.事实表的分析设计
相对而言事实表的设计较为简单,但是由于事实表的数据量远远大于维度表(仅2006年数据就达到百万级),对于事实表属性的数据类型设计显得十分重要,好的设计可以大大缓解数据仓库的爆炸性增长情况。根据业务主题的特点,分别用与之对应的度量值对其事实表进行填充。
3.农产品交易事实表(FactTrading)
(四)数据仓库总体结构设计
三、贵州省农业经济智能信息系统的初步利用
(二)价格统计分析功能的实现在结合下钻,上钻,切块等多维分析的同时,还可以根据已有的对农产品的分析方法,例如定基价格指数、同比指数、环比指数等对数据进行统计分析。
(三)KPIs功能的实现如需求分析中所述,农业政策决策者需要的是一种高度概括性的状况信息,而不是繁琐的数据,理想的状况是通过对于状态的一览,就可以了解目前农产品价格是否出现了异常。通过对于关键业绩指标(KeyPerformanceIndicators)的实现,可以很便捷地达到这一目标。例如,首先通过实际调查了解到,决策者认为农产品价格上涨或下跌某百分比值便认为出现了价格异常。在智能信息系统开发中结合MDX语言,编写相应代码,实现KPIs对应的报警功能,最后再实现对用户友好的、直观的前台展现(十字形为异常,三角形为可接受,圆形为正常)。