- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[超市数据仓库系统
超市DW系统
小士多店的数据DW主要功能:
1、ETL处理分析
从超市每日交易的详细数据中提取数据,将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤,按照统一的编码、统一的格式整合集成,然后装入数据仓库。
2、主题的选择与汇总
超市经理最关注的是,XX顾客经常购买哪些商品及商品的销售情况,哪些商品经常被顾客一起购买?
二、设计实现:
第一步:概念模型
这里通过分析选择最主要的两个主题:商品和顾问
A、顾客主题
汇总每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。每个顾客每周、每月购买商品的购买量和购买额。
B、商品主题
汇总每种商品的日销量、日销售额及日利润。每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。
各主题域的属性信息描述:
主题名 公共键码 属性组 顾客 顾客id 顾客固有信息:顾客id,顾客名称,顾客地址,顾客所在地区,顾客联系电话 商品 商品id 商品固有信息:商品名称,厂家id,商品类别,商品类别,颜色
商品销售信息:商品id,顾客id,商店id,售货员id,售价,日期,销售量
商品库存信息: 商品id,商店id,库房id,进货日期,进价,库存数
商店固有信息:商店id,商品id,店名,地址,电话
售货员固有信息:售货员id,姓名,性别,年龄,家庭住址,联系电话
厂家有信息:厂家id,厂名,厂址,联系电话 第二步:技术准备工作
1、技术评估
此数据仓库具备管理大量数据的能力,进行灵活数据存取的能力,根据数据模型重组数据的能力,透明的数据发送和接受能力,周期性成批装载数据的能力,可设定完成时间的作业管理能力
2、技术环境准备
此数据仓库采用SQL Server为数据库进行设计,具有相当的数据存储和处理能力,完全可以满足此系统的要求。此系统在数据仓库上分析处理的数据量估计有1000条左右;数据仓库的数据量估计有上万条左右;进出数据仓库的通信量有100条左右。本系统主要在单机上进行操作,可以避免竞争性存取的冲突问题。
3、硬件配置
直接存取设备:磁盘存储器
网络:单机版
管理直接存取设备的操作系统:Windows2003
仓库DB及工具:SQL Server2005 企业版
第三步:逻辑模型
1、建模:多维模型设计
第四步:物理模型
使用Erwin自动生成
2、查询功能
(1)商品主题:
每种商品的每日销量、销售额和利润,每种商品的每周销量、销售额和利润及这三个数据的日平均、最大、最小值,每种商品的每月销量、销售额和利润及这三个数据的日平均、最大、最小值
=>分析出什么商品最畅销,什么商品最赚钱,用以指导超市的经营策略。
(2)顾客主题:
可查询每个顾客每日的购买量和购买额,每周的购买量和购买额,每月的购买量和购买额。查询结果可知顾客的购买力和购买行为,如某顾客经常买高档商品,则说明他的购买力强;某顾客常常买中低档商品,少有买高档商品,则说明他的购买力一般,超市从而可有针对性地培养顾客群。
3、数据挖掘和OLAP分析
可分析超市日销售额、日利润月趋势,周销售额、周利润年趋势,月销售额、月利润年趋势,并以表格和图形(直方图、折线图、圆饼图等)两种方式显示结果。
可作历史比较和趋势分析。
可作关联规则挖掘 : “在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油→牛奶)。关联规则挖掘在给定支持度阈值后, 使用Apriori算法 分析哪些商品顾客最有可能一起购买,从而预测顾客未来的购买行为,以便为顾客提供更好的服务以吸引顾客,扩大市场。
4、物理设计
数据存储结构存取时间:当前数据库的数据数据存取时间为毫秒级,历史数据库的数据存取时间为秒级。
存储空间利用率:随着数据的增加,存储空间将充分得到利用,估计存储空间利用率为80%左右。
维护代价:由于程序所分析的主题有限,所以维护代价较小。
索引策略:主要按照时间(月和年)编制索引。
数据存放位置
对于本年度的数据存放到当前数据库,对于历史资料和分析资料存放到历史数据库。
存储分配
每块约可容纳50条记录,缓冲区为5个,每个大小为10M。
第五步:数据仓库生成
从操作型环境向数据仓库型环境按照时间顺序装载数据,清除无效和错误数据,不断刷新数据,并建立时间响应接口。
第六步:数据仓库的使用和维护
在数据仓库中建立DSS根据用户的使用情况和反馈信息,进一步完善系统,并管理数据仓库的一些日常活动。
超市数据仓库系统
日交易数据查看
数据过滤集成
文档评论(0)