[超市数据仓库系统.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[超市数据仓库系统

超市DW系统 小士多店的数据DW主要功能: 1、ETL处理分析 从超市每日交易的详细数据中提取数据,将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤,按照统一的编码、统一的格式整合集成,然后装入数据仓库。 2、主题的选择与汇总 超市经理最关注的是,XX顾客经常购买哪些商品及商品的销售情况,哪些商品经常被顾客一起购买? 二、设计实现: 第一步:概念模型 这里通过分析选择最主要的两个主题:商品和顾问 A、顾客主题 汇总每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。每个顾客每周、每月购买商品的购买量和购买额。 B、商品主题 汇总每种商品的日销量、日销售额及日利润。每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。 各主题域的属性信息描述: 主题名 公共键码 属性组 顾客 顾客id 顾客固有信息:顾客id,顾客名称,顾客地址,顾客所在地区,顾客联系电话 商品 商品id 商品固有信息:商品名称,厂家id,商品类别,商品类别,颜色 商品销售信息:商品id,顾客id,商店id,售货员id,售价,日期,销售量 商品库存信息: 商品id,商店id,库房id,进货日期,进价,库存数 商店固有信息:商店id,商品id,店名,地址,电话 售货员固有信息:售货员id,姓名,性别,年龄,家庭住址,联系电话 厂家有信息:厂家id,厂名,厂址,联系电话 第二步:技术准备工作 1、技术评估 此数据仓库具备管理大量数据的能力,进行灵活数据存取的能力,根据数据模型重组数据的能力,透明的数据发送和接受能力,周期性成批装载数据的能力,可设定完成时间的作业管理能力 2、技术环境准备 此数据仓库采用SQL Server为数据库进行设计,具有相当的数据存储和处理能力,完全可以满足此系统的要求。此系统在数据仓库上分析处理的数据量估计有1000条左右;数据仓库的数据量估计有上万条左右;进出数据仓库的通信量有100条左右。本系统主要在单机上进行操作,可以避免竞争性存取的冲突问题。 3、硬件配置 直接存取设备:磁盘存储器 网络:单机版 管理直接存取设备的操作系统:Windows2003 仓库DB及工具:SQL Server2005 企业版 第三步:逻辑模型 1、建模:多维模型设计 第四步:物理模型 使用Erwin自动生成 2、查询功能 (1)商品主题: 每种商品的每日销量、销售额和利润,每种商品的每周销量、销售额和利润及这三个数据的日平均、最大、最小值,每种商品的每月销量、销售额和利润及这三个数据的日平均、最大、最小值 =>分析出什么商品最畅销,什么商品最赚钱,用以指导超市的经营策略。 (2)顾客主题: 可查询每个顾客每日的购买量和购买额,每周的购买量和购买额,每月的购买量和购买额。查询结果可知顾客的购买力和购买行为,如某顾客经常买高档商品,则说明他的购买力强;某顾客常常买中低档商品,少有买高档商品,则说明他的购买力一般,超市从而可有针对性地培养顾客群。 3、数据挖掘和OLAP分析 可分析超市日销售额、日利润月趋势,周销售额、周利润年趋势,月销售额、月利润年趋势,并以表格和图形(直方图、折线图、圆饼图等)两种方式显示结果。 可作历史比较和趋势分析。 可作关联规则挖掘 : “在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油→牛奶)。关联规则挖掘在给定支持度阈值后, 使用Apriori算法 分析哪些商品顾客最有可能一起购买,从而预测顾客未来的购买行为,以便为顾客提供更好的服务以吸引顾客,扩大市场。 4、物理设计 数据存储结构存取时间:当前数据库的数据数据存取时间为毫秒级,历史数据库的数据存取时间为秒级。 存储空间利用率:随着数据的增加,存储空间将充分得到利用,估计存储空间利用率为80%左右。 维护代价:由于程序所分析的主题有限,所以维护代价较小。 索引策略:主要按照时间(月和年)编制索引。 数据存放位置 对于本年度的数据存放到当前数据库,对于历史资料和分析资料存放到历史数据库。 存储分配 每块约可容纳50条记录,缓冲区为5个,每个大小为10M。 第五步:数据仓库生成 从操作型环境向数据仓库型环境按照时间顺序装载数据,清除无效和错误数据,不断刷新数据,并建立时间响应接口。 第六步:数据仓库的使用和维护 在数据仓库中建立DSS根据用户的使用情况和反馈信息,进一步完善系统,并管理数据仓库的一些日常活动。 超市数据仓库系统 日交易数据查看 数据过滤集成

文档评论(0)

34shart09 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档