基线与增量数据分离架构下的分布式连接算法-计算机学报.PDF

基线与增量数据分离架构下的分布式连接算法-计算机学报.PDF

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基线与增量数据分离架构下的分布式连接算法-计算机学报

第 卷 第 期 计 算 机 学 报 39 10               Vol.39 No.10 年 月 2016 10 CHINESEJOURNALOFCOMPUTERS Oct.2016   基线与增量数据分离架构下的分布式连接算法 樊秋实 周敏奇 周傲英     (华东师范大学数据科学与工程研究院,上海高可信计算重点实验室 上海 200062)     摘 要 在大数据背景下,数据库系统表连接操作的效率急需优化,尤其对于基线与增量数据分离的数据库系统     来说,其连接操作更是成为其性能的主要瓶颈 为了有效提升事务处理的性能,在基线与增量数据分离的数据库系 . 统架构中,通常将基线数据存储于磁盘中,增量数据存储于内存中,进而获得较高的事务处理吞吐量和可扩展性. 、 、 等系统是典型的基线与增量数据分离的数据库管理系统,但是他们的表连接效率较 HbaseBiTableOceanBase g 低,其主要原因包括:每次表连接前必须先合并基线数据和增量数据;数据存储模式更为复杂,导致过大的网络开 销 该文提出了一种基线与增量数据分离架构下的排序归并连接优化算法 该算法对连接属性做范围切分,在多个 . . 节点上并行做排序归并连接 该算法无需在连接前合并基线数据和增量数据,进而实现对基线和增量数据并行处 . 理,同时也避免了大量非连接结果集数据的基线与增量合并操作 并在开源的数据库 上实现了该算法, . OceanBase 通过一系列实验证明,该算法可以极大提高 OceanBase数据库的表连接处理性能. 关键词 分布式连接;增量数据;并行处理;排序归并连接   中图法分类号 号 / TP311 犇犗犐 10.11897SP.J.1016.2016.02102     犃犇犻狊狋狉犻犫狌狋犲犱犑狅犻狀犃犾狅狉犻狋犺犿狅狀犛犲犪狉犪狋犲犱犇犪狋犪犛狋狅狉犪犲 犵 狆 犵 FANQiuShi ZHOUMinQi ZHOUAoYin     g ( , , 犛犺犪狀犺犪犻犓犲 犔犪犫狅狉犪狋狅狉 狅 犜狉狌狊狋狑狅狉狋犺 犆狅犿 狌狋犻狀 犐狀狊狋犻狋狌狋犲 狅狉犇犪狋犪犛犮犻犲狀犮犲犪狀犱犈狀犻狀犲犲狉犻狀 犵 狔 狔 犳 狔 狆 犵 犳 犵 犵 , )

您可能关注的文档

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档