深度卷积神经网络中的归一化CN115803752A.pdfVIP

深度卷积神经网络中的归一化CN115803752A.pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
发明名称 深度卷积神经网络中的归一化 摘要 本文描述了一种用于机器学习的设备 (900),所述设备(900)包括一个或多个处理器 (901),所述处理器用于实现神经网络第一层、神 经网络第二层以及布置在所述神经网络第一层 与所述神经网络第二层之间的归一化层,所述归 一化层用于在所述设备在对一批训练样本进行 训练时执行以下操作:针对所述批次的多个训练 样本接收(1001)所述神经网络第一层的多个输 出,每个输出包括第一维度和第二维度上不同索 引的多个数据值,所述第一维度表示通道维度; 根据与所述输出相关的所述第一维度和所述第 二维度上的所述索引,将所述输出分成(1002)多 A 个组;为每个组形成(1003)归一化输出;提供 2 (1004)所述归一化输出作为所述神经网络第二 5 7 3 层的输入。这可以训练具有良好性能的深度卷积 0 8 5 神经网络,所述深度卷积神经网络在不同批量大 1 1 N 小时稳定运行并且可推广到多个视觉任务。这也 C 可以加快所述训练并提高所述训练的性能。 CN 115803752 A 权 利 要 求 书 1/2页 1.一种用于机器学习的设备(900),其特征在于,所述设备包括一个或多个处理器 (901),所述处理器用于实现神经网络第一层、神经网络第二层以及布置在所述神经网络第 一层与所述神经网络第二层之间的归一化层,所述归一化层用于在所述设备在对一批训练 样本进行训练时执行以下操作: 针对所述批次的多个训练样本接收(1001)所述神经网络第一层的多个输出,每个输出 包括第一维度和第二维度上不同索引的多个数据值,所述第一维度表示通道维度; 根据与所述输出相关的所述第一维度和所述第二维度上的所述索引,将所述输出分成 (1002)多个组; 为每个组形成(1003)归一化输出; 提供(1004)所述归一化输出作为所述神经网络第二层的输入。 2.根据权利要求1所述的设备(900),其特征在于,所述第二维度表示一个或多个空间 维度。 3.根据权利要求2所述的设备(900),其特征在于,所述为每个组形成归一化输出的步 骤包括:计算所述组中所述输出的聚合统计参数。 4.根据权利要求2或3所述的设备(900),其特征在于,所述为每个组形成归一化输出的 步骤包括:计算所述组中所述输出的平均值和方差。 5.根据上述任一权利要求所述的设备(900),其特征在于,所述对所述输出进行分组的 步骤包括:将每个输出仅分配给所述组中的单个组。 6.根据上述任一权利要求所述的设备(900),其特征在于,所述对所述输出进行分组的 步骤包括:将与所述第一维度上的共同指标和所述第二维度上的共同指标相关的所有输出 分配到同一组。 7.根据上述任一权利要求所述的设备(900),其特征在于,所述对所述输出进行分组的 步骤包括:将与公共批次相关的输出分配到不同的组。 8.根据上述任一权利要求所述的设备(900),其特征在于,所述对所述输出进行分组的 步骤包括:根据与输出相关的所述第一维度上的所述指标,将输出分配到不同的组。 9.根据上述任一权利要求所述的设备(900),其特征在于,所述对所述输出进行分组的 步骤包括:根据与输出相关的所述第二维度上的所述指标,将输出分配到不同的组。 10.根据上述任一权利要求所述的设备(900),其特征在于,所述归一化层用于: 接收控制参数; 将所述控制参数与预定阈值进行比较; 根据所述参数,确定在所述分组步骤中如何根据所述第一维度和所述第二维度中与输 出相关的所述指标,将输出分配到不同的组。 11.根据权利要求10所述的设备(900),其特征在于,所述设备用于根据所述批次中的 训练样本数量来形成所述控制参数。 12.根据上述任一权利要求所述的设备(900),其特征在于,所述输出是所述神经网络 第一层形成的特征图。 13.根据上述任一权利要求所述的设备(900),其特征在于,所述设备用于根据所述归 一化输出来训练所述神经网络第二层。 14.一种用于基于一批训练样本训练用于机器学习的设备(900)的方法(1000),其特征

文档评论(0)

麦克斯韦的猫 + 关注
实名认证
文档贡献者

百科 专业资料

认证主体遆**

1亿VIP精品文档

相关文档

相关课程推荐