T-CESA-1169-2021-信息技术-人工智能-服务器系统性能测试规范标准.docx

T-CESA-1169-2021-信息技术-人工智能-服务器系统性能测试规范标准.docx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

T/CESA1169—2021

信息技术人工智能服务器系统性能测试规范

1范围

本文件规定了人工智能服务器系统,完成深度学习训练及推理任务的性能(运行时间、能耗、实际吞吐率、能效、效率、弹性、承压能力等)测试方法。

本文件适用于人工智能服务器系统的性能评估。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

3.1

被测系统systemundertest

一次测试中,处理测试者给出的测试作业,并返回结果的系统。

注:被测系统可由人工智能服务器系统硬件、算子实现库、框架软件、模型编译组件及其他必要软硬件组成。

3.2

被测者testedparty

一次测试中,筹备、操作被测系统实施测试,并按测试协议的规定享有测试结果使用权的机构或个人。

3.3

参考模型referencemodel

用于定义系统测试要求的标准化的模型。

[来源:ISO/IEC14776—2009,3.1.87,有修改]

3.4

计时timing

获取并返回被测系统当前时间戳。

注:假设被测系统(3.1)各节点时间一致。

1

T/CESA1169—2021

3.5

人工智能服务器artificialintelligenceserver

含有专为人工智能计算设计的计算机构,能够为人工智能应用提供专用加速计算能力的服务器。

注1:以通用服务器为基础,配备人工智能加速卡后,为人工智能应用提供专用计算加速能力的服务器,称“人工智能兼容服务器”。

注2:专为人工智能加速计算设计,提供人工智能专用计算能力的服务器,称“人工智能一体机服务器”。

3.6

人工智能服务器集群集群

artificialintelligenceservercluster

遵循统一控制的,人工智能计算功能单元的集合。

注1:人工智能计算功能单元可包含:人工智能加速处理器、人工智能服务器、人工智能加速模组等。

注2:当由人工智能服务器组成时,人工智能服务器称为节点。

注3:人工智能服务器集群是人工智能高性能计算中心的主要组成部分。

3.7

人工智能服务器系统artificialintelligenceserversystem

由人工智能服务器及其他必要的计算、存储设备组成,承担人工智能运算任务的计算系统。注:人工智能服务器系统是人工智能服务器,人工智能服务器集群的统称。

3.8

测试数据testdata

测试集

用于测试最终机器学习模型功能的数据。

[来源:ISO/IECDIS22989—2021,3.2.19]

3.9

测试者tester

组织、开展测试的机构或个人。

注:测试者使用测试系统实施测试,它向被测系统(3.10)发送作业(3.11),接收输出,计算性能(3.12)指标。

3.10

测试系统testsystem

执行测试所使用的硬件、软件及数据。

注:测试系统不是被测系统中的框架软件或加速库。

2

T/CESA1169—2021

[来源:ISO/IEC10303.34—2001,3.5.9]

3.11

作业job

含有测试样本的数据包。

注:1个作业可含有1个或多个测试样本。

3.12

性能performance

人工智能服务器系统运行计算任务时,可被测量的特性。

注:性能可基于一个或多个参数(如运行时间、能耗、实际吞吐率、能效、效率、弹性、承压能力等)的测量或计

算获得,以表征在某机器中运行的某技术过程的行为、特性及效率。

[参考:ISO/IEC20000.10—2018,3.1.16和ISO13372—2012,2.3]

3.13

训练数据训练集

trainingdata

用于训练机器学习模型的输入样本子集。

[来源:ISO/IECDIS22989—2021,3.2.22]

3.14

验证数据validationdata

验证集

用于评估一个或多个备选机器学习模型功能数据样本。

[来源:ISO/IECDIS22989—2021,3.2.24]

4缩略语

下列缩略语适用于本文件。

AI人工智能(ArtificialIntelligence)

AUC曲线下面积(AreaUnderCurve)

AUTOML自动机器学习(AutomatedMachineLearning)

BFLOAT16脑半精度浮点数(BrainFloating-point)

BLEU双语评估替换(BilingualEvaluationUnderstudy)

FP16半精度浮点数(Half-precisionFloati

文档评论(0)

偶遇 + 关注
实名认证
内容提供者

个人介绍

1亿VIP精品文档

相关文档