人工智能:Scale AI-数据标注独角兽 20230815 - 中泰证券.docx

人工智能:Scale AI-数据标注独角兽 20230815 - 中泰证券.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中 泰 证 券 研 究 所 专 业 | 领 先 | 深 度 | 诚 信 | 证 券 研 究 报 告 | Scale AI-数据标注独角兽 2 2 0 2 3 . 8 . 1 5 分析师:闻学臣 执业证书编号: S0740519090007 数据标注的定义 ? 数据标注:对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作,为待标注数据增加标 签,生成满足机器学习训练要求的机器可读数据编码。 ? 以对象作为分类标准,数据标注可以分为图像标注、语音标注、文本标注以及视频标注。 图表: 数据标注分类 数据标注分类 概述 图像标注 图像标注类型包括拉框、语义分割、实例分割、目标检测、图像分类、关键点、线段 标注、文字识别转写、点云标注、属性判断等。图像标注在人工智能与各行各业应用 相结合的研究过程中扮演着重要的角色 语音标注 语音标注类型包括 ASR语音转写、语音切割、语音清洗、情绪判定、声纹识别、音素 标注、韵律标注、发音校对等 文本标注 文本标注是对文本进行特征标记,为其打上具体的语义、构成、语境、目的、情感等 原数据标签,主要用于自然语言处理。通过语句分词标注、语义判定标注、文本翻译 标注、情感色彩标注、拼音标注、多音字标注、数字符号标注等,可获得高准确率的 文本语料 视频标注 视频标注以图片帧为单位,对视频素材中的目标对象进行跟踪,对包括道路、车辆、 行人等在内的目标物的特征信息、结构信息、语义信息等进行标记,从而形成训练数 据集。按照具体应用类型,视频标注可进一步划分为视频追踪、标签分类、视频打点 以及视频信息提取 资料来源: 《数据标注工程(第2版)》、中泰证券研究所 市场规模及主要玩家 资料来源:各公司官网、中泰证券研究所 ? 根据Grand View Research的报告显示, 2022 年全球数据收集和标注市场规模为 22.2 亿美元,预计从 2023 年到 2030 年将以 28.9% 的复合年增长率增长。2022 年全球数据标注解决方案和服务市场规模为 118.3 亿美元,预计从 2023 年到 2030 年的复合年增长率为 21.3%。 ? 目前主要的公司包括: Scale AI 、Appen 、CloudFactory、LightTag 、Alegion等。 图表: 数据标注部分公司 Scale AI-公司介绍 资料来源:公司官网、中泰证券研究所 ? Scale AI 2016 年成立,创始人为 Alexandr Wang 和 Lucy Guo (现已离开公司),由著名创业孵化器Y Combinator投资。 ? 其核心业务为数据标注,发家于自动驾驶行业,后切入政府、电商、机器人、大模型等场景。 图表: Scale AI公司官网 Scale AI-公司管理团队 ? Scale AI 的创始人Alexandr Wang 出生于 1997 年, 是一名华裔,从小生活在新墨西哥 州,父母都是物理学家。 Alexandr Wang在麻 省理工就读一年后选择在硅谷参加工作。2016 年,他与Lucy Guo 共同成立Scale AI,公司使 命是加速人工智能应用程序的开发。 ? Scale AI的人员规模从创立时的3人发展至目前 的600人, Scale 整体执行力强,工作节奏快, 喜好招顶级院校的应届毕业生。 图表: Lucy Guo和Alexandr Wang 资料来源: 36氪、中泰证券研究所 场景产品产 场景 产品 产品介绍 数据标注 Scale Rapid 可以在用户上传数据后加快数据标签的形成,要求数据由Scale 标注,Scale Rapid正在试图赶上Super Annotate在创建工作流 和质量方面的领先地位 Scale Studio 提供标注工具,用户可以批注、监控和提高数据质量,要求用 户自带标注人员 Scale 3D Sensor Fusion 3D传感器数据标注 Scale Image 图像标注 Scale Video 视频标注 Scale Text 文档标注 Scale Audio 人工音频标注和分类 Scale Mapping 地图标注,可自定义 Scale Catalog 电商和零售团队可用于商品标注,AI生成产品图 管理与评估 Scale Nucleus 2020年8月推出的数据集管理平台,用户可以在Nucleus中可视 化产看标签性能、所搜特定标

文档评论(0)

我爱分享 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体马**

1亿VIP精品文档

相关文档

相关课程推荐