AIGC行产业深度报告.pptxVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

AIGC行产业深度报告1.1AIGC:人工智能生成内容,Web3时代的生产工具 ?AIGC(AIGeneratedContent),即通过人工智能自动生成内容,具体指基于大型语言模型LLM、生成对抗网络GAN等深度学习技 术,输入数据后由人工智能生成相关内容。目前AIGC已进入成长期,AI生成图像、文字、代码、音乐等领域均已有相关应用落地, 我们认为随着B、C两端的快速普及,AI创作生产内容将成为下一阶段的重要内容生产方式。 图:AI生成内容的流程 数据准备准备大量的可供训练的数据,如文本、图像、音频等,并对其进行预 处理。 模型训练使用机器学习算法(如神经网络、随机森林等)对,模型进行训练,让模型学会生成与人类相似的内容。 生成内容通过模型的预测接口,向模型输入指定的模板和数 据,获得生成的内容。 评估效果评估生成的内容与实际创 作要求的差异。 模型优化根据评估效果对模型进行优化,提高生成内容的质 量。图:内容创作模式的演变猜想用户生产内容 UGCAI生产内容 AIGCAI辅助用户生产内容 AIUGC专业人士生产内容 PGC资料来源:ChatGPT、研究所1.2AIGC的进入壁垒:开源降低行业技术门槛,但大模型对数据及算力需求极高 ?AIGC本身的技术门槛并不高。大模型的涌现和指数级的能力迭代,开源社区的繁荣、API接口的大量开发和开放(ChatGPT即为 开放平台),使AIGC应用对新进入者较为友好。此外大模型的泛化能力和通用性极强,无需对场景和模型重复训练(即Zero- shot),由此而来的低成本准入门槛、数据飞轮效应和广泛的场景适应能力,都一定程度降低了行业的技术壁垒。 ?但大模型对数据量及算力的海量需求,使得头部大厂的规模优势更加突出。模型是当下主流AIGC应用的核心基础,训练和运行模 型都需要庞大的数据量和算力成本(资金)。1)数据需求:模型性能与数据量、数据质量紧密相关,文献显示即使是拥有130 亿参数的模型(仅次于拥有1750亿的GPT-3完整版模型)处理二位数加减法的准确率也只有50%左右,处理其他运算的准确率 还不到10%。2)算力花费:GPT3.5的训练使用了微软专门建设的AI计算系统,由1万个V100GPU组成的高性能网络集群,总 算力消耗约3640PF-days(即假如每秒计算一千万亿次,需要计算3640天)。图:深度学习模型的算力需求指数级增长 图:GPT3的8个模型一共使用了3000亿token资料来源:OpenAI,英伟达,研究所1.3评估AIGC的政策风险:数据、算法规范已逐步完善,当前责任集中于平台自查 ?AIGC目前存在版权、伦理、数据安全等风险点。AI模型通常是通过预先存储的大量数据训练得到的,因此其中可能存在错误、偏见 或不准确的信息。1)版权:AI模型可能侵犯到他人的版权,如通过复制或抄袭别人的作品创建文本。2)伦理:AI模型可能存在伦 理风险,例如造成误导、歧视或侵犯个人隐私。3)数据安全:当存储或处理敏感信息时,存在数据泄露、被窃取等安全风险。 ?数据及算法领域此前已经经历过一轮密集规范,相关细则已经相对完善,叠加2021年以来数字经济相关政策利好陆续释放,我们判 断产业初创期相关的政策态度趋于包容,目前审核责任更多集中于平台对语料库的自查。 图:此前针对数据及算法的监管体系已经逐步完备顶层法规条例细则 《民法典》、《国家安全法》、《数据安全法》、《网络安全法》、《个人信息保护法》 《网络安全审查办法》、《云计算服务安全评估办法》、《关键信息基础设施安全保护条例》、《互联网信息服务算法推荐管理规定》、 《关键信息基础设施安全保护条例(征求意见稿)》、《企业数据资源相关会计处理暂行规定(征求意见稿)》、《数据出境安全评估申报指南(第一版)》、《关于修改〈中华人民共和国网络安全法〉的决定(征求意见稿)》、《工业和信息化领域数据安全管 理办法(试行)》 数据采集 ?平台方强化信息采集限制、用户方明确数据处置权利 数据管理?维护国家数据安全、审慎规范数据使用,压实平台管理责任 数据分类分级 ?实行公共数据、企业数据、个人数据分类分级界定,明确各级数据监管范围 数据流通 ?将数据要素流通市场纳入监管范畴,优化数据交易市场机制,提升市场化水平资料来源:公开资料整理,研究所2.1行业已经具备大规模商业化条件:供给多点开花,顺应行业需求 供给侧现有技术成熟度已经能够大规模辅助用户进行内容生产,下游供给多点开花。 1)我们通过实际使用判断人工智能创作能力基本达到了人类专业工种 60%-70%的水平,且基于AI的工具容错率高,可编辑性强,具备落地应用 的可行性。 2)从实际供给来看,当前AIGC已经率先在营销、影

文档评论(0)

1658576823bd104 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档