《计算机视觉应用开发》课件 cha8 4_基于LSTM+CTC的文字识别.pptx

《计算机视觉应用开发》课件 cha8 4_基于LSTM+CTC的文字识别.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于LSTM+CTC的文字识别 案例描述01任务案例目标02任务案例分析03任务案例实施04任务 1案例描述 1案例描述本案例将使用python的第三方库captcha来生成验证码,并搭建LSTM+CTC网络结构对生成的验证码进行文字识别。 2案例目标 案例目标学会使用第三方库生成随机验证码;搭建LSTM+CTC的网络架构并对随机生成的验证码进行识别。2 3案例分析 案例分析如何生成验证码,并分批次传给神经网络,这是一个问题。使用captcha来生成验证码,captcha使用Python写的生成验证码的库,它支持图片验证码和语言验证码,这里使用的则是生成图片验证码的功能。3 4案例实施 4案例实施 1.导库from captcha.image import ImageCaptchafrom tensorflow.keras.callbacks import Callbackfrom tensorflow.keras.callbacks import EarlyStopping, CSVLogger, ModelCheckpoint2.生成验证码接着定义要生成的验证码的内容。这里使用0-9和大写的英文字母A-Z来随机作为验证码的内容。characters = string.digits + string.ascii_uppercase 4案例实施接下来就是生成验证码的部分了。这里写了一个 CaptchaSequence类,该类继承自Sequence,功能类似于python的生成器,但限制较少,可迁移性更好。该类有三个方法:__init__():初始化,定义要使用的变量。__len__():生成的验证码(数据集)的总数量。__getitem__():返回一个batch_size的数据。 4案例实施3.搭建网络 数据准备之后,要开始搭建网络结构了,在此之前,先编写计算CTC损失的函数ctc_lambda_func()。def ctc_lambda_func(args): y_pred, labels, input_length, label_length = args return K.ctc_batch_cost(labels, y_pred, input_length, label_length)接着开始搭建网络。提取特征部分用了10层卷积层。 4案例实施4.训练模型接下来就开始要进入训练环节了。开始训练之前,设置回调函数,配置模型保存路径,在每个epoch跑完之后验证准确率等。pile(loss={'ctc': lambda y_true, y_pred: y_pred}, optimizer=Adam(lr=0.001, amsgrad=True)) model.fit_generator(train_data,steps_per_epoch=10,epochs=100, validation_data=valid_data, workers=4, callbacks=callbacks) ThankYOU!

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档