《录入校对子系统》.docVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
录入校对子系统 1、 现代校对技术概述 现代校对技术采用三校一读对片制度。“三校”即三个校次,这是必须坚持的最低限度的校次。“一读”即终校改版后的通读检查。?现代的“三校一读”,校法和任务各不相同。一校、二校以对校为主,操作上采用点校、折校等方式,任务是消灭录排差错;三校以本校为主,任务是发现并质疑原稿错讹;一读是最后通读检查。磁盘书稿校对,由于原稿与校样合二为一,一校没有可资比照的原稿,则应采用本校法,通过是非判断发现录排差错和原稿错讹。一校改版后打出二校样,一校样就成为二校的比照物,所以二校时应先对红,然后再进行二校。三校样打出后,校法同二校。如前所述,三个校次是最低限度的校次,特殊的书稿,特殊的情况,还须相应增加校次。 对片是当代校对制度的创新,它是计算机排版制片新工艺的产物。计算机排版制片,有可能发生文字错乱丢失,因此制片完成后,必须将胶片一一与清样对照。对照的方法是:将胶片压在清样上面,通过移动胶片,使胶片上的字符图表与清样完全对合,如发现不能完全对合,则要采用对校法,将胶片与清样对校。 在校对软件方面,除了OCR校对软件外,还有以下两种功能的商业化软件产品: (1).语文校对 针对文章和数据中的中文说明部分,利用文章校对软件的汉语语料库和汉语切分技术、汉语语法分析技术、汉语依存关系分析技术,精确校对中文、标点、计量单位、异形词和重句等各类错误。双文对校不同的录入人员同时录入一份文件,两者在同一处出现同样的错误的几率几乎为零,利用双文对校软件对比这两个文件,就能迅速地发现录入稿和原稿中存在的各种错误。采用双文对校的方式,成本要低于人工折校的校对费用,而准确率又远远高于人工折校,是替代传统的人工折校的理想工具。、三校稿有没有改错的地方,二校的修改意见都改了没有单靠人工校对难免会有遗漏和失误,用双文对校软件比对二校稿和三校稿,所有不同之处尽显眼前,轻松完成核红工作,确保出版物的准确无误。通过智能比对原文件和修改后的文件的异同,能够准确地显示和统计编辑人员的修改工作所有不同之处都会准确地标记出来。智能定位对比功能确保比对结果的完美性。提供添加、删除和修改等标记手段,可以突出显示各种标记。电子影像 数据校验用于分析数据一致性和可靠性,属于校是非,包括运算校验、范围校验、平滑校验等。运算校验是根据各序列之间的计算公式进行校验;范围校验则根据数据的取值范围对数据进行越界检查,或根据变幅的取值范围对数据进行变幅越界检查,含字符匹配校验;平滑校验帮助用户找到突变点。 数据校验分为入库前的数据校验和入库后的数据校验两个部分。数据校验软件应具备批量操作功能,程序可一次检查一个目录下所有各级子目录中的文件,支持用户使用文件通配符。为避免功能重复,数据校验不实现序列分析软件提供的图形化校验和时序一致性分析功能,也不提供实时整编软件和年鉴还原软件提供的合理性检查功能,但是,数据校验软件应提供这些系统未提供的其他合理性检查功能。 7、 录入校对大致分工 录入校对工作采用各勘测局分散录校和省局集中录校相结合的方式,由于扫描录入的关键设备和软件在省局,扫描和录入工作应在省局集中完成,勘测局设备可录入的零星数据可由各分局完成。各勘测局校对本辖区的数据,校对数据量较大,超出勘测局设备处理能力的部分由省局集中校对,矢量化数据由省局集中校对,校红和数据审查在省局完成。 8、 校对工作量及费用 按上文所述,有纸数据的校对采用三校三核一审七道工序,无纸数据采用一校一核一审三道工序,因校勘部分几乎采用了所有的检查手段,当可保证数据质量。 抛开不需要校对的图形视频数据和电算整编数据不谈,按紧凑格式计算,十二五之前的其他数据大约2G,其中,无纸数据约为1.5G,有纸数据约为0.5G,由于现有无纸数据均未经过跨表校对和图形校对,某些数据虽然经过一些校对,但由于采用的校对方式单一,数据质量达不到1/10000的标准要求,这些数据应严格按本项目的工序和要求进行校对,才能确保数据质量。 校对工作的勘核和抽审阶段是数据把关,应由水文水资源资深专业人员实施,初校和二校可以交给外校完成,初核和二核应由各勘测局完成,校勘则必须由有理工科背景的人员完成。 按录入校对业的惯例,录入校对费以每千字每校次计,现在市场最低价为每校次1元/千字,由于是海量录入校对,我们换算为每校次每兆1000元,考虑到事业单位可以安排部分在编人员参与校对和审查,我们以市场最低价的一半(每校次每兆500元)做经费预算,并且不计导致设备消耗的自动录入和扫描费用,则有原稿的数据按照3个校次,每GB 150万元可让质量达标,需75万元,无原稿的数据按照2个校次,每GB 100万元可让质量达标,需150万元。校对十二五之前的全部数据共需225万元。 采用OCR和矢量化录入方案,由于是海量数据录入,虽说设备投资大,但与手

您可能关注的文档

文档评论(0)

hhh1 + 关注
实名认证
文档贡献者

没有什么可以说的

1亿VIP精品文档

相关文档