语言文字标准化-中华人民共和国教育部.ppt

语言文字标准化-中华人民共和国教育部.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语言文字标准化-中华人民共和国教育部.ppt

语言文字标准化、信息化30年 教育部语言文字信息管理司 司长 李宇明 改革开放面临的形势 汉字的前途:简化?拼音化? 计算机及之后的网络:输入、显示、存储、传输、输出(语言文字标准化、信息化) 语言资源的大量流失(用现代信息手段保存、保护语言资源) 1986年全国语言文字工作会议 “二简”(1977年发布)方案正式收回 保持汉字稳定,实现标准化:定量、定形、定音、定序 汉字拼音化不是当前的任务,但要充分发挥汉语拼音在信息化时代的作用 语言文字信息化也是国家语言文字工作 国家通用语言文字规范化信息化 现代汉字有了基本标准(简化字总表、常用字表、通用字表、规范汉字表) 信息化:机器有了7万多汉字的编码并且国际化,正向古代汉字信息化、字体个性化的方向发展。中华大字符集正在建设 汉语拼音成为国际标准 术语规范工作成绩突出。语言信息化提到了日程 已发布160多项标准 少数民族语言文字规范化信息化 一些有传统文字的语言(蒙古语、藏语、维吾尔语、哈萨克语、朝鲜语、彝语、傣语等)都可以进入计算机;古代文字也在逐步进入;多数有自己的网络和办公、出版等软件;有些还有自己语言的手机 民族语言术语标准化步伐匆匆 建立统一的语言文字平台和软件平台,促进内容的数字化 语言生活的监测与研究 建立了语言生活监测与研究中心 发布《中国语言生活状况》年度报告 开展“中国语言资源有声数据库”的建设:推广普通话,促进信息化,保存和开发语言资源 语言生活监测与研究 语言规范标准和信息化管理工作 由“人”的规范向“人和机器”的规范发展 由现代应用向历史文化发展 由大陆标准向国际化发展 由强制规定向主动引导发展 由行政管理向社会服务发展 * 周恩来总理1958年《当前文字改革的任务》:“简化汉字,推广普通话,制定和推行汉语拼音方案。” 这一阶段语言文字工作,是为了建设国家的文化基础,促进国家的富裕发展。 3 以语言文字 规范标准制定 为核心 3 以信息化 为主线 3 以评测认证为抓手 3 以语言工程 建设和科学研究为基础 新时期工作思路 以语言文字规范标准制定为核心,以信息化为主线,以科学研究和语言工程建设为基础,以评测认证为抓手,促进社会语言生活和谐。 1966前 1967~1985 1986~1990 1991~1995 1996~2000 2001~2005 2006~ 时期 通用语言文字规范标准发布状况 发布数量 ◆ 建国初期奠定基础 ◆九五、十五期间出现新高峰: 新时期语文政策 信息化的需要 机构逐渐健全 ◆未来的发展: 重在应用领域 重视标准修订 30 92 15 6 8 2 60% 20% 20% 语言文字规范标准发布分领域状况 通用类 信息处理类 术语类 文献类 地名类 其他 ◆ 信息化是主导 ◆ 通用类要加强 ◆ 重视领域类标准建设 17 少数民族语 138 汉语 汉语 89% 少数民族语 11% (注:此处少数民族标准只包括国家标准) 汉语和少数民族语规范标准 90919 CJK-D 74419 CJK-C 2006 70195 CJK-B 2001 27484 CJK-A 2000 20902 CJK 1993 字符集总字量 扩充子集名称 时间 1993 年 2000年 2001年 2006年 字量 国际标准中日韩统一编码汉字字量 ◆ 由规范向整理发展 ◆ 由今向古发展 ◆ 重视民文的编码 语言文字规范标准 ※汉语拼音方案 ※宋/楷/仿宋/黑体印刷字形标准 ※现代汉语常用字表/现代汉语通用字表 ※GB2312-80 / GB13000.1 / ISO16646 汉字字符集 ※现代汉语语料库建设 ※国家语言资源监测与研究 语言文字信息处理简介 我国从1979年才起步开始进行机读语料库的建设,目前无论在广度上(即跨语言的多语对齐语料库建设)还是深度上(各级深加工的语料库建设),均取得可喜的成果。 汉语语料库从最初的1个专用文学作品语料库发展为多个大规模的通用平衡语料库;语料规模从百万词级发展为上亿词级;语料的语种从单纯的汉语或英语发展为双语甚至多语;语料的加工深度从最初的生语料发展为包括分词与词性标注、句法结构标注及部分语义标注的熟语料。 与欧美等发

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档