学习贯彻党的二十届三中全会精神

计算语言学导论

《计算语言学导论》是2005年10月中国社会科学出版社出版的图书,作者是翁富良、王野。

目录

第一章计算语言学简介(1).

第一节计算语言学是一门边缘科学(1)

第二节计算语言学研究的基本问题(3)

第三节计算语言学研究的基本方法(4)

一、理性主义经验主义:计算语言学研究方法的哲学分野(4)

二、计算语言学研究方法(5)

第四节计算语言学的应用(8)

第二章预备知识(10)

第一节离散数学基础(10)

一、集合及相关的概念(10)

二、图及相关的概念(11)

三、字符串及相关的概念(12)

四、栈及相关的概念(15)

五、序及相关的概念(15)

第二节概率统计理论基础(17)

第三节信息论基础(26)

第三章形式语言及自动机(34)

第一节形式语言和自动机的直观意义(34)

第二节形式语言和自动机的定义(35)

一、形式语言的定义(35)

.二、自动机的定义(39)

第四章语法理论和表示形式(46)

第一节gb理论(46)

第二节词汇功能语法(49)

第三节广义词组结构语法(51)

第四节树连接语法(53)

第五节链语法(55)

第五章语言的识别与分析(57)

第一节有限状态语法的识别和分析算法(58)

第二节上下文无关语法的识别和分析算法(58)

一、移进—归约法(58)

二、由底向上的图表法(64)

三、欧雷算法(69)

四、glr算法(70)

五、链语法的识别算法(82)

第三节其他类型的分析器(85)

一、基于原则的分析方法(85)

二、基于归一的分析方法(87)

第六章计算语义方面的一些工作(91)

第一节语义理论简介(91)

一、词的指称作为意义(91)

二、心理图象,大脑图象或思想作为意义(92)

三、说话者的意图作为意义(92)..

四、过程语义(93)

五、词汇分解学派(93)

六、条件真理模型(94)

七、情景语义学(94)

八、语义网络(95)

九、模态逻辑(95)

第二节计算语义学的一些代表工作(96)

一、概念依赖理论(96)

二、选择限制学说(99)

三、指代化解(101)

四、计算语义学的一些其他方面(103)

第七章容错分析(106)

第一节基于关键词或中心词的方法(106)

第二节省略不识词的方法(107)

第三节元规则方法(108)

第四节同化法(109)

第八章概率语法(116)

第一节ngram(116)

一、减值法(discounting)(118)

二、删除插值法(deletedinterpolation)(121)

三、基于词分类的ngram(122)

第二节隐马尔柯夫模型(122)

一、马尔柯夫模型(122)

二、隐马尔柯夫模型(124)

三、向前算法(126)

四、韦特比算法(130)

五、向前向后算法(132)

第三节概率上下文无关文法(136)

一、向内算法(37)

二、韦特比算法(139)

三、向内向外算法(140)

第九章语言学习(145)

第一节词分类(145)

第二节词法学习(148)

一、语法框架(148)

二、词汇选择(lexicalselection)(152)

第三节语法学习(155)

一、有限状态自动机的机器学习(155)

二、语接推导的理论问题(159)

三、贝叶斯推理在语怯推导中的应用(161)

第十章当前计算语言学的研究(166)

第一节统计学机器翻译(166)

一、ibm统计学机器翻译(167)

二、参数训练(168)

三、源语言搜索(169)

第二节词类标识(part-of-speechtagging)(170)

一、隐马尔柯夫模型词类标识(171)

二、基于规则的词类标识(172)

第三节歧义化解(disambiguation)(174)

一、基于结构的语法歧义化解(l75)

二、统计学语法歧义化解(177)

三、词汇歧义化解(lexiicaldisambiguation)(180)

附录a汉英术语对照(185)

附录b有关计算语言学的重要期刊和会议(194)

附录c参考文献(196)

前言

语言是反映人的思维的最重要的一面镜子,又是人与人之间交流的最重要的媒介。对语言的研究,是一个经久不衰的古老课题。几千年来,中外学者从语言与思维、语言与现实的关系等不同角度。在词源、注释、分类、语法等各个方面开展了广泛的研究。近一两百年来,西方学者在逻辑学、数学和分析哲学方面的成果,大大推动了语言形式他的研究。而随着计算机科学的发展,建立语言的形式化计算模型成为语言学的重要课题。计算语言学作为以形式化的计算模型来分析、理解和处理语言的科学也就应运而生。而信息革命的展开,更使计算语言学的研究达到了一个空前的程度。.

如果说纸的发明对人类文明的继承光大集团有着巨大作用的话。那么语音和语言技术的发展,将对人类各语种之间的交流,各文化体系间的促进与提高至关重要。语言和语音技术为语言文本和会话的检查、理解、合成、翻译、重组,提供了有效的自动化工具,使得靠人工进行的信息交流和信息处理能够逐步地为具有智能的语言技术所取代。在信息革命使世界日新月异的今天。计算语言学的发展成为我们是否能够跟上世界潮流的一个重要因素。这一点应该激起广大研究人员的高度紧迫感,同时也应该获得科研基金组织和工商界有识之士的重视,对计算语言学的研究给多长期的大力支持。..

本书的作者希望此书的出版能够对国内计算语言学的发展起到一定的促进作用。由于篇幅和作者水平的限制,我们不可能面面俱到地覆盖整个领域。我们在选材时一方面注重本领域的基础性的经典工作,希望读者阅读理解后能够举一反三,用于解决实际问题;另一方面我们侧重于介绍一些当前国际计算语言学界的研究重心,希望有关的研究人员能够站在该领域的前沿。

本书的对象是大学计算机专业、数理统计学专业及语言学专业的高年级学生或研究生,与计算语言学有关的科研人员,以及其他有兴趣的读者。由于计算语言学的综合性特点,如有条件,作者建议组织多学科的兴趣小组,相互交流,共同提高。

本书第2章第1节、第3章、第4章、第5章、第6章、第7章由翁富良撰写,第1章、第2章第2、3节、第8章、第9章、第10章由王野翊撰写。...

序言

中国社会科学出版社根据读者的要求,决定再版《丛书》。再版首先是包括增加《丛书》的书目,从第一版的八种增加到现在的十二种;其次是修订增补第一版各书的内容,根据不同学科的进展,增加新的章节;最后是借再版的机会改正第一版中的印刷错误。.

《丛书》再版,首先得感谢读者,没有读者的热情支持和鼓励,再版《丛书》是不可能的。其次是感谢编委,也就是《丛书》的作者们。没有《丛书》作者们的辛勤劳动和丰硕的研究成果赢得读者的欢迎,再版《丛书》更是不可能的。另外,特邀编委的热情支持和帮助、责任编辑以及社科出版社的鼎力相助也是《丛书》得以成功再版的原因之一。在此一并致以衷心的谢意。..

较之第一版,再版增加了《罗曼语句法经典》、《音系与句法的交叉研究》、《音段音系学》和《关联交际与认知》四种书。如在第一版前言中所指出,《丛书》前八种书主要覆盖美国语言学系研究生(博士、硕士)的八门必修课。再版时增加的四种书属于选修课或专题研究的范围。编委的工作单位有的有了变化,再版时作了相应的改变。特邀编委有的已经退休,再版时还按以前的工作单位列出。

《丛书》再版,错误、疏漏仍在所难免,敬请专家学者批评指正。

最后,希望《丛书》的再版能在国内外语言学理论的研究、教学,以及介绍和交流等方面再次起到积极的作用。...

《当代语言学理论丛书》主编

黄正德许德宝

参考资料

河南工人日报数字报