首次把从属关系语法和配价语法应用于机器翻译中

 
      冯志伟在法国留学期间,了解到法国语言学家特斯尼耶尔(L. Tesniere)的从属关系语法和语法“价”的概念,他在1979年就开始用这种语法来研究汉外机器翻译问题,首次把“价”(valence)的概念引入我国的机器翻译研究中,他把动词和形容词的行动元分为主体者、对象者、受益者三个,把状态元分为时刻、时段、时间起点、时间终点、空间点、空间段、空间起点、空间终点、初态、末态、原因、结果、目的、工具、范围、条件、作用、内容、论题、比较、伴随、程度、判断、陈述、附加、修饰等27个, 以此来建立多语言的自动句法分析系统,对于一些表示观念、感情的名词,也分别给出了它们的价。他还把从属关系语法和短语结构语法结合起来,在表示结构关系的多叉多标记树形图中,明确地指出中心语的位置,并用核心(GOV)、枢轴(PIVOT)等结点来表示中心词。这是我国学者最早利用从属关系语法和“价”的思想来进行自然语言计算机处理的尝试。
      冯志伟根据机器翻译的实践,提出了表示从属关系语法的从属树(Dependence Tree)应该满足如下5个条件:1. 单纯结点条件:从属树中,只有终极结点,没有非终极结点,从属树中的所有结点所代表的都是句子中实际出现的具体的单词;2. 单一父结点条件:在从属树中,除了根结点没有父结点之外,所有的结点都只有一个父结点;3. 独根结点条件:一个从属树只能有一个根结点,这个根结点,就是从属树中唯一没有父结点的结点,这个根结点支配着其他的所有的结点,4. 非交条件:从属树中的树枝不能彼此相交;5. 互斥条件:从属树中的结点之间,从上到下的支配关系和从左到右的前于关系之间是互相排斥的,如果两个结点之间存在着支配关系,它们之间就不能存在前于关系。冯志伟提出的这5个条件比1970年美国计算语言学家罗宾孙(J. Robinson)提出的从属关系语法的4条公理更加直观,更加便于在机器翻译中使用。
      冯志伟还研究了短语结构树(phrase tree,简称P-树)和从属树(dependency tree,简称D-树)之间的等价关系,在计算机上进行P-树到D-树的转换。他在90年代末期带领一个精干的研究小组,研制出英日机器翻译系统E-to-J,采用短语结构语法进行英语自动分析,产生P-树,然后把P-树转换为等价D-树,然后再根据从属关系语法,从D-树生成日语,减少了系统的空间复杂度和时间复杂度,使整个系统达到了实用的水平。这个系统已经在1998年11月正式由日本NEC公司在日本市场上推出。