3天然语言app
3.1动物的语言blog
3.2天然语言继承
3.2.1英文语法考察get
回到人类的语言。一个不懂英文的人对英文书籍进行粗浅的观察会发现:一页一页纸面上从上至下是一行接一行的字符,由缩进(一行的开始处空出二个字符的位置)与结束(一行出现句号后,后面的位置再也不书写字符)分红或大或小的多个块,咱们可称为语块(段落)。每一语块的内部由逗号、分号、句号等标点符号分隔成多个段,这里咱们称为语段(语句),每一语段内由空格分隔成一串串的字符,咱们称为语串(单词)。每一语串由相对高频a、b、c、d、e……x、y、z这26个字符(字母)里一个、多个从左到右排列成,偶尔也出现一些其它特殊字符(如拉丁字母或罗马字母),能够说英文就是26个字符(字母)、标点符号、特殊符号、空格之前后排列造成的线性字符流。若是观察者足够耐心,他会发现:有些词汇很接近,只是开始或结尾的几个字符不一样,如play、played、playing;一些词汇明显不一样,但开始结束处几个字符是相同的,如unhappy、unfortunately、unpleasure,同一词汇会在不一样的位置出现,好比I have a book与另外一句子You have a car中的have,而且全部的词汇都会重复出现;二个语段可能只是某个位置上的词汇不一样,其它位置的词汇都相同,好比I have a book与You have a book这二句。io
这里所进行的考察、比较与描写,也是传统上语言学家的主要工做,实际的工做要复杂、琐碎、困可贵多。早至公元前四世纪古印度的人就编写了Pànini语法,对梵语做了在今天看来也是较高水平的描写,包括了派生词、词的屈折变化、复合的规则、句法等的总结。一样的方法被后世的学者继承来研究其它的语种,主要是印欧语系的各语种。在今天咱们没有必要本身再去大费周章地进行这类的工做,已经有不少现成的总结。基于目前语言学界一般观点可对英文进行以下的简单说明。基础
英文底层是基础的视觉构件:26个字母,在此层次这些字母间并没有关联,每个自己是没有内部结构的笔划。在天然语言里除了偶然的状况外,这些字母自己并不能单独应用,即没有实际意义。书籍
第二个层级,26个字母中的二个或多个按从左至右排列方式组成词素,可划分为能单独使用的自由词素,也称词根或基础词,如man、play;不能单独使用的黏附词素,称为词缀,如ing、ly、ish、tion。语法
接下来的层级,词缀经过与词根的组合造成可单独使用的合成词,合成词在数、性、格、时、式或功能意义等某一方面或几方面不一样于其词根。一个语言单位与词缀的组合可进一步细分为派生与屈折变化。派生产生派生词,派生词从语法意义上存在着与其至关的基础词,如unhappy一词,它与happy实指的意义相反,语法意义(或语法功用)是一致的:happy能出现的结构位置,unhappy一样能出现,反之亦然。屈折变化产生的合成词,它的语法意义没有基础词与其至关,如working一词,它与work是不同的,working出如今正在进行时句子的谓语位置,work或其它基础词并不能出如今一样时态句子的谓语位置。用于屈折变化的黏附词素也都是用于派生变化的黏附词素,除这部分共用的黏附词素外,其它黏附词素都只用于派生变化。词上能够应用的屈折形式能够将词划分为不一样的词类:名词、动词、形容词、副词、介词等,如后面能够+s表示复数的词就是名词。固然这只是语言学里用来划分词类的一种方法,还存在其它的方法来进行词类划分。一个词根上所可能组合成的派生词、合成词构成了此词根上形式维度的词簇,因为规则不统一,一个词根上的簇或须加上不是经过附加词缀而是经过内部变化获得的词,如sing词的簇应包括sung、sang。像英文这样的语言,附加词缀,以及刚才所说sing、sung、sang的内部变化等,所产生的形态变化的方式,及对应的语法意义构成词法研究的主要内容。方法
在第四个层级,二个或更多单词可组合为复合词与词组。复合词里参与组合的成分词被认为是固定紧密地组合在一块儿,在其成分词中间不能插入其它的语言单位。与复合词相比词组里的成分词结合的紧密程度要弱些,在其成分词中间能够插入其它的语言单位。书写上词组的各成分间由空格隔开,复合词的成分词能够空格隔开,也能够没有空格或用连字符链接,举例来讲blackbird(乌鸦)是一复合词,black bird(黑色的鸟)是一词组。由于结合紧密度上的差别,复合词语法上看做为是与其它基础词、合成词同级的语言单位,词组则被认为是处于词与下一层次句子之间。复合词与词组都由惯用的结构来组合,每类结构由二个或更多的构成成分组成,每一成分只能由特定形态语类(词类,或与词类相同语法意义的词组、复合词)占据。结构的一种划分是:同心结构与离心结构。同心结构中有一个或多个中心词,语法上中心词能够替代整个结构体。只有一个中心词是偏正结构,有多个中心词则为并列结构。离心结构则没有这样的中心词,离心结构最多见的是“施事-动做”的结构,这样的结构有二个构成成分,顾名思义可称为“施事者”与“施事动做”,分别可由主格的名词与有定动词占据,如复合词sunshine,英文里的其它离心结构还包括关系-轴心结构、从属结构等。结构的另外一种划分是从词性来进行的,划分的结构有名词性词组(cat nap)、动词性词组(get up)、形容词性词组(good luck)等。复合词与词组所应用的结构大部分是通用的,也有部分只适用于复合词,或只适用于词组。前面这四个层次划分的讲述是为呈现语言从简到繁的组合性,实际上界线并不是如此分明,好比一个词组可能附加词缀而与一个合成词语法上等效。im
咱们所要讲的第五个层级是由多个词(基础词、合成词、复合词)造成的序列-句子。句子里的词语序列一样由结构来进行配列,句子的结构不一样于复合词、词组的结构。句子由不一样的结构分为不一样的句型,句型最多见的是划分为:主谓、主谓宾、主系表等,从这些句型可划分以下的句子结构成分:主语、谓语、宾语、定语、状语几种,简单地说这些构成成分对应由名词、动词、名词、形容词、副词来占据。
从第一层次到第五个层次,包含于组合的成分愈来愈多,对下级单位的组合强度愈来愈弱,或者说组合愈来愈多具备动态性。从使用意义上语句与前面四个层次的语言单位并不不同,基础词、合成词、复合词、词组形象地说是语言表达的素材,除词组已有较高的动态性外,其它的都是预制件的性质。语句则是语言表达的实际施行,语句是按须要,按句法规则在具体的表达中组合出来的。咱们也能看到一个单词也可做为一个句子——独词句,或一个如施事-动做的词组也可做为一个句子,这时候它们与其独立存在时的状态是不同的,它们存在于特定的语境中,并具备了所谓的表述性,这种表述性主要是从口语的语调来标识,在文字上一个句子的首字母必须大写,你也能够把这看做是表述性的标识。一个施事-动做结构的词组做为句子时,施事与动做成份分别转换为句子的主语与谓语,反过来句子主语与谓语并不只指施事-动做结构,还包括了其它习惯用语的对应成分。施事与动做转换为句子的主语与谓语时,原施事成分与动做成分在数、性、格、时态、语态上的形态变化要与整个句子的要求一致。