是语言基于文字还是文字基于语言?
世界上现存的文字系统主要可分为五类
- Consonant alphabets/Abjads 辅音拼写系统
- Phonemic alphabets 音位拼写系统
- Syllabic alphabets/Abugidas 音节拼写,也称元音附标系统
- Syllabaries 音节文字系统
- Semanto-phonetic writing systems 意音文字,也称语素文字系统
但要注意的是,它们相互间的界限并不严格,很多文字兼具不同系统的特征。
Consonant alphabets/Abjads 辅音拼写
典型文字:阿拉伯字母、希伯来字母、塔纳字母、叙利亚字母
基本特征:
- 正式书写系统只表记语流中的辅音音位
- 辅音字母依照在语流中出现的顺序,呈线性排列
以最常被引用的阿拉伯语“书写”一词为例,这个单词由三个字母构成,所代表的辅音音位分别可以被转写为 k t b,其中没有表示元音的字母。
但阿拉伯语并非完全没有表记元音的字母。转写为 a, w, y 的三个字母被用在长元音和复元音的表记形式中。例如外来词“巧克力”,阿拉伯语用辅音字母 w 表记长元音 u。
下图第一行的阿拉伯文可以转写为 shuukuula,单从这个词来看,它的音节书写方式其实和我们熟悉的拉丁字母文字有类似处,前两个同样的元音都体现了出来。
Abjads 原本是密切贴合闪语特点而产生的书写系统,就文字属性本身而言并不太适合用来记录印欧语言、突厥语言等。乌尔都文、维吾尔文等以此为基础创制的文字,都对书写系统进行了较大的改造,添加了纯元音字母,虽然在不了解的人看来“像”阿拉伯文,沿袭着从右到左的连写特征,但实际上已经不属于 Abjads,而是 Phonemic alphabets 了。
Phonemic alphabets 音位拼写
典型文字:拉丁字母、希腊字母、西里尔字母、亚美尼亚字母、格鲁吉亚字母等
基本特征:
- 有独立的元音字母和辅音字母分别表记元音和辅音(有些语言中也存在既能表示元音又能表示辅音的字母)
- 字母依照所代表的音位在语流中出现的顺序,呈线性排列
- 元音字母和辅音字母在形态和位置上不带有各自的分类属性
- 元音字母可以独立表记音节,辅音字母通常要和元音字母拼合才能表记音节
仍以“巧克力”一词为例,西班牙语拼写为 chocolate(没错,和英语拼写完全一样)
它直接代表了四个音节 cho/co/la/te,也即四个辅音音位和四个元音音位的两两相拼。
这里我们注意到一个在拉丁字母中经常出现的情况:作为一种趋于定型的文字体系,使用拉丁字母的多数语言(除去越南语和部分东欧语言等),相比于改造新字母(例如西语的ñ),更多采用组合原有字母的形式来表示不同的音位。
而英语的 chocolate[ˈtʃɔːklət],四个元音字母中只有第一个 o 原封不动地发音,非重读的 a 弱化为ə,而第二个 o 和最后的 e 全部静音。最终成为了两个音节:重读的 tʃɔːk 和非重读的 lət 合在一起。
法语的 chocolat,t 后面没有 e,更是连 t 这个辅音也不发了(口型也不用做)
综上,音位拼写系统虽然基于音位,但很多语言实际书写中不一定每个字母都代表一个音位,也存在多个字母表示一个音位,一个字母表示多个音位,或者某个字母不表示任何音位的情况。
Syllabic alphabets/Abugidas 音节拼写,也称元音附标系统
典型文字:天城文、孟加拉文、藏文、缅甸文、泰米尔文、高棉文、泰文、老挝文等
此外,韩文、阿姆哈拉文也具有部分音节拼写的特征。韩文一般被认为是介于 Syllabic alphabets 和 Phonemic alphabets 之间的独立文字系统,而阿姆哈拉文一般被认为是介于 Syllabic alphabets 和 Syllabaries 之间的独立文字系统。
基本特征:
- 音节的书写呈线性排列,每个音节内音位的书写并非呈线性排列
- 在每个音节中,以表记该音节起始辅音或零辅音的辅音字母(类似汉语拼音体系的声母)为中心,在周围特定方位(上下左右半包围等)以添加符号、符号组合、辅音字母、辅音字母和符号的组合等形式,表记韵头、韵腹、韵尾以及声调(如有)等
- 辅音字母可以单独出现,代表该辅音与特定元音拼合成的音节
- 元音符号不能单独出现,表记纯元音或以元音开头的音节时,必须伴随零辅音字母
- 当辅音字母和添加部分共同构成音节时,在有些文字中,为保持音节字形结构的平衡和美观,字母或符号的形态会发生变化
上图所列只是最简单的音节形式,实际遇见的很多音节可能是这样的
对比 phonemic alphabets 和 syllabic alphabets 的差别
Phonemic alphabets 只需要根据语流中出现的顺序,将表示各个音位的组件线性排列就可以了,变更组件顺序即可变为不同的音节,不附带任何其它形态上的变化;而 Syllabic alphabets 对于每个组件允许放置的方位,在特定方位的形态、搭配方式都有极严格的要求
Syllabaries 音节文字
典型文字:日文平假名、日文片假名、凉山规范彝文、切诺基文等
基本特征:
- 每个音节有一种或多种独立不可拆分的表记形式
- 音节文字中不含有任何表记元音辅音音位的部分
- 书写时,依照所代表的音节在语流中出现的顺序,呈线性排列
以凉山规范彝文为例,左边 it, ot, at 这三个含有 t 的音节书写,并不含有任何共同的组件;右边 ke, ne, le 这三个含有 e 的音节书写,也不含有任何共同的组件
阿姆哈拉语虽然也常被称为“音节文字”,但对比下便可发现,它还是更接近前面所讲的 abugidas,而不属于 syllabaries,音位和书写之间的关系太“规范”了
不过,syllabaries 和 syllabic alphabets 之间,也会有交界处。例如日文假名虽然笼统来讲是一字一音节,没有拼合,不体现音位,但实际上拗音的写法却是拼合起来的,第一个假名表记开头的辅音和中间的介音,第二个缩小的假名表记主元音(此时它代表音位而不是音节了)。在表记外来词时,更有多种用片假名充当音位符号的情况。
Semanto-phonetic writing systems 意音文字,也称语素文字系统
典型文字:汉字、喃字、方块壮字、方块白文、西夏文、传统彝文等
基本特征:
- 每个单字表记独立语素,不直接表记发音(注意并不是“完全不表记发音”)
- 每个单字创制时通常有唯一对应的音节,但由于语音历史演变、文字借用等因素,现今单字和具体发音之间的映射关系已非常复杂
- 对应相同音节的可能有非常多的不同单字。在不结合语意的前提下,无法判断每个音节所对应的具体是哪个单字
某些表音文字中也会出现同个音节对应不同拼写形式(例如英语 hear 和 here)以及同音同形对应不同语素的情况(例如荷兰语 haar 可以对应英语 her 也可以对应英语 hair),但与语素文字相比,同音形态的数量级相差悬殊
意音文字和音节文字之间,有时界限也不是特别分明。有多达数万字符的中文汉字无疑是意音文字,只有百余字符的日文假名无疑是音节文字。然而有 2500 多字符的云南彝文和 819 字符的四川凉山彝文,在一般人看来就不那么容易归类了。实际上,在被认为是音节文字的体系中,同样存在一个音节字符只对应一个语素的情况;而在被认为是意音文字的体系中,一个单字对应很多不同语素的情况也不鲜见。在音译词中更有多个单字连起来表示一个语素的情况,例如上文提到的“巧克力”,此处这三个字已经基本去除了原有的语素含义,如同构成新语素的三个音节字符了。
相关阅读
是语言基于文字还是文字基于语言?
汉字 / 汉语对周边语言产生过哪些层面的影响
各种语言 / 方言如何理解和表达“吃饭”
我们是如何感知某种文字书写体系难易的?
如何判断某段拼音文字书写的是何种语言?
学习汉字文化圈内的语言是一种什么体验?
来自多邻国 duolingo 的分享~