汉字虽然以表意为主,但并非没有表音成分,最常见的是人名、地名,其次就是外来词的音译,比如沙发。此外,还有部分原有的表音词,如(一命)“呜呼”、“哈哈”大笑等。但即使如此,还是有一定表意成分,特别是该国国内的人名、地名。而即使是国外的人名、地名,也存在某些表意的底线,比如“Bush”绝不能音译成“不死”。
由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在上古汉语和中古汉语的发音。 有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节,类似今日的韩、日语。详见上古汉语。
汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。
在朝鲜语中则大致为一字一音,没有训读。
除了日本以外,其他汉字使用国也有使用了一些多音节的字,如“浬”(海里)、“嗧”(加仑)、“瓩”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾仍在使用,一般人也明了其意思。
注音
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。 直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的汉字形式的注音符号(俗称ㄅㄆㄇㄈ)以及很多拉丁字母注音方法。注音符号仍是台湾教学的一部分,而目前中国大陆最为广泛使用的是汉语拼音。
由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但今日北京话前者读“páng”,后者为“lóng”。如何解释这样的差异,就是音韵学所探讨的课题。
汉字与词语
汉字是汉文组成的最小单位。
语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如 “I”。现经白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。












