汉字(拼音:hàn zì),又称中文、中国字,别称方块字,是汉语的记录符号,属于表意文字的词素音节文字。世界上最古老的文字之一,已有六千多年的历史。汉字是迄今为止持续使用时间最长的文字,也是上古时期各大文字体系中唯一传承者,中国历代皆以汉字为主要的官方文字。在古代,汉字还充当东亚地区唯一的国际交流文字,20世纪前仍是日本、朝鲜半岛、越南、琉球等的官方书面规范文字,东亚诸国都在一定程度上自行创制汉字。需要注意的是,日本、朝鲜半岛、越南等国在历史上都深受汉文化的影响,甚至其他语言都存在借用汉语言文字的现象。在非汉语体系中,日本制定了《常用汉字表》,韩国也制定了《教育用基础汉字》,而历史上曾使用过汉字的越南、朝鲜、蒙古国等,现今已废弃汉字。
汉字的数量并没有准确数字,大约将近十万个,日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。秦代的《仓颉》、《博学》、《爰历》三篇共有3300字;汉代扬雄作《训纂篇》有5340字,到许慎作《说文解字》就有9353字了;据唐代封演《闻见记·文字篇》所记,晋吕忱作《字林》有12824字,后魏杨承庆作《字统》有13734字,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代司马光修《类篇》多至31319字,宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书;1915年欧阳博存等编著的《中华大字典》有48000多字;1959年日本诸桥辙次主编的《大汉和辞典》有49964字;1971年张其昀主编的《中文大辞典》有49888字;1990年徐仲舒主编的《汉语大字典》有54678字;1994年冷玉龙等编著的《中华字海》有85000字。台湾地区教育主管机关编撰的《异体字字典》第五版,内容含正字与异体字,共106230字,是收录较多汉字的字典。蓝德康和松冈荣志主编的《汉字海》是至2020年世界上收录汉字最多的工具书,正文收列字头单字102434个,附录收列字头单字11112个。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而书面语里已经废置不用的字。据统计,十三经(《易经》、《尚书》、《公羊传》、《论语》、《孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们日常使用的汉字不过六千多而已。
在汉字计算机编码标准中,最大的汉字编码是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日韩统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
起源:
从仓颉造字的古老传说到公元前1000多年前甲骨文的出现,关于汉字起源的说法,其中比较有影响力的说法有:仓颉造字说、结绳说、刻契说、图画说等。
仓颉造字说:相传仓颉是黄帝时期的史官,汉字的创造者。黄帝是古代中原部落联盟的领袖,由于社会进入较大规模的部落联盟阶段,联盟之间外交事务日益频繁,故迫切需要建立一套各盟联共享的交际符号,于是搜集及整理共享文字的工作便交在史官仓颉的手上了。“仓颉造字说”在战国时即已流行。《吕氏春秋·君守》说:“仓颉作书,后稷作稼。”到了秦汉时代,这种传说更加盛行。汉许慎《说文解字序》:“黄帝之史仓颉,见鸟兽蹄迒之迹,知分理之可相别异也,初造书契。”和“仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字。文者,物象之本;字者,言孳乳而寖多也。”现代学者认为,成系统的文字工具不可能完全由一个人创造出来,仓颉如果确有其人,应该是文字整理者或颁布者。
结绳说:在文字产生之前,古人们靠结绳记事、认事,此举起到了帮助人们记忆的作用。《周易·系辞下》:“上古结绳而治,后世圣人易之以书契,百官以治,万民以察。”汉代郑玄注:“结绳为约,事大,大结其绳;事小,小结其绳。”《庄子·胠箧》篇云:“昔者容成氏、大庭氏、伯皇氏、中央氏、栗陆氏、骊畜氏、轩辕氏、赫胥氏、尊卢氏、祝融氏、伏羲氏、神农氏,当是时也,民结绳而用之。”又如《周易正义》引《虞郑九家义》:“古者无文字,其有约誓之事,事大大结其绳,事小小结其绳。结之多少,随物众寡;各执以相考,亦足以相治也。”东汉以后,不少人把汉字起源附会于结绳。
刻契说:刻契是古人在结绳记事后又一种帮助记忆的实物记事法,多作契约用,比结绳记事进步多了。所谓“刻契”就是在木条上或竹条上刻上刻痕。《释名·释书契》:“契,刻也,刻识其数也。”《周易·系辞》郑玄注:“书之于木,刻其侧为契,各持其一,后以相符合。”郑玄又在《周礼·质人》注里说:“书契,取予市物之券也。其券之象书两札,刻其侧。”《列子·说符篇》:“宋人有游于道,得人遗契者,归而藏之,密数其齿。”所说的“齿”即是质契上所刻的齿痕。这种刻契具有记事记数的作用,可以作为契约的凭证,也可以用来传递信息。刻契的一些符号与某些汉字形体相似。如“一、二、三、亖”与汉字数字“一、二、三、四”的古文字别无二致。宋末元初戴侗提出“书始于契,契以记数”而“各如其数”,认为“刻识其数”的契刻是原始文字的一个源头
图画说:关于汉字的起源,历史上曾盛行“河图洛书说”。《周易·系辞上》:“河出图,洛出书,圣人则之。”《竹书纪年》指出:“黄帝轩辕五十年秋七月庚申,凤鸟至,帝祭于洛水”沈约注:“龙图出河,龟书出洛,赤文篆字,以授轩辕。”《河图·玉版》:“仓颉为帝,南巡狩,发阳虚之山,临于元扈洛之水,灵龟负书,丹甲青文,以授之。”部分近现代学者认为,汉字真正起源于原始图画。一些出土文物上刻划的图形,很可能与文字有渊源关系。汉字主要起源于记事的象形性图画,象形字是汉字体系得以形成和发展的基础。
中国考古界先后发布了一系列较殷墟甲骨文更早、与文字起源有关的出土资料。贾湖刻符经碳14物理测定,距今约7762年(±128年)历史;七千年前的双墩刻符、六千年前的半坡陶符、五千多年前青墩遗址刻符、连字成句的庄桥坟遗址文字、大汶口陶尊符号、尧舜时代的陶寺遗址朱文。早期的刻划符号与骨刻文就是丰富的文字系统,后期的属于初步成熟阶段。这些考古发现可能是汉字起源的重要线索,也可能是各种文字发展的不同源流。
大约在距今六千年的半坡遗址等仰韶文化遗址的陶器外壁,已经出现刻划符号,共达五十多种。它们整齐规划,并有一定规律性,具备简单文字的特征,可能是汉字的萌芽。20世纪80年代初,在河南登封夏文化遗址发掘出的陶器上,发现了更完备的文字。当时被学者们确认的迄今为止我国有确切时代的最早的文字。
演变:
汉字是表意文字,一个汉字通常表示汉语里的一个词或一个语素,这就形成了音、形、义统一的特点。汉字是由笔画构成的方块状字,所以又叫方块字。如“车”“上”“明”等,“车”“上”“明”用字的形体来直接表达语言里的词义;“问”既能表意又能表音,“门”表音,“口”表意。
有关汉字造字法有六种,又称“六书”---象形、指事、形声、会意、假借和转注。“六书”最早出现在《周礼》,只是没有说明具体内容。东汉的许慎在《说文解字》一书中对“六书”的进行了完善,近现代的学者在《说文解字》基础上进行了很多改进,有三书说、四书说等,但“六书”依然是被广泛认可的造字法。
象形:描画事物的形象的造字法,如“日、月、山、水、人、木、火、口、目、田”等就是描绘其图案来造字,后来逐渐演化变成如今的造型。象形造字法是人类最本能的造字方法。
指事:在象形字的基础上加象征符号来造字,比如“刃(刀锋的那边加一点)、本(树根加一点)、甘(舌头加一点)、亦(由“大”张开手臂的人,胳肢窝下加两点,指胳肢窝)”。用纯象征的符号造字也属于指事造字法,比如“一、二、三、五、七、十、上、下”,用纯象征符号造字就属于记号字。
形声:由表示意义的形旁和表示读音的声旁两部分组成的造字法。形旁是汉字对事物进行归类的表义部件,声旁表示该字的读音,比如:
左形右声:证、抖、城、构、伟;右形左声:战、励、刚、彰、瓴;上形下声:芳、岗、晨、笼、雾;
下形上声:想、熬、袋、劈、汞;外形内声:圆、厘、匪、闺、匈。
例如“鸠”字的形旁“鸟”;声旁“九”则只取其音,不取其义。
会意:是用两个或两个以上符号组成新字的造字法(不同于形旁和声旁组成的形声字),比如:
“日”和“月”组成“明”字;
“人”和“言”组成“信”字,表替人带话而不加改变为值得信赖;
“人”和“木”组成“休”,表示人在树下休息……
有些会意字是两个或几个同样的字重叠组成的。比如:
两个“人”组成“从”,三个“人”组成“众”;
两个“木”组成“林”,三个“木”组成“森”;
两个“口”组成“吕”,三个“口”组成“品”等。
假借:借用读音不同的字和形旁来组字的造字法,假借字和形声字关系密切,只是声旁的表音功能丧失了。比如:
兑dui---shuo说tuo脱yue悦阅
告gào---gù梏牿hú鹄jiào窖kù酷
且qie---cu粗殂ju跙沮狙疽龃雎qu蛆zu祖 阻组诅俎zhu租助zui咀
者zhe---du都赌堵睹chu褚储shu暑署zhu猪诸煮箸渚著tu屠xv绪
占zhan---dian玷nian拈鲇黏zhen砧tie贴帖
转注:字的意义发生变化而转作它用,其本义用另一个字来注解和代替。转注不是一种造字法,是与造字密切相关的用字法,转注字都是两字一对,比如:
其--箕:“其”本义是“簸箕”的象形,后来转做虚词,“其”的原始义用“箕”字代替;
斤--斧:“斤”原始义为“斧”,后来转做量词“斤”,原始义用“斧”字代替;
莫--暮:“莫”原始义是“暮-太阳落在草下”之会意,后来转做虚词,原始义用“暮”字代替;
要--腰:“要”原始义是“人体腰部”之象形,后来转做动词,原始义用“腰”字代替;
益--溢:“益”原始义是“水从皿中溢出”的会意,后转做益处之义,本义用“溢”字代替;
自--鼻:“自”原始义是“鼻子”之象形,后来转做代词或介词,原始义用“鼻”字代替。
总结以上六书——“象形”和“指事”是纯正的“造字法”,一般用于独体字;“形声”、“会意”和“假借”是“组字法”,一般用于合体字;转注是“用字法”。总而言之,以上原理是古代文字学学者们群策群力归纳出来的文字学理论,其所含的汉字构成法则,并非一人独创,是人们在使用过程中长期演化而成,是一代又一代集体智慧的结晶。
现存最早的原始文字是记事性图画和刻符,可识的成熟汉字系统是商代的甲骨文。于是汉字由最原始的石刻字符在几千年的演变过程中形成了“汉字七体”,即:甲骨文、金文、篆书、隶书、草书、楷书、行书。
甲骨文主要指殷墟甲骨文,是中国商代后期(前14~前11世纪)王室用于占卜记事而刻(或写)在龟甲和兽骨上的文字。发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力。中国商代和西周早期(约公元前16~前10世纪)以龟甲、兽骨为载体的文献。
金文是指铸刻青铜器上的文字,也叫钟鼎文,始于殷商时期。商周是青铜器的时代,青铜器的礼器以鼎为代表,乐器以钟为代表,“钟鼎”是青铜器的代名词。所以,钟鼎文或金文就是指铸在或刻在青铜器上的铭文。所谓青铜,就是铜和锡的合金。中国在夏代就已进入青铜时代,铜的冶炼和铜器的制造十分发达。因为周以前把铜也叫金,所以铜器上的铭文就叫作“金文”或“吉金文字”;又因为这类铜器以钟鼎上的字数最多,所以过去又叫作“钟鼎文”。金文应用的年代,上自商代的早期,下至秦灭六国,约1200多年。金文的字数,据容庚《金文编》记载,共计3722个,其中可以识别的字有2420个。铜器上的铭文,字数多少不等。所记内容也很不相同。其主要内容大多是颂扬祖先及王侯们的功绩,同时也记录重大历史事件。如著名的毛公鼎有497个字,记事涉及面很宽,反映了当时的社会生活 。
篆书分为大篆与小篆
。
大篆为汉字书体的一种。相传为周宣王时史籀所作,故亦名籀文或籀书。 秦时称为大篆,与小篆相区别。大篆起于西周晚年,春秋战国时期行于秦国。字体与秦篆相近,但字形的构形多重叠。代表为今存的石鼓文,以周宣王时的太史籀所书而得名。他在原有文字的基础上进行了改革,因刻于石鼓上而得名,是流传最早的刻石文字,为石刻之祖。
小篆也叫“秦篆”。秦朝李斯受命统一文字,这种文字就是小篆。通行于秦代。形体偏长,匀圆齐整,由大篆衍变而成。东汉许慎《说文解字·叙》称:“秦始皇帝初兼天下……罢其不与秦文合者。”李斯作《仓颉篇》,中车府令赵高作《爰历篇》,太史令胡毋敬作《博学篇》,“皆取史籀大篆,或颇省改,所谓小篆者也。”今存《琅琊台刻石》、 《泰山刻石》残石,即小篆代表作。秦权上刻制的小篆,据说是李斯在秦始皇统一中国后,推行“书同文,车同轨”,统一度量衡的政策,由宰相李斯负责,在秦国原来使用的大篆籀文的基础上,进行简化,取消其他六国的异体字,创制的统一文字汉字书写形式。一直在中国流行到西汉末年,才逐渐被隶书所取代。但由于其字体优美,始终被书法家所赞美。又因为其笔画复杂,形式奇古,而且可以随意添加曲折,印章刻制上,尤其是需要防伪的官方印章,一直采用篆书,直到封建王朝覆灭,近代新防伪技术出现。康熙字典上对所有的字还注有小篆写法。
隶书基本是由篆书演化来的,主要将篆书圆转的笔划改为方折,书写速度更快,在木简上用漆写字很难画出圆转的笔划。"隶人"不是囚犯,而指"胥吏",即掌管文书的小官吏。隶书相传为秦末程邈在狱中所整理,去繁就简,字形变圆为方,笔划改曲为直。改"连笔"为"断笔",从线条向笔划,更便于书写。隶书强化了汉字的记号功能,削弱了象形功能,对汉字的改变很大,成为古今文字的分水岭。隶书为后来的派生出草书、楷书、行书奠定了基础。隶书分秦隶(古隶)和汉隶(今隶)。隶书的出现,隶书是汉字中常见的一种庄重的字体,书写效果略微宽扁,横画长而直画短,讲究“蚕头燕尾”、“一波三折”。
草书是为书写便捷而产生的一种字体。始于汉初,当时通行的是草隶,即草率的隶书,后逐渐发展,形成一种具有艺术价值的章草。至汉末,相传张芝脱去了章草中保留的隶书笔画形迹,上下字之间的笔势,往往牵连相通,偏旁相互假借,成为今草,即一般所称草书,字的体势一笔而成。到唐代的张旭、怀素,宋代的米芾将今草写得更加放纵,笔势连绵回绕,字形变化繁多,成为狂草。草书为书法家所常用。章草笔划省变有章法可循。代表作如三国时期吴国皇象《急就章》的松江本。今草不拘章法,笔势流畅。代表作如晋代王羲之《初月》、《得示》等帖。狂草出现于唐代,以张旭、怀素为代表,笔势狂放不羁,成为完全脱离实用的艺术创作,从此草书只是书法家临摹的书法作品。代表作如张旭《肚痛帖》、怀素《自叙帖》。
楷书又称正书,或真书,始于东汉。其特点是:形体方正,笔画平直,可作楷模,故名。
初期楷书仍残留极少的隶笔,结体略宽,横画长而直画短。在传世的魏晋帖中,如锺繇的《宣示表》、《荐季直表》、王羲之的《乐毅论》《黄庭经》等,可为代表作。观其特点,正如翁方纲所说:“变隶书之波画,加以点啄挑,仍存古隶之横直”。楷书到唐代发展到高峰,楷书的名家很多,如“欧体”(唐·欧阳询)、“虞体”(唐·虞世南)、“颜体”(唐·颜真卿)、“柳体”(唐·柳公权)、“赵体”(宋元·赵孟頫)等。楷书到了宋代,出现了“宋体”,现代印刷的宋体、黑体、仿宋等字体都属于“楷书”。
行书大约是在东汉末年产生的,是介于楷书、草书之间的一种字体,可以说是楷书的草化或草书的楷化。它是为了弥补楷书的书写速度太慢和草书的难于辨认而产生的。笔势不像草书那样潦草,也不要求楷书那样端正。楷法多于草法的叫“行楷”。草法多于楷法的叫“行草”。代表人物:“二王”:王羲之,王献之。
特点与影响
世界各国使用的文字分为两大类,即非拼音文字(汉字和水书)及拼音文字(其他文字)。当今世界上使用的文字中,汉字和水书属于非拼音文字。
汉字是至今仍在使用的历史最悠久的文字。能看到而又能认读的最早的汉字是3000多年前的甲骨文。这已是相当成熟、相当系统的汉字了。世界上没有一种文字像汉字那样历尽沧桑,青春永驻。古埃及5000年前的圣书字是人类最早的文字之一。但它后来消亡了,有记载的古埃及文化也被深深地埋藏起来了。苏美尔人的楔形文字也有5000年的历史。但在公元330年后,它也消亡了。历史上衰亡的著名文字还有玛雅文、婆罗米文等等。而汉字不但久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。
特点1优美
它已成为一种艺术——书法艺术。汉字的书法艺术是任何其它文字所无法相比的。 下列的古代书法作品已经成为无价之宝。著名的有兰亭序、神策军纪圣功德碑、玄秘塔碑、祭侄稿等无数作品。
特点2辨识度高
人类的眼睛视野总是一个面,而不是一条线,所以线性排列不易辨认;排成方块一目了然。拼音文字=线形文字;汉字=方块文字。汉字比拼音文字有更高的阅读效率。
特点3易懂,具有关联性
例如,“被”是一个形声字兼会意字。如果从形声字的角度来看,“被”字左边的“衣”字旁表示意义,说明被子是属于衣物一类,右边的“皮”字在造字的时代和“被”的读音相似,表示这个字的读音,但是随着时间的推移,“皮”和“被”的读音变得不一样了,逐渐失去了它表读音的功能。如果从会意字的角度来看,用皮做的衣物就是“被”。被的最初意义指的是一种小被子,到了后代,在被的本义基础上又引申出“蒙受”等意义。
特点4形象,直观达意
汉字是象形文字,其显著的特点是字形和字义的联系非常密切,具有明显的直观性和表意性。汉字的表意性使汉字成为世界上单位字符信息量最大的文字,因此容易辨识,利于联想,这也为加快阅读速度带来极大的便利。汉字有着区别于世界其他各种语言的根本特点,这就是汉语语法自身的特殊性即意合。无论是词组合成句子,还是单句组合成复句,首先考虑的因素往往是语意的配合,而不是语法形式的使用,只要几个负载着重要信息的关键词语在意义上大致搭配得拢,就能言简意赅地达到交际目的,这几个词就可以组合在一起,这就是所谓的“意合”。
特点5信息量大
研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数人不累?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。这就是汉字字符集信息熵高的优势。
汉字的以上五个方面的特点,无疑会使其在阅读心理方面较拼音文字具有相当大的优势,使汉字的书面语在感知、理解的各个方面都有较高的速度和效率,能够实现阅读速度、理解速度、记忆速度的协调发展,快速阅读,也是中国为何能崛起的天然因素,汉语不失,华夏永存。
最后考考大家下面都是什么字?