我們每天都在說(shuō)漢語(yǔ),大量的詞匯在各種各樣的環(huán)境中頻繁使用,到底什么詞使用頻率高?無(wú)論是語(yǔ)言學(xué)家還是普通大眾往往全憑感覺(jué)。近日,商務(wù)印書(shū)館出版的《現(xiàn)代漢語(yǔ)常用詞表》(草案)面世,頭一回全面披露常用詞語(yǔ)家底:當(dāng)今社會(huì),經(jīng)常使用的詞共有56008個(gè)。
這56008個(gè)常用詞中,包括單音節(jié)詞3181個(gè),雙音節(jié)詞40351個(gè),三音節(jié)詞語(yǔ)6459個(gè),四音節(jié)詞語(yǔ)5855個(gè),五音節(jié)和五音節(jié)以上詞語(yǔ)162個(gè)。
常用詞表誕生歷時(shí)10年
早在1998年7月,《現(xiàn)代漢語(yǔ)常用詞表》研制項(xiàng)目啟動(dòng),這是一個(gè)龐雜而艱難的項(xiàng)目,由國(guó)家語(yǔ)言文字工作委員會(huì)組織實(shí)施。該詞表是作為國(guó)家已經(jīng)公布的《現(xiàn)代漢語(yǔ)常用字表》等的配套規(guī)范,是我國(guó)語(yǔ)言文字規(guī)范化、語(yǔ)文教育和研究方面的基本建設(shè)項(xiàng)目。
課題組負(fù)責(zé)人李行健說(shuō):“大家知道現(xiàn)代漢語(yǔ)有常用字表,共收入常用字3500個(gè);有通用字表,收入通用字7000個(gè)。但長(zhǎng)期以來(lái),一直沒(méi)有常用詞表,常用詞有多少?是哪些?一直是個(gè)謎!倍茝V常用詞,對(duì)于中小學(xué)語(yǔ)文教學(xué)、掃盲教育、漢語(yǔ)教育、中文信息處理和辭書(shū)編纂等都是急需的。
研制工作中大多是白發(fā)退休專(zhuān)家,他們不需要國(guó)家經(jīng)費(fèi),迎難而上。他們中有語(yǔ)言學(xué)家、有大學(xué)教授,今年74歲的李行健說(shuō):“完全是出于對(duì)語(yǔ)言的興趣和社會(huì)責(zé)任感,我們這些老頭兒才樂(lè)此不疲!笨墒钦l(shuí)也沒(méi)想到,這一路走來(lái),竟然走過(guò)了10年。增補(bǔ)、修訂,再增補(bǔ)、再修訂,最后才有了放在人們面前的《現(xiàn)代漢語(yǔ)常用詞表》。李行健介紹,常用詞檢測(cè)詞頻的語(yǔ)料庫(kù)有三種:一是國(guó)家語(yǔ)委研制的“現(xiàn)代漢語(yǔ)通用語(yǔ)料庫(kù)”核心語(yǔ)料庫(kù),這個(gè)通用語(yǔ)料庫(kù)收有4500萬(wàn)字語(yǔ)料,缺點(diǎn)是有的詞年代久遠(yuǎn),如今已不經(jīng)常使用。二是《人民日?qǐng)?bào)》2001年至2005年約1.35億字的分詞標(biāo)注語(yǔ)料;第三種是廈門(mén)大學(xué)研制的現(xiàn)當(dāng)代文學(xué)作品語(yǔ)料庫(kù),約7000萬(wàn)字語(yǔ)料,總共2.5億字。
目前我們看到,在《現(xiàn)代漢語(yǔ)常用詞表》中使用頻率越高的詞排序越靠前,使用頻率越低的詞排序越靠后,這種降序排列讓人一目了然。李行健說(shuō),研制過(guò)程中采取了課題組獨(dú)創(chuàng)的“詞頻頻級(jí)排序法”。由于詞語(yǔ)的來(lái)源比較廣泛、各自不同,各種語(yǔ)料都有自己的覆蓋面和構(gòu)成特點(diǎn),詞表中的詞語(yǔ)不能在每種語(yǔ)料中都得到全面顯現(xiàn)。比如,同一個(gè)詞,在三種語(yǔ)料庫(kù)中的詞頻就會(huì)不同,有的還差別很大。為了科學(xué)反映每個(gè)詞較真實(shí)的詞頻,采用了頻級(jí)的統(tǒng)計(jì)方法,即將每個(gè)詞語(yǔ)的三種語(yǔ)料的頻級(jí)之和除以三的辦法。這樣就能較好反映出一個(gè)詞現(xiàn)實(shí)生活中的綜合的常用度,在此基礎(chǔ)上,再由專(zhuān)家進(jìn)行人工審核篩選,“也就是說(shuō),這些常用詞的出籠是客觀和有科學(xué)依據(jù)的!
一個(gè)時(shí)代有一個(gè)時(shí)代的關(guān)鍵詞
從56008個(gè)常用詞中,我們很容易觸摸到我們所處這個(gè)時(shí)代的關(guān)鍵詞、熱點(diǎn)詞。
李行健舉例說(shuō),在熱點(diǎn)詞中,新中國(guó)成立前,“看相、抽簽、算命”,可能是相當(dāng)活躍的詞語(yǔ),現(xiàn)在已不是常用詞了。解放初期,“土改、統(tǒng)購(gòu)統(tǒng)銷(xiāo)、合作社、互助組”詞頻相當(dāng)高,如今在常用詞中已不見(jiàn)蹤影了。曾經(jīng)在“文革”中紅紅火火的詞,如“斗爭(zhēng)、階級(jí)、樣板戲、走資派、臭老九”等等很常用、很熱鬧的詞語(yǔ),現(xiàn)在已經(jīng)退出了常用詞的舞臺(tái),其生命力也隨之走向衰落了。
而如今,“法律、汽車(chē)、市場(chǎng)、資金、責(zé)任、成功、精神、文化、價(jià)值觀”等等則變成了出現(xiàn)頻率相當(dāng)高的常用詞。民間詞語(yǔ)收藏家黃集偉認(rèn)為,這些詞與老百姓的生活密切相關(guān),它所涉及的領(lǐng)域一定是社會(huì)的熱點(diǎn),也一定是我們社會(huì)生活變化最快的那部分。比如“價(jià)值觀”,黃集偉就認(rèn)為,這個(gè)詞是常用的中性詞。改革開(kāi)放后,我們現(xiàn)實(shí)生活中發(fā)生了很多價(jià)值觀的大討論,這個(gè)時(shí)代發(fā)生的許多爭(zhēng)論、爭(zhēng)吵,比如對(duì)與錯(cuò)、道德與情感,種種社會(huì)矛盾等,總的來(lái)說(shuō)都隱含著價(jià)值觀的不同。
詞匯是隨社會(huì)發(fā)展變化的,它是社會(huì)變化的一面鏡子。社會(huì)中出現(xiàn)新的事物,如“宇宙飛船、電視、手機(jī)、股票、證券”等等,人們就會(huì)創(chuàng)造出新詞來(lái)記錄反映它們。詞語(yǔ)使用的頻度決定于它同人們社會(huì)關(guān)系的程度,所以一個(gè)時(shí)代有不同的常用詞表。
新詞折射社會(huì)生活巨大變化
“真正的語(yǔ)言是活的,它潛伏或奔突于我們生活的方方面面,它不會(huì)像新聞那樣被正式發(fā)布,卻像血液一樣彌散在我們生活的每根血管中!秉S集偉說(shuō)。正如此言,在《現(xiàn)代漢語(yǔ)常用詞表》中,大量與社會(huì)生活變遷同步的新詞,反映了社會(huì)點(diǎn)點(diǎn)滴滴的變化。
《現(xiàn)代漢語(yǔ)常用詞表》責(zé)任編輯余桂林和記者一起總結(jié)了涉及社會(huì)生活的方方面面變化的一些新詞。
反映政治生活變遷的有“三個(gè)代表、鄧小平理論、三農(nóng)”等。
1978年高考恢復(fù)后,與考試有關(guān)的詞匯多了起來(lái),“自考、電大、函授、博士點(diǎn)、會(huì)考、考級(jí)”等等天天與大家見(jiàn)面。
隨著市場(chǎng)經(jīng)濟(jì)的發(fā)展,房地產(chǎn)業(yè)帶動(dòng)起詞匯的飛速發(fā)展,“房市、商品房、期房、現(xiàn)房、房改、房貼、租房、房源、業(yè)主、二手房”等等,都是許多年前從未見(jiàn)過(guò)的新詞。
跟網(wǎng)絡(luò)有關(guān)的詞匯表現(xiàn)最為活躍,新詞呈逐年上升的趨勢(shì)!熬W(wǎng)吧、上網(wǎng)、互聯(lián)網(wǎng)、局域網(wǎng)、計(jì)算機(jī)網(wǎng)絡(luò)、網(wǎng)管、網(wǎng)卡、網(wǎng)絡(luò)化、網(wǎng)警、網(wǎng)絡(luò)游戲、網(wǎng)民、網(wǎng)頁(yè)、網(wǎng)站、網(wǎng)址、發(fā)帖”等,在過(guò)去簡(jiǎn)直是聞所未聞。
跟金融有關(guān)的詞匯也很多,比如“銀行卡、信用卡、刷卡、按揭、理財(cái)、基金”等。
有關(guān)職業(yè)、身份的新詞非常多,如“白領(lǐng)、藍(lán)領(lǐng)、單身貴族、工薪族、上班族”,不過(guò),這幾年時(shí)興的“金領(lǐng)、粉領(lǐng)”等還未收入,專(zhuān)家分析,可能是因?yàn)樗鼈冞不穩(wěn)定的原因。
和股票有關(guān)的詞語(yǔ),比如“飄紅、飄綠、熊市、牛市、參股、股市、股利、股民、股息”等足有一大串。
隨著明星對(duì)社會(huì)生活的影響力加大,由明星生發(fā)出了諸多詞匯,如“丑星、歌星、球星、童星、舞星、笑星、新星、影星”等。
這些年,在新聞中出現(xiàn)頻率很高的詞匯,如“艾滋病、非典、禽流感”也是常用詞。
而一些大家熟悉的俗語(yǔ),如“暴發(fā)戶(hù)、二百五、三陪”等也被收入其中。
“的”使用頻率最高
56008個(gè)常用詞中,“的”使用頻率最高。
民間詞語(yǔ)收藏家黃集偉集詞歷史足有10年,他認(rèn)為“的”這個(gè)語(yǔ)言文化現(xiàn)象很值得探究!霸诂F(xiàn)代漢語(yǔ)里,‘的’屬結(jié)構(gòu)助詞,我相信,經(jīng)過(guò)很多年,這個(gè)詞依然會(huì)是詞頻很高的詞!彼又庾x道,“的”字詞組也相當(dāng)常見(jiàn),比如,打醬油的、撐船的、唱歌的,這時(shí)“的”代指人。
黃集偉曾注意到一個(gè)有趣的現(xiàn)象,江蘇作家程庸寫(xiě)《官窯美人》,這部25萬(wàn)字的長(zhǎng)篇小說(shuō)拒絕用“的”,一度為人關(guān)注。黃集偉認(rèn)為,生活中去掉“的”可以,但是會(huì)很不習(xí)慣,一定要換一種表達(dá)方式才行。比如,“這是一個(gè)漂亮的杯子”,去掉“的”就變成了“這個(gè)杯子很漂亮”。 而實(shí)際上表達(dá)的意思已經(jīng)走了樣。
過(guò)去許多語(yǔ)言學(xué)家如呂叔湘、王力等,也曾多次創(chuàng)導(dǎo)漢語(yǔ)言要簡(jiǎn)潔生動(dòng),臺(tái)灣作家余光中曾作過(guò)測(cè)試,要看語(yǔ)言簡(jiǎn)潔與否,只要看為文,通常20個(gè)字里只能出現(xiàn)一個(gè)“的”,超過(guò)兩個(gè)則是啰嗦。
但語(yǔ)言學(xué)家也認(rèn)為,可有可無(wú)的“的”完全可以不要,但“的”畢竟是一個(gè)很有用的助詞。《現(xiàn)代漢語(yǔ)常用詞表》同其他詞表一樣,漢語(yǔ)中第一高頻詞就是“的”。助詞在漢語(yǔ)中表示的語(yǔ)法意義非常重要,如果不用“的”是不可能的,不是表達(dá)不清,就是表意混亂或產(chǎn)生歧義。
常用詞表將每5至10年修訂一次
李行健說(shuō),現(xiàn)代漢語(yǔ)常用詞將每5年至10年修訂一次,應(yīng)與時(shí)俱進(jìn)。否則,常用詞表很容易邊緣化。
語(yǔ)言是不斷變化的,幾年之后,很多詞會(huì)從常用詞里隱退出來(lái),又有許多表現(xiàn)穩(wěn)定的新詞會(huì)出現(xiàn),因此要密切跟蹤語(yǔ)言的發(fā)展。“我們此次發(fā)布的《現(xiàn)代漢語(yǔ)常用詞表》,雖然詞語(yǔ)統(tǒng)計(jì)用了三種語(yǔ)料庫(kù),但畢竟還有局限,收入的詞語(yǔ)也可能有缺漏,不可能一下做到盡善盡美。所以必須5至10年修訂一次!
語(yǔ)言專(zhuān)家認(rèn)為,當(dāng)今社會(huì)語(yǔ)言處于飛速發(fā)展期,這與經(jīng)濟(jì)社會(huì)環(huán)境、新觀念、新思想、新事物不斷出現(xiàn)有關(guān)。與過(guò)去相比,因?yàn)橛芯W(wǎng)絡(luò)的出現(xiàn),新詞的產(chǎn)生和傳播也更加迅猛,新詞往往開(kāi)始在小圈子傳,但有不少詞很快在大眾范圍內(nèi)傳播!安贿^(guò),大多數(shù)新詞僅是曇花一現(xiàn)。真正有生命力的新詞,需要時(shí)間的檢驗(yàn)!崩钚薪≌f(shuō)。
有人很關(guān)注《現(xiàn)代漢語(yǔ)常用詞表》中收了多少網(wǎng)絡(luò)詞。李行健說(shuō):“網(wǎng)絡(luò)詞語(yǔ)能否進(jìn)入常用詞表,有兩道門(mén)檻必須逾越。首先它必須進(jìn)入社會(huì)大眾的語(yǔ)言中,其次還要為人們廣泛使用具有很高的使用度,達(dá)到常用詞的標(biāo)準(zhǔn)后才可能進(jìn)入詞表。如”網(wǎng)民、網(wǎng)吧、網(wǎng)址“等就經(jīng)過(guò)了上述過(guò)程才得以進(jìn)入常用詞表的。
本報(bào)記者 路艷霞
銆?a href="/common/footer/intro.shtml" target="_blank">鍏充簬鎴戜滑銆?銆? About us 銆? 銆?a href="/common/footer/contact.shtml" target="_blank">鑱旂郴鎴戜滑銆?銆?a target="_blank">騫垮憡鏈嶅姟銆?銆?a href="/common/footer/news-service.shtml" target="_blank">渚涚ǹ鏈嶅姟銆?/span>-銆?a href="/common/footer/law.shtml" target="_blank">娉曞緥澹版槑銆?銆?a target="_blank">鎷涜仒?shù)俊鎭?/font>銆?銆?a href="/common/footer/sitemap.shtml" target="_blank">緗戠珯鍦板浘銆?銆?a target="_blank">鐣欒█鍙嶉銆?/td> |
鏈綉绔欐墍鍒婅澆淇℃伅錛屼笉浠h〃涓柊紺懼拰涓柊緗戣鐐廣?鍒婄敤鏈綉绔欑ǹ浠訛紝鍔$粡涔﹂潰鎺堟潈銆?/font> |