久久国产乱子伦精品免费观看_亚洲欧美日韩综合在线丁香_欧 美 成 人 网站在线观看_最新欧美电影免费在线_国产精品操干在线观看_最近中文字幕在线视频1_69天堂人成无码_国产影视一区二区三区_中文亚洲精油按摩色偷偷av_99自拍偷拍视频

您當前的位置:首頁 > 新聞中心 > 行業(yè)新聞
語言學中的“不可說” 理深科技時評2022年01月12日

 有一首影視插曲叫《不可說》。不可說,是語言學知識得以建立的壓艙石。但是不可說與否也有諸多細節(jié),說出來都是坑。要想找到正確的打開方式,不可不察。

1、最小二元對立(minimal pairs)

“最小二元對立”指的是除了一個地方有差異以外,其他地方完全相同的兩個例句。而恰恰是這個差異,導致人們對兩個例句做出完全不同的解讀,或者做出完全不同的反應。比如:

(1a)看了三天就

(1b)看了三天就。

此處,兩句唯一的差別就是“膩”和“忘”,它們決定了 “看了三天”的時間起算點的差別:(1a)是從“看”的動作開始起計算三天,而(1b)則是從“看”的動作結束起計算三天。這樣的方法,可以在問題的驅動下,迅速把焦點集中到有差異之處,從而揭示出差異背后的原因所在。

再比如:

(2a)要求你離開。

(2b)答應你離開。

這里,兩句唯一的差別就是“要求”和“答應”,它們都是雙賓語動詞,它們的直接賓語都是謂詞性成分。而正是它們的差異,決定了“離開”的主體是“你”還是“我”:“要求”是兼語式雙賓動詞,其間接賓語是直接賓語的邏輯主語;“答應”是穿透式雙賓動詞,其邏輯主語是直接賓語的邏輯主語。

“最小二元對立”的方法,在語言學研究中被廣泛采用。很多設計精妙的最小二元對立例句,不僅具有學術價值,而且具有欣賞價值。

“最小二元對立”方法涉及到的一對例句,不僅有可能是上面那種“都可說”但“意義結構有明顯差別”,還有可能是“一個可說,另一個不可說”(按照語言學文獻的慣例,不可說的例句前標記星號“*”)。比如:

(3a)他死。

(3b)*他死

通過兩個例句的比對,可以發(fā)現(xiàn)謂語動詞對于時態(tài)助詞、進而對時態(tài)本身有一種選擇性。其背后的原因是,依據(jù)謂語動詞所描述的事件在時間結構上的不同,其與時態(tài)之間的兼容性也不相同。當二者不兼容時,動詞與時態(tài)助詞之間的結合就受到排斥。在上面的例句中,事件“死”的內在時間結構是“一種持續(xù)狀態(tài)的結束”,因此和表示“狀態(tài)持續(xù)”的時態(tài)助詞“著”在語義上互斥,因此例句(E003b)在語感上處于“不可說”的境地。

2、語言學中的“可說性”約束

所謂“可說”或“不可說”,細究起來涉及到的約束有多種情況。有的是“合語法性”、有的是“可接受性”、有的是“現(xiàn)實性”,還有的是“可流通性”。它們之間在語感上似乎只有微妙的區(qū)別,甚至非專業(yè)人士都不一定注意得到,但考察語言現(xiàn)象的維度卻完全不同。

違背“合語法性(grammaticality)”約束,指的是“不存在這種句法結構”。比如在漢語中,副詞修飾名詞就是一種不存在的句法結構。例如“*馬上山洞”、“*不飛機”就是這種情況(“真孫子”可以說,但這時“孫子”已經(jīng)不再是名詞,而是臨時轉化成了形容詞)。

違背“可接受性(acceptability)”約束,指的是“存在這種組合類型,但不存在這種具體搭配”。·比如在漢語中,“數(shù)詞+量詞+名詞”是一種合語法的組合類型,但“一匹豬”就是這種組合類型的一個不可接受的搭配實例,要說“一口豬”或“一頭豬”才可接受。這些約束,不是規(guī)則或詞類層面的約束,而是實例或句法次范疇乃至語義層面的約束,其中有的約束甚至顯得有些不講道理。這體現(xiàn)了實際自然語言的邊界復雜性,也可以為復雜句子的解析帶來便利。比如在分析句子“這碗豬都不喝的湯你還是倒了吧”時,我們就可以通過量詞與名詞之間的搭配約束,直接排除“這碗豬”結合的可能性,從而更高效精準地捕捉“碗”與“湯”搭配帶來的正確句法結構。

違背“現(xiàn)實性(Reality)”約束,指的是語句雖然合法,但其所描述的場景不具有現(xiàn)實性。比如喬姆斯基的著名例句“Thecolorless green ideas sleep furiously. (無色的綠色的思想在狂暴地睡覺。)”   這里就有多處語義組合不具有現(xiàn)實性,甚至有的互相矛盾。一般來說,語言表達的內容現(xiàn)實與否,不是一個語言學問題。但是當面臨歧義選擇的時候,具有現(xiàn)實性的語義組合相較于不具有現(xiàn)實性的語義組合,就會顯現(xiàn)出一定的優(yōu)勢。請看下例:

(4)     饅頭吃光了。

(4a)   饅頭()吃(謂)光()了。

(4b)   饅頭()吃(謂)光()了。   

解讀4a要強迫性地把“饅頭”想象為一種具有消化功能的生物,把“光”這種看得見但摸不著的物理對象想象為一種食物,這就屬于不具有現(xiàn)實性的解讀。而解讀4b很自然地把“光”理解成“吃”的補語,說明食物“饅頭”通過“吃”這一行為達到了一種“沒有剩余”的狀態(tài),這就屬于一種具有現(xiàn)實性的解讀。兩種解讀實力不對稱地較量下來,我們看到解讀4a已經(jīng)完敗,不被認為是例句4的歧義,而被認為是一種可以被排除的“偽歧義”。

上面的例句說明:一個孤立而且形式上沒有歧義的句子,語義上即使不具有現(xiàn)實性,也跟語言沒有關系,你盡可以理解成科幻、童話、玄幻、荒誕或別的什么不靠譜的表述好了。但是,如果是一個形式上有歧義的句子,對它的兩個不同解讀分別對應了具有現(xiàn)實性和不具有現(xiàn)實性的語義組合,那么具有現(xiàn)實性的語義組合就會表現(xiàn)出某種顯著的優(yōu)先性,從而把不具有現(xiàn)實性的語義組合對應的解讀壓制住、排除掉。由此可見,現(xiàn)實性不構成對語言是否“可說”的硬性約束,但構成對歧義消解的軟性約束。

我們要討論的最后一個跟語言的“可說”與否相關的概念是“可流通性”??闪魍ㄐ员臼且粋€金融概念,指的是發(fā)生價值交換的頻繁程度。這一概念借用到語言中來,用以說明某種語言組合在現(xiàn)實語言交流中被使用的頻繁程度。以“二字形容詞+一字名詞”格式為例。像“*好吃餅”、“*奢侈包”這種組合,一般來說在韻律上給人一種頭重腳輕的感覺,所以可流通性較差,屬于一種語言學上“不推薦”的語言格式。這可以在搜索引擎中通過全文檢索得到印證。但是,少數(shù)經(jīng)過刻意包裝的這種格式的組合,也能在語言交流中廣泛傳播開來,比如“犀利哥”、“厲害國”等等。它們不僅沒有任何違和感,而且在修辭上還能收到奇效。但這種有效組合,多屬寫手的神來之筆,也與時代和社會風尚息息相關,刻意模仿不得。事實上,這種“不推薦”的韻律格式,大部分可流通度很低,極少部分則火爆流行,幾乎不存在中間狀態(tài)。

通過上面的具體拆解,可以看到,對語言的“可說”與否的判斷,其實是一個大雜燴,背后有語法規(guī)范的因素、習慣搭配的因素、邏輯與現(xiàn)實的因素以及韻律與流通的因素等。不同因素導致的二元對立都有自身起作用的限定范圍。如果用“可說”與否來分析處理最小二元對立,一定要進行仔細甄別這些限定范圍,否則就會被不適用的因素所干擾。

3、兩套語法:毛毛蟲和內外包絡

回到語言學知識體系的建立上來。我們知道,語言學知識的正確性取決于語言事實的正確性。而關于語法的負面語言事實,即反例,就是利用“不可說”來構成的。所以,不可說與否的判斷,是構筑語言學知識體系最重要的環(huán)節(jié)之一。

但通過上面的分析,我們發(fā)現(xiàn),“不可說”不是一個剛性的標準,而是一個在執(zhí)行中有很大自由裁量權的標準,更是一個可以細分并根據(jù)細分情形的不同各有適用范圍的標準。

我們更看到,實際語料,特別是網(wǎng)上的短文本,如微博、微信、推特等發(fā)言,具有很嚴重的隨意性。一個后果就是:很多語言學家認為“不可說”的,都被人說真實地說了出來而且完全能夠正常理解,沒人認為不妥。

反過來,要是一個對話機器人在跟人對話的時候這么隨意,馬上就會有人抗議說質量怎么這么差。好像對于語言理解像親媽,犯什么錯誤都是可以容忍的,對于語言生成像后媽,有錯就要必究。

這就尷尬了。在商業(yè)上和工程上厚此薄彼沒什么,在學術上這就意味著理解用的可說性標準和生成用的可說性標準根本是兩套標準,背后有兩套不同的語法!

其實,語言的真正邊界也許可以描繪成一條“毛毛蟲”。理解用的語法刻畫的是它的一個“外包絡”,里面包括了所有的“可說”,但出于寬容也容納了相當部分的“不可說”;生成用的語法刻畫的是它的一個“內包絡”,說出來的都很有把握屬于“可說”,但出于保險沒說出來的也有相當部分的“可說”。對別人寬容為上,對自己保險為上,這是語言學混NLP江湖的秘籍。



分享到:

最熱資訊

熱門標簽