首頁 > 人文

Meta的AI英語互譯,為什麼選擇閩南語而非粵語?

由 方舟科技時訊 發表于 人文2023-01-22

簡介為此,總部位於加州的Meta公司最近開發了一種名為“S2UT” (speech-to-unit translation) 的翻譯技術,能將原本沒有特定文字書寫紀錄的語言,直接透過語音對語音翻譯方式轉換成另一種語言,例如將臺灣等亞洲地區許多人

belorrbets英語什麼字

總所周知,由於語言的複雜性,包括語篇結構、思想、邏輯,目前的機器翻譯效果遠未達到人工水平,主要表現在句子凌亂、語法錯誤,句與句之間意義不連貫,語義歧義表現在措辭不當,詞義錯誤,甚至導致前後矛盾、不知所云。但這些還都是針對有文字的語言翻譯時候出現的問題,而對於沒有系統成形文字的方言來說,問題更加嚴重。

為此,總部位於加州的Meta公司最近開發了一種名為“S2UT” (speech-to-unit translation) 的翻譯技術,能將原本沒有特定文字書寫紀錄的語言,直接透過語音對語音翻譯方式轉換成另一種語言,例如將臺灣等亞洲地區許多人使用的閩南語直接翻譯成英語,同時也能將英語直接翻譯成閩南語。

Meta的AI英語互譯,為什麼選擇閩南語而非粵語?

Meta這項超級新穎的翻譯技術“S2UT”是使用AI來轉譯“沒有實際文字”的語言。它首先將沒有實際文字的語言念音轉換為數位聲波資料,然後與其他可轉為文字內容的語言透過機器學習進行交叉比對,藉此建立標示與分類 ,未來即可透過識別念音,直接將沒有實際文字的語言翻譯成其他語言。

Meta的AI英語互譯,為什麼選擇閩南語而非粵語?

而如果碰到未建立標示及分類的情況,系統則會透過另一套翻譯流程,藉由其他語言進行轉譯,例如在閩南語原意無法直接以英語詮釋情況下,若可以透過普通話詮釋,系統就會參考普通話內容再翻譯為英語。

Meta為何選擇閩南語?

之所以選擇以閩南語而非粵語作為此技術第一個對應語言,Meta發言人表示,目前使用閩南語的使用人口超過5,000萬人,同時也是中文語系中的代表語言之一;但也因為沒有文字,因此無法透過一般翻譯技術轉換成其他語言。其次,海外華人使用的另一大語言-粵語雖然也是中國的一大方言,但其與古漢語的關聯更加緊密,因此有以繁體字為主體的成形文字為依託。目前的機器語言已經能夠對粵語進行相當不錯的翻譯,只不過輸入的是筆畫更多的繁體字罷了。

Meta的AI英語互譯,為什麼選擇閩南語而非粵語?

推出此項技術,Meta希望能讓人們可以打破語言隔閡,以最自然形式進行交流,藉此促成更深入的互動。要知道,世界許多地區的人交流的時候依然使用的是沒有成形文字的方言,尤其是少數民族聚居的地區。

Meta的AI英語互譯,為什麼選擇閩南語而非粵語?

Meta接下來將對外開放名為“LASER”的自然語言處理工具,所打造SpeechMatrix大型語音對語音訓練模型,讓更多研究人員可以建立眾多無法透過文字紀錄的語言,讓更多語言可以透過人工智慧方式翻譯成其他語言。

Tags:語言閩南語meta文字透過