首頁 > 遊戲

索尼“黑科技”AI聲音分離技術:混合音源中提取出單個聲音

由 經理人網 發表于 遊戲2021-12-10

簡介索尼研發人員光藤祐基表示:AI聲音分離技術可以從音訊資料中去除不必要的噪音,只提取人聲或其他特定樂器的聲音

音樂和聲音分離怎麼做

(經理人網7月27日訊息),昨日,索尼公司釋出文章,介紹了索尼的一項“黑科技”創新成果 ——AI聲音分離技術。這項技術可以從混合的音源中提取出單個的聲音。

目前,這項技術在復原經典電影、消除智慧手機的噪音、實現音樂流媒體服務的實時卡拉OK功能等方面已經取得了成果,未來還將應用到更多領域。

索尼研發人員光藤祐基表示:AI聲音分離技術可以從音訊資料中去除不必要的噪音,只提取人聲或其他特定樂器的聲音。聲音分離是由AI進行的,而人們可以教計算機來完成這個任務。一把吉他有一個特定的聲音或頻率,這一點可被神經網路學習到。無論混合了多少種聲音,我們的AI系統都能夠識別這些特徵。

另一名索尼的研發人員尤里奇表示,神經網路在所謂的訓練中能夠學習識別音訊特徵。在這個訓練中,神經網路會看到很多音樂–比我們一生中聽到的音樂還要多–以及我們應該提取的目標聲音。這些資訊足以讓神經網路學習聲音分離。

據瞭解,索尼的AI系統能夠成功地從電影母版中提取單個音效,《阿拉伯的勞倫斯》和《甘地》兩部電影的4K重製超清版本中,索尼影視娛樂公司的調音師用這項技術提取出聲音,用杜比全景聲進行重製,創造了一個沉浸式的聲場。

此外,索尼AI聲音分離技術還能夠應用於清理透過麥克風記錄的人類聲音。比如,利用聲音分離技術,將歌曲中的原唱分離出去,製作成卡拉OK伴奏。

光藤祐基還表示,索尼PCL和索尼音樂解決方案剛剛開始使用我們的技術對外提供服務,所以肯定會有更多的應用,非常期待未來的前景。

Tags:索尼AI聲音分離神經網路