首頁 > 遊戲

索尼“黑科技”AI聲音分離技術：混合音源中提取出單個聲音

由經理人網發表于遊戲2021-12-10

簡介索尼研發人員光藤祐基表示：AI聲音分離技術可以從音訊資料中去除不必要的噪音，只提取人聲或其他特定樂器的聲音

音樂和聲音分離怎麼做

（經理人網7月27日訊息），昨日，索尼公司釋出文章，介紹了索尼的一項“黑科技”創新成果 ——AI聲音分離技術。這項技術可以從混合的音源中提取出單個的聲音。

目前，這項技術在復原經典電影、消除智慧手機的噪音、實現音樂流媒體服務的實時卡拉OK功能等方面已經取得了成果，未來還將應用到更多領域。

索尼研發人員光藤祐基表示：AI聲音分離技術可以從音訊資料中去除不必要的噪音，只提取人聲或其他特定樂器的聲音。聲音分離是由AI進行的，而人們可以教計算機來完成這個任務。一把吉他有一個特定的聲音或頻率，這一點可被神經網路學習到。無論混合了多少種聲音，我們的AI系統都能夠識別這些特徵。

另一名索尼的研發人員尤里奇表示，神經網路在所謂的訓練中能夠學習識別音訊特徵。在這個訓練中，神經網路會看到很多音樂–比我們一生中聽到的音樂還要多–以及我們應該提取的目標聲音。這些資訊足以讓神經網路學習聲音分離。

據瞭解，索尼的AI系統能夠成功地從電影母版中提取單個音效，《阿拉伯的勞倫斯》和《甘地》兩部電影的4K重製超清版本中，索尼影視娛樂公司的調音師用這項技術提取出聲音，用杜比全景聲進行重製，創造了一個沉浸式的聲場。

此外，索尼AI聲音分離技術還能夠應用於清理透過麥克風記錄的人類聲音。比如，利用聲音分離技術，將歌曲中的原唱分離出去，製作成卡拉OK伴奏。

光藤祐基還表示，索尼PCL和索尼音樂解決方案剛剛開始使用我們的技術對外提供服務，所以肯定會有更多的應用，非常期待未來的前景。