Google、Sony的專家揭秘AI+音樂項目:AI會取代音樂家嗎?
編輯點評:Google、Sony的新項目正使用機器學習技術來創作音樂;我們應該害怕還是興奮?
隨著人工智慧技術的不斷發展,AI創作音樂似乎也不是那麼新鮮的事了。近日,喬治亞理工大學的研究者甚至研發了能演奏樂器、進行表演的機器人,AI作曲、機器人樂隊演奏的想像似乎不再遙遠。
而這些進展也讓人不禁思考:人工智慧連音樂家都要取代了嗎?
Google Magenta和 Sony Flow Machines是兩個目前頂尖的音樂AI研發項目。本文將為您介紹兩個團隊的目前的研發進展,並帶來對Magenta項目研發人員Douglas Eck、Flow Machines項目負責人François Pachet以及音樂家Benoît Carré的採訪,從業內人士的角度解讀音樂AI到底有多神秘及其前景。
首先,我們來聽聽下面這首名為“爸爸的汽車”(Daddy’s Car)歌,感覺怎麼樣?
如果這首歌出現在某個視頻網站廣告中,你可能不會覺得有什麼特別需要關注的,因為這首歌就像是一首有點披頭四風格的歌曲而已。
但是,如果我告訴你這首“爸爸的汽車”是由計算機的“大腦”寫的,你會怎麼想?這個計算機大腦是由Sony旗下Flow Machines項目所創建,其大型神經網絡可創作披頭四風格(由法國音樂家Benoît Carré精修)的旋律。這首“爸爸的汽車”是其中最出色的一首。
如今計算機開始創作越來越多的音樂,而它們創作音樂的方式,並不是像人一樣由靈感迸發,而是遵循設計者的指令進行創造。而也有越來越多的公司和機構願意進行該項研發投資。例如,Flow Machines就獲得了歐洲研究委員會(European Research Council)250萬美元的贊助。
像Siri等聊天機器人如今已經可以和人進行對話,而下一步如何讓機器的聲音更有“人情味”,則就比較難了。讓機器創作音樂,正是讓它們更有人情味的一種方式——而機器又如何懂得音符在哪裡停止,音樂由從哪裡開始呢?
Google Magenta科學家:AI創作音樂像北極熊騎三輪車
Douglas Eck是Magenta項目的研發科學家,這個項目同時也是Google 大腦的項目分支之一。他即是一名工程師也是一名音樂家。他曾在印第安納的咖啡屋演奏過藍草音樂和朋克音樂,並回想那是他職業的巔峰。他還對哲學意義上音符與音樂的區別非常感興趣。
Eck並不贊同對AI音樂進行圖靈測試,他也不希望Magenta取代音樂家,這有點讓人出乎意料。“我並不期望你按下一個按鈕,機器就可以創作出調動你情緒的音樂。那是一個有趣的目標,但不是我的目標。”
Eck認為,對Magenta團隊來說最大的障礙不在於技術,而是人:研發者需要像音樂家一樣去思考,而不是僅僅從工程師的角度出發。
Eck指出,當以一個外行人的角度來看那些開源代碼論壇的時候,你只會發現那些論壇是充滿代碼的工程師地盤,但卻缺少人情味。而這也是他們工作的困難之一:如何創建讓音樂家真正感興趣並可以實際使用的技術?
Magenta目前是工程師的“遊樂園”,作者可以在此上傳他們的早期成果,但目前他們的音樂作品還比較生澀,如同初學者一樣。
Eck比喻到,目前他看待AI創作音樂就像看待“北極熊騎三輪車”一樣:先不管結果如何,最讓人驚訝的是可以開始了。他也接受一些嘗試了他們作品的人的批評。目前Google工程師的態度也都是類似的謙虛,“如果歌手Frank Ocean說要和我們合作,我們也會拒絕的,因為還不是時候。”
Eck認為,目前Magenta缺少的正是音樂家的參與:將軟體塑造成工程師無法想像的樣子。“以音樂編輯設備鼓機舉例,當我們開發出它富有創意的用處時,它才會發光發熱。也許現在我們有Magenta的模型來生成聲音和旋律序列,但真正有趣的是讓音樂家來操作它、調適它。”
採訪中Eck還提及Meganta的新工具NSynth,一個已經接受30萬種樂器聲音訓練的神經網絡。這種學習聲音的過程展現的是一種跨越式的思路:一般來說,如果電腦要重現聲音,它會將聲波的物理振動簡化為近似數字,再將數字進行縮放。
Nsynth則不一樣,它不會生成數字,而是已經有一些植入的“想法”來區分聲音聽起來像什麼。本質上它是一個合成器,可以在數據庫的兩種聲音之間淡入淡出,並生成一種新的聲音。
舉個例子,你可以讓NSynth把鵝叫聲和豎琴聲合成在一起,然後導入你的家庭影院。但目前來說, NSynth的功能仍然停留在“飛行器零件”的層面,並沒有製造出真正的音樂“飛機”。
索尼Flow Machines:和用戶合作的虛擬音樂家
與此相比,索尼的Flow Machines有點像是在起飛了。它的網站好像就在急切地告訴你他們是如何由巴赫合唱團受到啟發,學會給貝多芬的歡樂頌寫和弦。
下面的一段視頻,展示的是Flow Machines的創作歌手及音樂家Benoît Carré使用工具Reflexive Looper進行的披頭四“I Feel Fine”的單人演奏。操作者不用告訴Reflexive Looper要錄製什麼,相反,Reflexive Looper會聆聽你的演奏並自主決定錄製什麼、循環什麼,它甚至可以將循環材料進行音調的轉換。
如果Magenta將自己稱為一個研究項目,Flow Machines則更在意結果,併計劃發行數名藝術家使用其產品進行創作的彙編專輯。Flow Machines的負責人François Pachet談到,他們最初的成果可能只是讓人們聽到了技術工藝,但現在,他們想讓人們僅僅聽到音樂,儘管這會很難。
Flow Machines和Magenta不一樣的地方在於它本身是一個大型的歌曲和風格數據庫,你可以從中選取一些材料並告訴軟體你的創作要求(例如不要太多短音符、不要太多和弦等等),當軟體生成結果後,你可以保留其中你喜歡的部分,並讓軟體基於此繼續創作。換句話說,Flow Machines像是一個可以基於大量材料即興創作,並和用戶合作的虛擬音樂家。
索尼Flow Machines負責人:只有音樂家才可以創作獨一無二的音樂
有關機器意識的一個著名思想實驗是“中文房間”,由美國哲學家約翰希爾勒在1980年提出。實驗過程大致是這樣:假設你被鎖在一個房間裡,房間外的人通過門縫給你遞中文紙條,你不懂也不會說中文,但你房間中有書告訴你如何用正確的中文符號回應。因此你寫下相應的中文傳遞回去,但你還是不知道你在讀什麼和寫什麼中文。而房間外的人也並不知道你的無知,他們會認為一個說著流利中文的人在和他們進行有意義的對話。
而這就是希爾勒對有意識機器的隱喻性辯論,他認為機器就是房間中的抄寫員,它們只能操縱符號,卻不能理解符號。
這可以用來比喻Magenta和Machine Flows所創作的音樂。Douglas Eck和François Pachet對機器意識的見解是相似的:他們並不相信機器具有意識。Eck認為“我們用的只是技術而已。所有的藝術創作都需要技術,而技術可以讓我們更有創意。正如沒有環境的支持,我們的大腦不會那麼聰明。例如,沒有筆和紙,大多數人不能做大位數的除法。
Pachet的觀點是相似的,他認為Flow Machines可以自己創作“完美”的歌曲,但只有音樂家才可以創作出獨一無二的音樂。“創作音樂很容易,”他談到,“但只有藝術家才可以創作出偉大的作品。”
至少目前為止,機器還是無法理解譜曲的目的和意義。真正偉大的音樂來自與對溝通的強烈渴望,在這一點上,人類還是有著一席之地。“興奮感”引領著人類不斷探索,而這對於機器來說仍然陌生。簡單來說,你可以教機器做糖,但無法教它想要吃糖。
當然,Pachet也指出,機器有時也會創作出令人驚嘆的音樂,“有時候它會把幾行吉他旋律映射到一首新歌上,而且效果很好。”然而,他也談到,對於人類來說,為什麼喜歡某些歌而不喜歡另一些歌是連自己都解釋不清的,喜歡的衝動來自於人們的潛意識。這就是為什麼Pachet目前並不相信計算機意識的原因,儘管機器已經可以創作音樂,似乎觸及到了人類行為的最前沿,但他並不覺得有一個靈魂潛伏在代碼之中。
對他來說,音樂AI和數字合成器類似,音樂AI是一種新型的工具,我們只需要知道如何使用它。
索尼Flow Machines音樂家:AI音樂觸發想像和靈感
有趣的是,採訪之中只有音樂家Benoît Carré表明程序創作的音樂具有未知的神秘感。Carré目前的全職工作是與Flow Machines合作探索並測試程序。他認為使用這種複雜的算法軟體讓他能夠更深入地探索自己的潛意識。
“陰影先生”(Mr. Shadow)是Flow Machines基於數百個美國爵士樂標準創作的歌曲,它的旋律觸發了Carré的想像,並讓他產生創作靈感。他著迷於機器讀取人聲的方式,並認為機器在其中添加了些什麼元素。
“就像是抓住了歌手的靈魂一樣,”他說,“我聽到的不僅僅是講述歌詞故事的聲音,而是有情緒、有風格的歌唱方式。歌曲很抽象,但又非常情緒化。這就是我覺得這個工具非常神奇的地方,你可以像個不明世事小孩一樣創作音樂,這是一種新型的歌曲。”
音樂創作本質上來說是一種想像,在這個過程中,我們可以到達其它藝術創作無法代領我們到達的潛意識深層。我們唯一需要推動的東西是空氣,當空氣靜止時,音樂就結束了。音樂是所有藝術形式中最縹緲的,當機器能夠越來越多地取代音樂創作的體力活時,或許音樂家能夠更解放,投入更多到想像之中。
Carré說,“Flow Machines創作的音樂會代領你深入你自己,探索你創造性的陰影面。我在探索一種新的創造音樂的方式,或者說是一種新的風格。機器創作的旋律並不一定是你的風格,卻是你選擇的結果。可能比你想要的更多,多出來的東西好像並不存在於我們的現實。”
Carré認為Flow Machines和他演奏所使用的Reflexive Looper工具具有智慧。“當我使用Flow Machines時,我覺得我在合作,”他說,“機器創作的旋律有時候讓我迷戀,因為它們太不一樣了。好比你要睡著時僅存的思緒,你無法識別它們。它們像真實又像虛幻。它們有自己的世界。”
Magenta和NNabla
Google Magenta通過表現力和動力學生成音樂
Magenta有兩個目標。這是第一個推動音樂,視頻,圖像和文字生成最新技術的研究項目。機器學習已經完成了很多工作- 例如語音識別和翻譯; 在這個項目中,我們探討內容的創造。第二,Magenta正在建立藝術家,開發人員和機器學習研究人員的社區。為了促進這一點,Magenta核心團隊正在圍繞TensorFlow建立開源基礎設施,用於製作藝術和音樂。
Sony 開源可在Windows中運行的神經網絡庫NNabla
NNabla 是一個深度學習框架。索尼的目標是讓它可以在任何平台運行。Sony 希望通過提供高效便捷的機器學習庫而將算法嵌入到邊緣設備中。
索尼表示他們的神經網絡庫提供了最基本的深度學習開發研究和部署的函數。他們希望該軟體庫能推動人工智慧的發展,並且不論是在先進研究領域還是前沿應用部署上都能提供強有力的作用。
編按:本文來自微信公眾號“機械雞”(ID:jixieji2017),作者茗君
消息/圖片來源:Source