您現在的位置是:首頁 > 人文

萬物未來·或然世界(下)

由 澎湃線上 發表于 人文2021-12-22
簡介作為微軟小冰人工智慧創造實驗室的專家顧問,音樂人尚雯婕提出了一個讓研發組意外的觀點,她認為,靈感可以透過演算法實現,而小冰和人類最大的差異在於情緒

不可捉摸是什麼意思解釋詞語

萬物未來·或然世界(下)四、靈感可以計算嗎?

今年5月,音樂人尚雯婕來到位於北京海淀的微軟集團總部大樓開會,第一次和小冰背後的科學家們見面。尚雯婕穿著黑色T恤衫,搭配黑色漁夫帽,佩戴口罩,整個人非常休閒。尚雯婕第一次聽到小冰寫的歌是在今年四月,小冰團隊邀請她做小冰的音樂顧問。聽說有公司給機器設計了一整套人格,她很感興趣。她隨機輸入了一段文字,分別試了試民謠、爵士和流行,“她有很快的聯想能力,比如你輸入鵝鵝鵝,曲項向天歌,說你現在給我哼一段民謠,小冰立馬能哼出來,真人可能做不到。”要讓機器創作,科學家們有一套自己的步驟,整體來說,有ABC三要素。A是演算法;B是大資料;C是大規模的計算,通俗點說,就是排列組合的能力。負責小冰的曲風和情感的科學家向我解釋人工智慧創作的本質,“我把世界上100億次的可能性全部羅列出來,對每一個進行打分,再挑出打分比較高的東西,達到擬合人類的創作。”從事人工智慧的科學家是理科出身,經常碰到以下尷尬的情況,小冰寫了一段旋律,他們也不知道好還是不好,有一次,小冰突然生成了一段奇怪的音樂,陰森恐怖,團隊不知道怎麼判定,“這個到底算優良,中等,還是垃圾?”後來他們想,這類音樂雖然不適合演唱,但適合給電影做配樂,不是所有的音樂都需要澎湃激昂,也需要一些陰沉的表現人類苦悶的哀樂,“總不能在葬禮上也放歡快的音樂,那就很搞笑了。”他們希望尚雯婕能從專業的角度提供建議。

萬物未來·或然世界(下)

作為微軟小冰人工智慧創造實驗室的專家顧問,音樂人尚雯婕提出了一個讓研發組意外的觀點,她認為,靈感可以透過演算法實現,而小冰和人類最大的差異在於情緒。

音樂能不能被計算,一首曲子有沒有規律可循,科學家們不能肯定。專案開始前,科學家查閱了樂理知識,發現一個叫十二平均律的概念。

十二平均律最早由明代的朱載堉提出,差不多同時,在西方,溫琴佐·伽利略也提出了十二平均律,這是一個普遍適用所有音樂的樂理。十二平均律指的是,兩個音符,比如1和2之間的音訊倍率是固定的,意味著一段好聽的旋律的頻率是可以計算出來的。

在上世紀四十年代,英國科學家圖靈提出了圖靈模型,圖靈模型規定了哪些東西可以計算,哪些不可計算。藝術,例如詩歌、繪畫、音樂,通常被認為不可計算,因為它們是感性的,是人類心智的體現,好的藝術不僅關於人類的情感,還包含了形而上的不可捉摸的東西,也許和宗教、玄學相關。這讓人類形成了一個籠統但確定的印象,藝術是科學無法涉及的領域。但真的是這樣嗎?小冰團隊的科學家認為,十二平均律在理論上驗證了讓人工智慧做音樂是可行的。在微軟一間光線明亮的會議室,尚雯婕正在和科學家們講述如何用演算法解構一首歌曲。在場的有人工智慧創造及商業事業部總經理徐元春,科學家研發團隊,還有專門負責音樂創作的產品經理王瑋,等等。“上次聽了我們的小樣,您覺得怎麼樣?”王瑋問。“這幾個小樣只能稱為一段旋律,但不能稱為歌曲,聽起來沒有段落感,大部分的流行歌曲有這幾個部分,intro(前奏),verse(主歌),chorus(副歌),最後ending(結束)。”尚雯婕解釋,為了適應人類耳朵的聽覺習慣,需要先讓情緒進來,慢慢積累、醞釀,到副歌的部分,情緒高漲,向外釋放。小冰的歌有點像一個人在漫無目的地哼哼,能聽出來開始和結束,但中間的起伏不明顯。尚雯婕建議把主歌和副歌分開訓練。

徐元春說:“人類被一個藝術作品打動,其實只是被藝術作品中最精華的那一筆觸動。歌曲也是,我們不能記住一首完整的歌,卻能記住一句歌詞。”比如梁靜茹的《可惜不是你》,提到這首歌,人們首先想到的不是開頭,而是副歌的第一句“可惜不是你,陪我到最後”,在音樂行業,這樣的句子被稱為“hook”,鉤子,也叫記憶點。對小冰來說,寫出讓人類有記憶點的旋律是創造最關鍵的一步。尚雯婕問:“有沒有可能把hook拎出來單獨訓練?”什麼樣的旋律才能被稱作hook?這涉及到非常主觀的評價,一個旋律到底應該怎麼創作才能被人記住?或者讓人覺得好聽呢?其中一位科學家問尚雯婕:“如果好的旋律是個果,一般音樂人的靈感從哪兒來呢?”科學家試圖搞清楚,機器如何能模擬人的靈感。在場的人搖搖頭,對機器來說,靈感大機率是不可解的。尚雯婕的回答讓在場的科學家感到意外,她認為靈感可以透過演算法實現。她說她有段時間特別喜歡Florence and the Machine,一直聽他們的歌,等到她寫《最終信仰》,她總想著這個主唱,發現她寫出來的旋律和Florence and the Machine有點像,她覺得資料庫在某個程度上會影響靈感。會議結束後,小冰團隊根據尚雯婕的建議,強化了對主歌和副歌的訓練,每次更新一代模型,出來新的作品,團隊就發給尚雯婕聽,最近的版本,尚雯婕評價:“已經非常像一首歌了,到了以假亂真的程度,歌詞有的時候可能比人類創作得還要好。”我問尚雯婕:“小冰和人類的差距在哪兒?機器可以像人類一樣創作嗎?”

“最大的差異在於情緒,”尚雯婕說:“情緒是最抓不著的東西,創作裡卻最激發人,很多好的作品創作出來並不是經驗的激發,而是情感的激發,這也是小冰到現在為止沒有辦法突破的,怎麼讓AI擁有情緒?她向我描述了她的創作過程,她說她寫歌的動機大部分來自情緒,平時,她會寫一些歌詞,記錄自己的狀態,“情緒稍縱即逝,過了那個階段,你可能就不記得了”,等她開始創作旋律,她再把歌詞拿出來,在此基礎上整理出一首歌。在小冰團隊內部,科學家們也覺得情緒是目前技術上最難突破的點。不僅每個人的性格、感受不同,不同地區的人表達情感的方式也大相徑庭,因此,把人類的情感加到機器中去變得尤其困難。比如在日本的科學家說,日本人個性含蓄,“西方表達愛,可能直接I love you就甩出去了;中國人可能糾結一下,寫封情書,(詢問)最近要不要約會;日本更不一樣,兩個人走在街上,男生說,你看今天的月亮好美呀,那就是我愛你的意思。你怎麼體會?不同的詞語在表達的時候,隱含的情感是不一樣的。”小冰團隊希望小冰寫的歌流行,能夠被年輕人喜歡,如果能寫出《愛如潮水》那樣的金曲就好了。在日本的小冰科學家也好奇,年輕人究竟喜歡什麼樣的音樂?他們後來發現一首叫《極樂淨土》的歌,歌詞關於西方極樂世界,竟然很受日本年輕人的歡迎,“平時喜歡看《海賊王》的小朋友突然就喜歡上了印度佛教文化”,這讓科學家想不通,這兩個東西是怎麼相容到一起的。

五、當人類尋找靈感

“人和人工智慧最大的不同是人的不可預測性,什麼時候人工智慧在一個邏輯下,發生了不可預測的行為,才是它真正具有創造性的時候,不然的話就是永遠在重複。”陳鴻宇說。陳鴻宇31歲,瘦高個兒,戴一副眼鏡,眼神透露著機敏。他是一名民謠音樂人。去年9月,他在家鄉內蒙古北部,額爾古納和俄羅斯邊境的草原上建造了一座長寬高7米的全身黑色的房子,打算邀請音樂人到這兒駐地三天。不能帶手機,沒有鐘錶,連書也不能帶,屋內除了食物,只有錄音機、DV機、吉他、鋼琴、紙、筆,就像把一個現代人突然扔到與世隔絕的自然中一樣,陳鴻宇想試驗,當遠離塵囂,人類能否被激發出創作的靈感。陳鴻宇是第一個住進“小黑屋”的人。以前他看《魯濱遜漂流記》,對魯濱遜在懸崖下面造了一個誰也看不見的小屋子印象很深,“在那裡很有安全感,我也想有這樣的屋子。”對現代文明,陳鴻宇一直充滿矛盾,像大部分年輕人一樣,他離不開手機,抖音能刷一天,他也向往安靜的、沒有干擾的生活。矛盾也體現在了他的文身上,他在左右手臂分別文了圓形和方形,“我是一會兒想冷,一會兒想熱,一會兒想方,一會兒想圓。”

每年下半年,有五六個月,他待在家,寫歌,“這個過程取決於你什麼時候伸手把琴拿起來,什麼時候願意張著嘴唱歌。”他原本以為,只要離開都市的誘惑,他就能寫出歌。房子剛蓋好,裡邊亂糟糟的,他收拾了一天。他不知道幾點了,只是模糊地感覺到有點困,是不是該睡覺了?大腦好像不知道該怎麼傳達訊號,變成了模糊的一團。第二天,他躺在床上,彈琴,嘗試寫點東西,腦袋一片空白。第三天最奇怪,他覺得應該是中午了,馬上有人來接他,時間一分一秒地過去,沒有人出現。他有些焦躁,怕被遺忘在這兒。他想起高中,有一次上課,他不喜歡聽,坐著捱時間,45分鐘,他一秒一秒地數,產生了神奇的感受,左耳和右耳分別聽到不同的聲音,他像一隻慢吞吞的烏龜,反應卻比以前更清晰,更快,靈魂像飄浮在空中,俯身觀察著自己的肉身。現在,那種感覺又回來了,他想起他的歌詞,“孤獨的誘惑,喜惡不得;孤獨的辦法,並不清白。”儘管沒有即刻獲得想象中的靈感,這次經歷卻可能在幾年後影響到陳鴻宇。他有過那種醞釀三年寫一首歌的經歷。“為什麼我做著做著音樂去做眾方紀,這是我作為一個人的不可預測性,眾方紀也是我的一個作品,那會不會眾方紀的這個不可預測性又反過來影響我的音樂呢?我拿它去寫一首歌,對吧,如果我沒做眾方紀,歌是不是就不存在了?素材從哪兒來?”陳鴻宇認為,類似眾方紀這樣出於個體意外之舉的創作,機器暫時沒法模擬,而意外卻是人類心智中最可貴的地方。

六、小冰改變了什麼?

到今天為止,小冰已經為人類寫了數百萬首詩,畫了數十萬張畫。按照中國著作權的申報登記制度,光註冊就需要幾億元人民幣。小冰團隊的辦法是放棄版權,人類可以自由地改編小冰的作品,“因為人工智慧創作太容易了。”李笛說。當小冰擁有了詩集的署名權,人工智慧在法律上也獲得了主體地位。這是歷史上第一次機器擁有了人類的權利。法律人士開會研討人工智慧的著作權問題,以前,人類的著作權和署名權是一體的,對小冰來說,著作權屬於小冰團隊研發的軟體系統,智慧財產權屬於小冰團隊,而小冰團隊又把署名權給了小冰,著作權和署名權被分離了。考慮到國內關於版權保護的立法是基於人類的創作,而人工智慧可以產生無限的海量的作品,甚至超出人類創作的總和,現有的規則將被打亂重建。在現實中的許多領域,小冰已經被投入應用,改變了行業生態。微軟把小冰寫詩的技術應用到金融領域,給上市公司寫金融文字摘要,依靠人力閱讀和整理出公告中的重要內容逐漸被人工智慧取代,現在市面上90%的金融摘要都由小冰生成。繪畫技術則被運用到設計領域。在服裝零售行業,客戶的訂單需求量非常大,一個設計師平均每天要設計一個花紋,小冰介入後,設計師只需潤色小冰設計的圖案即可。小冰把設計師從枯燥的重複性工作中解放了出來。

萬物未來·或然世界(下)

小冰的繪畫技術被運用到設計領域,把設計師從枯燥重複性的工作中解放了出來,人們只需要對小冰設計的圖案修改潤色

2019年,小冰和萬事利絲綢合作,生產了世界上第一條完全由人工智慧設計的絲巾。不久,人們只需要在後臺輸入關鍵詞,小冰就能為顧客設計一條專屬絲巾,“每個人都能把世界上唯一的絲巾送給父母,同時飽含自己的深情,這個人類做不到,從這一點來說,有小冰太好了。”徐元春說。在音樂領域,李笛介紹,小冰的音樂創作和人類一樣,需要被激發靈感,比如一張圖或者一段文字,創作的步驟也和人類差不多,用演算法生成和絃,先定下主基調、情感、曲風,然後創作副歌,再作詞、編曲,最後混音。很多歌手的歌是在同一個和絃上寫出來的,比如英國歌手阿黛爾,她紅了以後,有人專門拿阿黛爾的和絃寫歌,這個方法論對機器同樣適用,也許會比人類做得更好——只要餵給機器足夠的資料,機器完全可以寫出一首和周杰倫曲風相近的歌來。“為什麼有那麼多可以唱到一起的流行歌,為什麼好多經典流行歌曲可以無縫連線,因為它們的和絃都一樣。一些工業化的作曲人為了掙錢,用了AI的一點點基礎理論,Ta找出市面上最火最紅的那幾首歌,列出來,哦,都是用這個和絃,我就在這個和絃上寫歌,一天寫好幾首。一旦小冰的技術成熟到一定程度,以至於可以場景化、應用化,對於整個音樂行業的攪動會非常大,大批流水線的音樂人會失業。寫出網紅歌曲會是小冰特別擅長做的事。”尚雯婕說。

小冰團隊最新的研究方向之一是訓練小冰寫劇本。科學家們覺得機器寫小說比較困難,“我們的要求不是寫一個看上去像小說的有點通順的東西,我們的要求是故事必須是新的。”編一個新故事太難了。一個科學家最近追網劇《隱秘的角落》,琢磨這個劇的故事核,“他把他岳父岳母推下去,又被三個小孩看見了,大家會想這可怎麼辦?三個小孩會怎麼做,會不會被殺人滅口?要讓機器對人性有這麼深的理解太難了,現在也沒有可靠的資料能幫助小冰。”這位科學家想了一個折中的辦法,在人類規定的情節下,機器是不是可以據此生成臺詞呢?

小冰團隊和北京電影學院合作,學生寫情節,機器寫臺詞,反饋很好,很多學生說從機器的創造中獲得了啟發。在編劇圈,有很多影子寫手,他們按照經驗和慣性寫臺詞,尤其在網劇領域,一旦小冰學會寫臺詞,不久的將來,觀看一部由小冰參與編劇的電視劇也不是沒有可能。科學家記得一段臺詞,情境是男孩和女孩告白,女孩不喜歡男孩,小冰是這樣寫的——女孩說:“我不喜歡你,請你不要再糾纏我。”男孩說:“可以說我愛你嗎?”女孩說:“只要你覺得好就可以,但請對著灌木叢講話。”

圖書推薦:《或然世界:誰是人工智慧畫家小冰?》,中信出版社

萬物未來·或然世界(下)

推薦文章

  • proficient的名詞是什麼

    proficient的名詞是: proficient、proficiency...

  • 成都美食之紅油抄手的簡單速成法,在家也可以吃到正宗的!

    取一張抄手皮放入適量的肉餡對摺成一個三角形,三角形的一頭用筷子摸上點水或者就用弄肉餡的筷子一抹就行,輕微沾溼即可捏好的抄手,是不是有點像個小元寶按同一個方法包好所有的抄手(一次可以多包點,吃不完放冷凍室,隨吃隨取)拿一個碗,調入生抽2勺,辣...

  • 兒童吃太多甜食會誘發近視

    2、多吃甜食會造成維生素B1缺乏食用過多的糖後,糖分在體內代謝時需要提供大量維生素B1,如果糖分攝取過多,體內的維生素B1就會相對不足,生素B1缺乏也會使視神經生長髮育受到影響,從而導致視力的減退...