昂貴、罕見(jiàn)、難駕馭、有破壞性,人生哪有一帆風(fēng)順,人工智能的“一生”也會(huì)遇到很多難以進(jìn)行“訓(xùn)練”的場(chǎng)景,也就是靠大量常規(guī)數(shù)據(jù)無(wú)法訓(xùn)練的場(chǎng)景。
就好像拍電影,要拍《少年派的奇幻漂流》,需要一只老虎做演員,怎么辦?買好多只這種珍稀動(dòng)物,讓馴獸師教它演戲,到最后還任憑它因劇情需要而死去?
這肯定不行。于是李安讓特技團(tuán)隊(duì)“造”出一只相似度99%的虛擬虎,昂貴、罕見(jiàn)、難駕馭、有破壞性的難題迎刃而解,而以此為代表作品的虛擬場(chǎng)景構(gòu)建技術(shù)也成為遷移學(xué)習(xí)的一種方法。
日前,有媒體轉(zhuǎn)載《日本經(jīng)濟(jì)新聞》報(bào)道,日本在人工智能“遷移學(xué)習(xí)”研究方面取得進(jìn)步。日本東北大學(xué)將遷移學(xué)習(xí)應(yīng)用在模仿語(yǔ)氣的對(duì)話系統(tǒng)上,松下公司將其應(yīng)用在了判定特定人群病情的軟件上,被視作加速人工智能應(yīng)用落地的研究進(jìn)展。
AI的學(xué)習(xí)為什么要遷移,又如何遷移?它如何讓AI更智慧?科技日?qǐng)?bào)記者1月3日專訪了北京語(yǔ)言大學(xué)教授荀恩東、智能一點(diǎn)公司CTO莫瑜等行業(yè)專家,聽(tīng)聽(tīng)他們的解讀。
舉一反三:用一般數(shù)據(jù)解決特殊問(wèn)題
“有些模型的識(shí)別率已經(jīng)超過(guò)了人的識(shí)別率。”荀恩東說(shuō),人們?cè)絹?lái)越擅長(zhǎng)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),但是高準(zhǔn)確率是建立在現(xiàn)實(shí)情況與訓(xùn)練情況相吻合的基礎(chǔ)上,即實(shí)戰(zhàn)與演習(xí)相一致。
如果是預(yù)設(shè)之外,就很難達(dá)到預(yù)期的識(shí)別準(zhǔn)確率。“機(jī)器有機(jī)器的預(yù)設(shè)之外。”荀恩東以聲音識(shí)別為例告訴記者:比如太濃的口音、太大的背景噪音等,這些和人的“困難場(chǎng)景”一致,但是機(jī)器還會(huì)受到遠(yuǎn)場(chǎng)噪音的影響,“例如太空曠的地方,會(huì)有回音,影響識(shí)別”。
那是不是每遇到一個(gè)特殊場(chǎng)景,都要重新建模,輸入大量的樣本讓機(jī)器重新學(xué)習(xí)一次呢?答案當(dāng)然是否定的。
因?yàn)槲覀兪紫纫紤]成本因素,這就是文章開(kāi)頭提到的“昂貴、有破壞性”特點(diǎn)。其次就是“難駕馭”的問(wèn)題了——即使我們能不惜成本地反復(fù)建模、學(xué)習(xí)新樣本,但有些特殊場(chǎng)景的樣本很罕見(jiàn),或者無(wú)法控制其能產(chǎn)生的成本,也就無(wú)法達(dá)到組成訓(xùn)練集的要求。比如《日本經(jīng)濟(jì)新聞》報(bào)道的,有些罕見(jiàn)病的診斷分析案例只有幾十件,這種情況下,如何讓人工智能擁有判斷的能力?
“現(xiàn)實(shí)世界真混亂啊”,當(dāng)AI從模型訓(xùn)練來(lái)到“塵世”,它可能會(huì)有這樣的慨嘆,大量的全新場(chǎng)景涌過(guò)來(lái),“生搬硬套”根本使不上。
成功的模型目前仍然極度依賴數(shù)據(jù),但能夠獲得大量可用數(shù)據(jù)的情況卻因領(lǐng)域不同,而分布極度不均。資料顯示,目前少數(shù)數(shù)據(jù)是公開(kāi)的,還有不少數(shù)據(jù)是有專利的,或者購(gòu)買起來(lái)很昂貴,剩下更多領(lǐng)域的數(shù)據(jù)是無(wú)法獲得或者沒(méi)有積累的。也就是說(shuō),AI的“訓(xùn)練題庫(kù)”完全無(wú)法覆蓋“考試題庫(kù)”。
為了解決新的任務(wù),“遷移學(xué)習(xí)”成為人們希望人工智能擁有的能力。“要能用一般的數(shù)據(jù)解決特殊的問(wèn)題,用易獲得的數(shù)據(jù)解決難收集數(shù)據(jù)的問(wèn)題。”北京語(yǔ)言大學(xué)教授荀恩東說(shuō),它能拓展人工智能的實(shí)際應(yīng)用范圍。
“就是舉一反三的能力,”莫瑜解釋,比如,要讓機(jī)器在識(shí)別貓之后很容易識(shí)別狗,就需要構(gòu)建一個(gè)識(shí)別貓的模型,包含一些特征,例如尾巴、腿、胡須等,這些特征在識(shí)別狗的時(shí)候可以被機(jī)器利用上。
說(shuō)起來(lái)很簡(jiǎn)單,但這意味著神經(jīng)網(wǎng)絡(luò)有能力存儲(chǔ)并提取“概念性”的東西,也就是存儲(chǔ)和提取抽象的知識(shí),而“不局限于給數(shù)據(jù)、出結(jié)果這種端對(duì)端的輸入輸出”,荀恩東說(shuō)。
眼花繚亂:不同領(lǐng)域需要不同策略
“數(shù)據(jù)層面、特征層面、模型層面的內(nèi)容都可以進(jìn)行遷移。”荀恩東說(shuō),遷移學(xué)習(xí)并不是某個(gè)固定的算法或者具體的技術(shù),更多地是一種解決問(wèn)題的策略。
遷移學(xué)習(xí)之前被稱為自適應(yīng)學(xué)習(xí)。它的初衷是節(jié)約人工標(biāo)注樣本的時(shí)間,讓模型可以通過(guò)已有的標(biāo)簽數(shù)據(jù)向未標(biāo)簽數(shù)據(jù)遷移。“某個(gè)特定模型里的標(biāo)簽數(shù)據(jù)是機(jī)器能夠識(shí)別的,機(jī)器根據(jù)標(biāo)簽來(lái)捕捉識(shí)別特點(diǎn),如果成功將模型遷移至未標(biāo)簽數(shù)據(jù),那么這些數(shù)據(jù)不用重新建模就可以使用。”荀恩東說(shuō)。
遷移學(xué)習(xí)具體怎么做呢?
“遷移學(xué)習(xí)就是開(kāi)發(fā)一系列如何遷移的算法。”莫瑜解釋,怎么讓在一個(gè)領(lǐng)域工作的算法在少量新數(shù)據(jù)的情況下可以應(yīng)用到新的領(lǐng)域?例如,可能存在一種算法,不需要改造,在聽(tīng)懂普通話的AI開(kāi)發(fā)出來(lái)之后,直接就能聽(tīng)懂廣東話。“一般機(jī)器學(xué)習(xí)算法研究如何解決問(wèn)題,而遷移學(xué)習(xí)要?jiǎng)?chuàng)造遷移算法,實(shí)現(xiàn)從一個(gè)領(lǐng)域的問(wèn)題解決方案遷移到另一個(gè)相似領(lǐng)域。”據(jù)稱,在過(guò)去20年中,科學(xué)家積累了上百種遷移學(xué)習(xí)的算法。
隨著研究的深入,遷移學(xué)習(xí)的策略越來(lái)越多,也取得了不小的進(jìn)展。第四范式首席科學(xué)家楊強(qiáng)曾在一次演講中介紹,將機(jī)器學(xué)習(xí)的目標(biāo)問(wèn)題“打散”,即把問(wèn)題的結(jié)構(gòu)和內(nèi)容分離開(kāi),會(huì)發(fā)現(xiàn)不同問(wèn)題之間的共性。一篇發(fā)表在《科學(xué)》雜志上的文章顯示,將手寫字體識(shí)別上的結(jié)構(gòu)和手寫方式區(qū)分開(kāi)之后,結(jié)構(gòu)的學(xué)習(xí)采用單個(gè)數(shù)據(jù)就能訓(xùn)練。此外,層次化的系統(tǒng)更容易幫助構(gòu)建機(jī)器學(xué)習(xí)的遷移;分階段地從已訓(xùn)練領(lǐng)域到新領(lǐng)域的多步傳導(dǎo)式遷移也被證明是適用的策略。
可見(jiàn),“遷移大法”的原則是在實(shí)現(xiàn)由A領(lǐng)域向B領(lǐng)域的遷移時(shí),盡量“平滑”地推動(dòng)——兩個(gè)域的表征要盡可能相似,或者通過(guò)一些操作增加兩個(gè)域表征的相似性,甚至創(chuàng)建出“通用”的表征。例如ImageNet花費(fèi)了多年,用數(shù)千個(gè)小時(shí)來(lái)創(chuàng)建,“基于ImageNet數(shù)據(jù)集的圖像識(shí)別深度神經(jīng)網(wǎng)絡(luò)模型,經(jīng)常被用來(lái)作為圖像特征抽取,應(yīng)用到其他圖像任務(wù)。”莫瑜說(shuō)。一篇名為《基于深度學(xué)習(xí)和遷移學(xué)習(xí)的識(shí)花實(shí)踐》的文章進(jìn)行了類似“百度經(jīng)驗(yàn)”的分享,就是基于ImageNet數(shù)據(jù)集,示范如何將一個(gè)原來(lái)只能識(shí)別花的圖像的深度卷積網(wǎng)絡(luò),遷移到識(shí)別花朵類型、具體品種的新任務(wù)上。通過(guò)“抽取圖像特征”“準(zhǔn)備訓(xùn)練集,驗(yàn)證集和測(cè)試集”“訓(xùn)練網(wǎng)絡(luò)”等步驟,這一“遷移”得到了88%的識(shí)別正確率,計(jì)算時(shí)間只用大概半小時(shí),比完成從零開(kāi)始重新建模快很多。
歷久彌新:或成機(jī)器學(xué)習(xí)商業(yè)新驅(qū)力
事實(shí)上,遷移學(xué)習(xí)和人工智能一樣并不是新概念,在近幾年又恢復(fù)了研究熱度。2016年,前百度首席科學(xué)家吳恩達(dá)曾表示,遷移學(xué)習(xí)將會(huì)是繼監(jiān)督學(xué)習(xí)之后的下一個(gè)機(jī)器學(xué)習(xí)商業(yè)成功的驅(qū)動(dòng)力。楊強(qiáng)也認(rèn)為,機(jī)器學(xué)習(xí)的明天是在小數(shù)據(jù)、個(gè)性化、可靠性上,這取決于遷移學(xué)習(xí)的發(fā)展。
國(guó)際巨頭也在著力于遷移學(xué)習(xí)的實(shí)踐,AlphaGo的開(kāi)發(fā)團(tuán)隊(duì)DeepMind在嘗試對(duì)機(jī)器人進(jìn)行遷移學(xué)習(xí)的訓(xùn)練。他們先從一只胳膊開(kāi)始——在仿真環(huán)境中訓(xùn)練一個(gè)機(jī)械臂移動(dòng),訓(xùn)練好之后,把知識(shí)遷移到真實(shí)的機(jī)械臂上,真實(shí)的機(jī)械臂稍加訓(xùn)練可以做到和仿真一樣的效果。
谷歌通過(guò)仿真系統(tǒng)訓(xùn)練無(wú)人車駕駛,然后遷移到實(shí)際駕駛中。傳授硅谷企業(yè)課程的在線大學(xué)優(yōu)達(dá)學(xué)城也開(kāi)源了用來(lái)進(jìn)行無(wú)人駕駛汽車工程納米學(xué)位教學(xué)的模擬器,仿真更方便獲取不同類別的數(shù)據(jù),更方便多因素并行地訓(xùn)練學(xué)習(xí)。
“我們對(duì)話機(jī)器人也有類似問(wèn)題,在一個(gè)客戶上訓(xùn)練的對(duì)話系統(tǒng),怎么應(yīng)用到新的客戶,而不用從零開(kāi)始。”莫瑜說(shuō),遷移學(xué)習(xí)的應(yīng)用范圍是很廣泛的。
“遷移學(xué)習(xí)大多是在解決實(shí)際問(wèn)題,AI應(yīng)用層面的內(nèi)容多一些,”荀恩東說(shuō),“在實(shí)踐中也有各種各樣的做法,我國(guó)在AI的應(yīng)用場(chǎng)景開(kāi)發(fā)上,還是不落人后的。”
(新媒體責(zé)編:wb001)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來(lái)源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問(wèn)題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行。電話:010-67683008
人民交通24小時(shí)值班手機(jī):17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計(jì) 地址:北京市豐臺(tái)區(qū)南三環(huán)東路6號(hào)A座四層
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證號(hào):京B2-20201704 本刊法律顧問(wèn):北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號(hào) 京ICP備18014261號(hào)-2 廣播電視節(jié)目制作經(jīng)營(yíng)許可證:(京)字第16597號(hào)