遷移學(xué)習(xí)：教AI提取抽象知識(shí)

2018-01-08 12:47:47

來(lái)源：科技日?qǐng)?bào)

昂貴、罕見(jiàn)、難駕馭、有破壞性，人生哪有一帆風(fēng)順，人工智能的“一生”也會(huì)遇到很多難以進(jìn)行“訓(xùn)練”的場(chǎng)景，也就是靠大量常規(guī)數(shù)據(jù)無(wú)法訓(xùn)練的場(chǎng)景。

就好像拍電影，要拍《少年派的奇幻漂流》，需要一只老虎做演員，怎么辦?買好多只這種珍稀動(dòng)物，讓馴獸師教它演戲，到最后還任憑它因劇情需要而死去?

這肯定不行。于是李安讓特技團(tuán)隊(duì)“造”出一只相似度99%的虛擬虎，昂貴、罕見(jiàn)、難駕馭、有破壞性的難題迎刃而解，而以此為代表作品的虛擬場(chǎng)景構(gòu)建技術(shù)也成為遷移學(xué)習(xí)的一種方法。

日前，有媒體轉(zhuǎn)載《日本經(jīng)濟(jì)新聞》報(bào)道，日本在人工智能“遷移學(xué)習(xí)”研究方面取得進(jìn)步。日本東北大學(xué)將遷移學(xué)習(xí)應(yīng)用在模仿語(yǔ)氣的對(duì)話系統(tǒng)上，松下公司將其應(yīng)用在了判定特定人群病情的軟件上，被視作加速人工智能應(yīng)用落地的研究進(jìn)展。

AI的學(xué)習(xí)為什么要遷移，又如何遷移?它如何讓AI更智慧?科技日?qǐng)?bào)記者1月3日專訪了北京語(yǔ)言大學(xué)教授荀恩東、智能一點(diǎn)公司CTO莫瑜等行業(yè)專家，聽(tīng)聽(tīng)他們的解讀。

舉一反三：用一般數(shù)據(jù)解決特殊問(wèn)題

“有些模型的識(shí)別率已經(jīng)超過(guò)了人的識(shí)別率。”荀恩東說(shuō)，人們?cè)絹?lái)越擅長(zhǎng)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)，但是高準(zhǔn)確率是建立在現(xiàn)實(shí)情況與訓(xùn)練情況相吻合的基礎(chǔ)上，即實(shí)戰(zhàn)與演習(xí)相一致。

如果是預(yù)設(shè)之外，就很難達(dá)到預(yù)期的識(shí)別準(zhǔn)確率。“機(jī)器有機(jī)器的預(yù)設(shè)之外。”荀恩東以聲音識(shí)別為例告訴記者：比如太濃的口音、太大的背景噪音等，這些和人的“困難場(chǎng)景”一致，但是機(jī)器還會(huì)受到遠(yuǎn)場(chǎng)噪音的影響，“例如太空曠的地方，會(huì)有回音，影響識(shí)別”。

那是不是每遇到一個(gè)特殊場(chǎng)景，都要重新建模，輸入大量的樣本讓機(jī)器重新學(xué)習(xí)一次呢?答案當(dāng)然是否定的。

因?yàn)槲覀兪紫纫紤]成本因素，這就是文章開(kāi)頭提到的“昂貴、有破壞性”特點(diǎn)。其次就是“難駕馭”的問(wèn)題了——即使我們能不惜成本地反復(fù)建模、學(xué)習(xí)新樣本，但有些特殊場(chǎng)景的樣本很罕見(jiàn)，或者無(wú)法控制其能產(chǎn)生的成本，也就無(wú)法達(dá)到組成訓(xùn)練集的要求。比如《日本經(jīng)濟(jì)新聞》報(bào)道的，有些罕見(jiàn)病的診斷分析案例只有幾十件，這種情況下，如何讓人工智能擁有判斷的能力?

“現(xiàn)實(shí)世界真混亂啊”，當(dāng)AI從模型訓(xùn)練來(lái)到“塵世”，它可能會(huì)有這樣的慨嘆，大量的全新場(chǎng)景涌過(guò)來(lái)，“生搬硬套”根本使不上。

成功的模型目前仍然極度依賴數(shù)據(jù)，但能夠獲得大量可用數(shù)據(jù)的情況卻因領(lǐng)域不同，而分布極度不均。資料顯示，目前少數(shù)數(shù)據(jù)是公開(kāi)的，還有不少數(shù)據(jù)是有專利的，或者購(gòu)買起來(lái)很昂貴，剩下更多領(lǐng)域的數(shù)據(jù)是無(wú)法獲得或者沒(méi)有積累的。也就是說(shuō)，AI的“訓(xùn)練題庫(kù)”完全無(wú)法覆蓋“考試題庫(kù)”。

為了解決新的任務(wù)，“遷移學(xué)習(xí)”成為人們希望人工智能擁有的能力。“要能用一般的數(shù)據(jù)解決特殊的問(wèn)題，用易獲得的數(shù)據(jù)解決難收集數(shù)據(jù)的問(wèn)題。”北京語(yǔ)言大學(xué)教授荀恩東說(shuō)，它能拓展人工智能的實(shí)際應(yīng)用范圍。

“就是舉一反三的能力，”莫瑜解釋，比如，要讓機(jī)器在識(shí)別貓之后很容易識(shí)別狗，就需要構(gòu)建一個(gè)識(shí)別貓的模型，包含一些特征，例如尾巴、腿、胡須等，這些特征在識(shí)別狗的時(shí)候可以被機(jī)器利用上。

說(shuō)起來(lái)很簡(jiǎn)單，但這意味著神經(jīng)網(wǎng)絡(luò)有能力存儲(chǔ)并提取“概念性”的東西，也就是存儲(chǔ)和提取抽象的知識(shí)，而“不局限于給數(shù)據(jù)、出結(jié)果這種端對(duì)端的輸入輸出”，荀恩東說(shuō)。

眼花繚亂：不同領(lǐng)域需要不同策略

“數(shù)據(jù)層面、特征層面、模型層面的內(nèi)容都可以進(jìn)行遷移。”荀恩東說(shuō)，遷移學(xué)習(xí)并不是某個(gè)固定的算法或者具體的技術(shù)，更多地是一種解決問(wèn)題的策略。

遷移學(xué)習(xí)之前被稱為自適應(yīng)學(xué)習(xí)。它的初衷是節(jié)約人工標(biāo)注樣本的時(shí)間，讓模型可以通過(guò)已有的標(biāo)簽數(shù)據(jù)向未標(biāo)簽數(shù)據(jù)遷移。“某個(gè)特定模型里的標(biāo)簽數(shù)據(jù)是機(jī)器能夠識(shí)別的，機(jī)器根據(jù)標(biāo)簽來(lái)捕捉識(shí)別特點(diǎn)，如果成功將模型遷移至未標(biāo)簽數(shù)據(jù)，那么這些數(shù)據(jù)不用重新建模就可以使用。”荀恩東說(shuō)。

遷移學(xué)習(xí)具體怎么做呢?

“遷移學(xué)習(xí)就是開(kāi)發(fā)一系列如何遷移的算法。”莫瑜解釋，怎么讓在一個(gè)領(lǐng)域工作的算法在少量新數(shù)據(jù)的情況下可以應(yīng)用到新的領(lǐng)域?例如，可能存在一種算法，不需要改造，在聽(tīng)懂普通話的AI開(kāi)發(fā)出來(lái)之后，直接就能聽(tīng)懂廣東話。“一般機(jī)器學(xué)習(xí)算法研究如何解決問(wèn)題，而遷移學(xué)習(xí)要?jiǎng)?chuàng)造遷移算法，實(shí)現(xiàn)從一個(gè)領(lǐng)域的問(wèn)題解決方案遷移到另一個(gè)相似領(lǐng)域。”據(jù)稱，在過(guò)去20年中，科學(xué)家積累了上百種遷移學(xué)習(xí)的算法。

隨著研究的深入，遷移學(xué)習(xí)的策略越來(lái)越多，也取得了不小的進(jìn)展。第四范式首席科學(xué)家楊強(qiáng)曾在一次演講中介紹，將機(jī)器學(xué)習(xí)的目標(biāo)問(wèn)題“打散”，即把問(wèn)題的結(jié)構(gòu)和內(nèi)容分離開(kāi)，會(huì)發(fā)現(xiàn)不同問(wèn)題之間的共性。一篇發(fā)表在《科學(xué)》雜志上的文章顯示，將手寫字體識(shí)別上的結(jié)構(gòu)和手寫方式區(qū)分開(kāi)之后，結(jié)構(gòu)的學(xué)習(xí)采用單個(gè)數(shù)據(jù)就能訓(xùn)練。此外，層次化的系統(tǒng)更容易幫助構(gòu)建機(jī)器學(xué)習(xí)的遷移;分階段地從已訓(xùn)練領(lǐng)域到新領(lǐng)域的多步傳導(dǎo)式遷移也被證明是適用的策略。

可見(jiàn)，“遷移大法”的原則是在實(shí)現(xiàn)由A領(lǐng)域向B領(lǐng)域的遷移時(shí)，盡量“平滑”地推動(dòng)——兩個(gè)域的表征要盡可能相似，或者通過(guò)一些操作增加兩個(gè)域表征的相似性，甚至創(chuàng)建出“通用”的表征。例如ImageNet花費(fèi)了多年，用數(shù)千個(gè)小時(shí)來(lái)創(chuàng)建，“基于ImageNet數(shù)據(jù)集的圖像識(shí)別深度神經(jīng)網(wǎng)絡(luò)模型，經(jīng)常被用來(lái)作為圖像特征抽取，應(yīng)用到其他圖像任務(wù)。”莫瑜說(shuō)。一篇名為《基于深度學(xué)習(xí)和遷移學(xué)習(xí)的識(shí)花實(shí)踐》的文章進(jìn)行了類似“百度經(jīng)驗(yàn)”的分享，就是基于ImageNet數(shù)據(jù)集，示范如何將一個(gè)原來(lái)只能識(shí)別花的圖像的深度卷積網(wǎng)絡(luò)，遷移到識(shí)別花朵類型、具體品種的新任務(wù)上。通過(guò)“抽取圖像特征”“準(zhǔn)備訓(xùn)練集，驗(yàn)證集和測(cè)試集”“訓(xùn)練網(wǎng)絡(luò)”等步驟，這一“遷移”得到了88%的識(shí)別正確率，計(jì)算時(shí)間只用大概半小時(shí)，比完成從零開(kāi)始重新建模快很多。

歷久彌新：或成機(jī)器學(xué)習(xí)商業(yè)新驅(qū)力

事實(shí)上，遷移學(xué)習(xí)和人工智能一樣并不是新概念，在近幾年又恢復(fù)了研究熱度。2016年，前百度首席科學(xué)家吳恩達(dá)曾表示，遷移學(xué)習(xí)將會(huì)是繼監(jiān)督學(xué)習(xí)之后的下一個(gè)機(jī)器學(xué)習(xí)商業(yè)成功的驅(qū)動(dòng)力。楊強(qiáng)也認(rèn)為，機(jī)器學(xué)習(xí)的明天是在小數(shù)據(jù)、個(gè)性化、可靠性上，這取決于遷移學(xué)習(xí)的發(fā)展。

國(guó)際巨頭也在著力于遷移學(xué)習(xí)的實(shí)踐，AlphaGo的開(kāi)發(fā)團(tuán)隊(duì)DeepMind在嘗試對(duì)機(jī)器人進(jìn)行遷移學(xué)習(xí)的訓(xùn)練。他們先從一只胳膊開(kāi)始——在仿真環(huán)境中訓(xùn)練一個(gè)機(jī)械臂移動(dòng)，訓(xùn)練好之后，把知識(shí)遷移到真實(shí)的機(jī)械臂上，真實(shí)的機(jī)械臂稍加訓(xùn)練可以做到和仿真一樣的效果。

谷歌通過(guò)仿真系統(tǒng)訓(xùn)練無(wú)人車駕駛，然后遷移到實(shí)際駕駛中。傳授硅谷企業(yè)課程的在線大學(xué)優(yōu)達(dá)學(xué)城也開(kāi)源了用來(lái)進(jìn)行無(wú)人駕駛汽車工程納米學(xué)位教學(xué)的模擬器，仿真更方便獲取不同類別的數(shù)據(jù)，更方便多因素并行地訓(xùn)練學(xué)習(xí)。

“我們對(duì)話機(jī)器人也有類似問(wèn)題，在一個(gè)客戶上訓(xùn)練的對(duì)話系統(tǒng)，怎么應(yīng)用到新的客戶，而不用從零開(kāi)始。”莫瑜說(shuō)，遷移學(xué)習(xí)的應(yīng)用范圍是很廣泛的。

“遷移學(xué)習(xí)大多是在解決實(shí)際問(wèn)題，AI應(yīng)用層面的內(nèi)容多一些，”荀恩東說(shuō)，“在實(shí)踐中也有各種各樣的做法，我國(guó)在AI的應(yīng)用場(chǎng)景開(kāi)發(fā)上，還是不落人后的。”

(新媒體責(zé)編：wb001)

會(huì)議報(bào)道

2025第四屆交通運(yùn)輸新業(yè)態(tài)發(fā)展大會(huì)在京成功舉辦

地方新聞

王曉東出席中國(guó)交通運(yùn)輸協(xié)會(huì)成立40周年大會(huì)并接受《人民交通》雜