一、引言
人工智能在近幾年出現(xiàn)了突飛猛進(jìn)的發(fā)展,尤其是深度學(xué)習(xí)的提出以及在多個(gè)領(lǐng)域的成功應(yīng)用,使人工智能成為當(dāng)前學(xué)術(shù)界和產(chǎn)業(yè)界的研究熱點(diǎn)之一。
如果把人工智能比作一輛轟鳴的戰(zhàn)車,那么算法和模型則扮演著“發(fā)動(dòng)機(jī)”的角色。“發(fā)動(dòng)機(jī)”的質(zhì)量在一定程度上直接影響、甚至決定了“戰(zhàn)車”最終的效力。從學(xué)術(shù)角度來看,算法和模型一直以來都是人工智能研究的重點(diǎn),涌現(xiàn)的大量成果直接推動(dòng)了人工智能技術(shù)的迭代發(fā)展。從產(chǎn)業(yè)角度來看,算法和模型是人工智能技術(shù)在生產(chǎn)實(shí)踐中真正落地、促進(jìn)產(chǎn)業(yè)發(fā)展的重要保障。
二、人工智能算法和模型發(fā)展現(xiàn)狀
人工智能算法模型經(jīng)過長期積累已覆蓋多個(gè)研究子領(lǐng)域。以機(jī)器學(xué)習(xí)為例,較為核心的算法包括最小二乘法、K近鄰算法、K均值算法、PCA分析法、梯度下降法、進(jìn)化算法等,較為核心的模型包括線性回歸、邏輯回歸、決策樹、聚類、支持向量機(jī)、前饋神經(jīng)網(wǎng)絡(luò)等。由于具備較完備的理論基礎(chǔ)和長期的推廣應(yīng)用,這些算法模型已經(jīng)成為相關(guān)問題的標(biāo)準(zhǔn)解決方案。當(dāng)前,針對(duì)這些核心算法和模型的進(jìn)一步研究和改進(jìn)也在不斷向前推進(jìn)。
人工智能在近些年的巨大突破也催生了一批“年輕的”算法和模型。以深度學(xué)習(xí)為例,新算法使得挖掘數(shù)據(jù)高層抽象特征成為可能,例如反向傳播算法等,而新模型則為解決復(fù)雜問題提供了可行路徑,例如深度神經(jīng)網(wǎng)絡(luò)、玻爾茲曼機(jī)等。這些算法模型極大簡化了傳統(tǒng)機(jī)器學(xué)習(xí)處理信息的方式,成為了計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域的主流解決方案。可以預(yù)見,人工智能領(lǐng)域的新算法和新模型將會(huì)源源不斷的涌現(xiàn),并持續(xù)改變和優(yōu)化傳統(tǒng)領(lǐng)域的工作模式。
主流算法模型庫對(duì)常見算法模型進(jìn)行了高效實(shí)現(xiàn),成為了人工智能生態(tài)中的重要一環(huán)。例如,Tensorflow框架集成了適配多種語言的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法模型,并且適用于強(qiáng)化學(xué)習(xí)和遷移學(xué)習(xí)等新領(lǐng)域,同時(shí)提供了模型管理組件,支持模型的持久化存儲(chǔ)、導(dǎo)入和導(dǎo)出。Caffe框架集成了卷積神經(jīng)網(wǎng)絡(luò)相關(guān)算法模型,擁有大量訓(xùn)練好的經(jīng)典模型以及近幾年提出的新模型(VGG、Inception、ResNet等),被廣泛應(yīng)用于工業(yè)界和學(xué)術(shù)界。CNTK框架支持多種神經(jīng)網(wǎng)絡(luò)模型,并集成了AdaGrad、RmsProp等多種優(yōu)化算法,基于微軟在人工智能領(lǐng)域研究成果,提供了細(xì)粒度的功能組件和可擴(kuò)展的模型定制化能力。Keras框架專注于深度學(xué)習(xí),不僅提供了可靈活搭配的模型模塊,還集成了Adam、批標(biāo)準(zhǔn)化、PReLU等多種優(yōu)化算法,以高度的模塊化向用戶提供簡易的模型實(shí)現(xiàn)方式。MXNet集成了大量神經(jīng)網(wǎng)絡(luò)模型,支持多語言封裝,并支持在移動(dòng)設(shè)備上運(yùn)行,目前已成為AWS的推薦深度學(xué)習(xí)框架。我國在算法模型庫的建設(shè)上也嶄露頭角。百度推出的PaddlePaddle框架提供了針對(duì)計(jì)算機(jī)視覺和自然語言處理的模型庫,集成了MobileNet、SE-ResNeXt等最新模型。騰訊、阿里等企業(yè)也在人工智能算法模型領(lǐng)域貢獻(xiàn)了大量成果。
三、算法模型庫的重要性分析
夯實(shí)人工智能基礎(chǔ),確保掌握關(guān)鍵核心技術(shù)。人工智能的原理和思想需要通過模型和算法予以展現(xiàn),人工智能研究的發(fā)展必定要基于已有的算法模型,也一定會(huì)帶來算法模型的升級(jí)更新。一個(gè)完備的算法模型庫既是對(duì)當(dāng)前算法模型研究的總結(jié)歸納,又是開拓下一個(gè)研究階段的起點(diǎn),有益于夯實(shí)我國人工智能研究的基礎(chǔ),是掌握人工智能關(guān)鍵核心技術(shù)不可或缺的一步。
推動(dòng)人工智能各領(lǐng)域研究,催化人工智能技術(shù)全面健康發(fā)展。人工智能是一個(gè)復(fù)雜交叉學(xué)科,覆蓋多個(gè)子領(lǐng)域,任何一個(gè)領(lǐng)域的研究短板都可能制約其他領(lǐng)域的進(jìn)一步發(fā)展。算法和模型是這些領(lǐng)域間為數(shù)不多的交叉點(diǎn)之一,是各領(lǐng)域開展研究的共同必備要素。一個(gè)完備的算法模型庫為各領(lǐng)域研究提供基礎(chǔ)支撐,在一定程度上彌補(bǔ)了領(lǐng)域間隔閡,實(shí)現(xiàn)了領(lǐng)域知識(shí)的交叉共享,有利于推動(dòng)人工智能技術(shù)的全面健康發(fā)展。
激發(fā)傳統(tǒng)學(xué)科研究取得突破,走出多學(xué)科交叉融合、共同發(fā)展的新路徑。人工智能提出了一套異于傳統(tǒng)學(xué)科的思維模式,利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)解決傳統(tǒng)學(xué)科中的復(fù)雜性問題成為了可能。向傳統(tǒng)學(xué)科引入人工智能方法,不斷將算法和模型應(yīng)用到研究工作中,同時(shí)吸收多學(xué)科知識(shí)來豐富和完善人工智能算法和模型,相互反饋、互相融合、共同發(fā)展,激發(fā)傳統(tǒng)學(xué)科研究走出新路子,取得新突破。
助力人工智能技術(shù)的產(chǎn)業(yè)應(yīng)用,促進(jìn)產(chǎn)業(yè)發(fā)展升級(jí)。我國的產(chǎn)業(yè)發(fā)展具有海量數(shù)據(jù)和市場規(guī)模持續(xù)增長的特征,人工智能技術(shù)也因此擁有巨大的應(yīng)用潛力和優(yōu)勢(shì)。結(jié)合產(chǎn)業(yè)特點(diǎn)建設(shè)算法模型庫,既保證人工智能技術(shù)有的放矢,也大幅降低傳統(tǒng)產(chǎn)業(yè)融合人工智能技術(shù)的門檻,是推動(dòng)人工智能在產(chǎn)業(yè)界持續(xù)廣泛深入應(yīng)用的重要保障。
四、算法模型庫建設(shè)的初步考慮
人工智能算法模型庫的建設(shè)是一個(gè)以知識(shí)為核心、研發(fā)與管控相結(jié)合的系統(tǒng)工程,可以從以下幾點(diǎn)探索開展。
統(tǒng)一規(guī)范,建立標(biāo)準(zhǔn)。算法模型庫涉及多學(xué)科、多領(lǐng)域的知識(shí)體系,不同體系的算法模型在描述、結(jié)構(gòu)、實(shí)現(xiàn)等方面均存在差異,在一定程度上阻礙了算法模型的整合。通過建立適當(dāng)?shù)臉?biāo)準(zhǔn)體系,統(tǒng)一算法模型的描述,合理約束算法模型的實(shí)現(xiàn),兼顧一致性和靈活性,從而能夠在包容開放的基礎(chǔ)上進(jìn)一步為擴(kuò)充和升級(jí)做出指導(dǎo)。
開展評(píng)測,去偽存真。人工智能的研究進(jìn)展迅速,新算法新模型不斷涌現(xiàn),以開放模式建設(shè)算法模型庫,必然會(huì)面對(duì)如何評(píng)估算法模型優(yōu)劣的問題。通過研究制定面向算法模型的評(píng)估方法,建立評(píng)估機(jī)制,跟蹤評(píng)測算法模型質(zhì)量,做到去粗取精、去偽存真,從而保證算法模型的有效性、可靠性和安全性。
推廣應(yīng)用,形成閉環(huán)。建設(shè)算法模型庫的最終目的是要服務(wù)于實(shí)際,在實(shí)踐中對(duì)算法模型進(jìn)行充分的檢驗(yàn)和驗(yàn)證是推動(dòng)算法模型進(jìn)一步發(fā)展的重要途徑。積極推進(jìn)算法模型庫在各領(lǐng)域各行業(yè)的應(yīng)用,將實(shí)際效果反饋給算法模型研究者,形成理論與實(shí)踐的反饋閉環(huán),從而在深化人工智能技術(shù)應(yīng)用的同時(shí),不斷促進(jìn)算法模型的優(yōu)化和創(chuàng)新。
五、展望
人工智能是新一輪科技革命和產(chǎn)業(yè)革命的重要驅(qū)動(dòng)力量,算法和模型是人工智能技術(shù)的知識(shí)輸出。建設(shè)完備的算法模型庫是掌握關(guān)鍵核心技術(shù)、突破科技和產(chǎn)業(yè)發(fā)展瓶頸的重要一步,具有深遠(yuǎn)意義和巨大價(jià)值。探索建立一個(gè)開放靈活、標(biāo)準(zhǔn)可控、安全優(yōu)質(zhì)的算法模型庫,是進(jìn)一步深入發(fā)展人工智能技術(shù)的必要環(huán)節(jié),也必然會(huì)在科技和產(chǎn)業(yè)發(fā)展的各個(gè)方面大展身手。