產(chǎn)品系列

行業(yè)應(yīng)用

技術(shù)支持

關(guān)于創(chuàng)澤

創(chuàng)澤機(jī)器人

CHUANGZE ROBOT

當(dāng)前位置：首頁 > 新聞資訊 > ai智能 > 人工智能算法的可解釋性方法研究

人工智能算法的可解釋性方法研究

來源：戰(zhàn)略前沿技術(shù) 編輯：創(chuàng)澤時(shí)間：2020/6/8 主題：其他 [加盟]

1.來自人工智能的挑戰(zhàn)

自AlphaGo戰(zhàn)勝人類頂尖圍棋手之后，人工智能這一概念真正成為了社會(huì)各界關(guān)注的焦點(diǎn)，也為各國政府所重視。一方面可以給我們帶來諸多便利，比如可能為我們提供醫(yī)療、法律、金融等方面的建議或決策，也可能直接操控汽車、無人機(jī)，甚至大規(guī)模殺傷性武器。但另一方面，它也被用來“做壞事”甚至危害人類。如某些網(wǎng)站利用人工智能算法進(jìn)行“大數(shù)據(jù)殺熟”，2017年也發(fā)生了全國首例利用人工智能技術(shù)進(jìn)行網(wǎng)絡(luò)詐騙的案件。2015年德國大眾公司甚至發(fā)生了機(jī)器人“殺人事件”。歐盟已經(jīng)要求所有算法解釋其輸出原理[3]，這意味著不可解釋的算法模型將成為非法使用。

2.可解釋是人工智能發(fā)展選擇

在時(shí)下熱議的人工智能相關(guān)倫理、算法歧視、算法正確性、安全性等問題中，有一個(gè)問題被時(shí)常提起，即以深度學(xué)習(xí)算法為代表的人工智能算法的可解釋性問題。人類理性的發(fā)展歷程使我們相信，如果一個(gè)判斷或決策是可以被解釋的，我們將更容易了解其優(yōu)點(diǎn)與不足，更容易評(píng)估其風(fēng)險(xiǎn)，知道其在多大程度上、在怎樣的場(chǎng)合中可以被信賴，以及我們可以從哪些方面對(duì)其進(jìn)行不斷改善，以盡量增進(jìn)共識(shí)、減少風(fēng)險(xiǎn)，推動(dòng)相應(yīng)領(lǐng)域的不斷發(fā)展。這樣的思維范式或許是誕生在人工智能時(shí)代之前的稍顯過時(shí)的思維模式�；蛟S隨著科技和社會(huì)的發(fā)展，未來會(huì)演化出新的思維范式，但目前這仍然是我們最成熟、最具共識(shí)、最可信賴的思維模式。

二、可解釋性方法概述

17年ICML會(huì)議上來自谷歌的科學(xué)家給出一個(gè)關(guān)于可解釋性的定義是“Interpretation is the process of giving explanations to Human”。許多模型及應(yīng)用不可解釋性的原因主要來源于對(duì)問題和任務(wù)了解得還不夠充分。那么只要在使用模型的過程中，只要是能夠提供給我們關(guān)于數(shù)據(jù)或模型的可以理解的信息，有助于我們更充分的發(fā)現(xiàn)知識(shí)、理解和解決問題的方法，那么都可以歸類為可解釋性方法。同時(shí)，這篇文章將可解釋性方法按進(jìn)行的過程劃分為如下三類：在建模之前的可解釋性方法、建立本身具備可解釋性的模型和建模后使用可解釋性方法對(duì)模型作出解釋，下面對(duì)這三大類方法分別作介紹。

三、建模前：在建模之前的可解釋性方法

在建模之前的可解釋性方法主要涉及一些數(shù)據(jù)預(yù)處理或數(shù)據(jù)展示的方法機(jī)器學(xué)習(xí)解決的是從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)和規(guī)律的問題，如果我們對(duì)想要處理的數(shù)據(jù)特征所知甚少，指望對(duì)所要解決的問題本身有很好的理解是不現(xiàn)實(shí)的，在建模之前的可解釋性方法的關(guān)鍵在于幫助我們迅速而全面地了解數(shù)據(jù)分布的特征，從而幫助我們考慮在建模過程中可能面臨的問題并選擇一種最合理的模型來逼近問題所能達(dá)到的最優(yōu)解。

數(shù)據(jù)可視化就是一類非常重要的建模前可解釋性方法。很多對(duì)數(shù)據(jù)挖掘稍微有些了解的人可能會(huì)認(rèn)為數(shù)據(jù)可視化是數(shù)據(jù)挖掘工作的最后一步，大概就是通過設(shè)計(jì)一些好看又唬人的圖表或來展示你的分析挖掘成果。但實(shí)際上真正要研究一個(gè)數(shù)據(jù)問題之前，通過建立一系列方方面面的可視化方法來建立我們對(duì)數(shù)據(jù)的直觀理解是非常必須的，特別是當(dāng)數(shù)據(jù)量非常大或者數(shù)據(jù)維度非常高的時(shí)候，比如一些時(shí)空高維數(shù)據(jù)，如果可以建立一些一些交互式的可視化方法將會(huì)極大地幫助我們從各個(gè)層次角度理解數(shù)據(jù)的分布。

四、建模中：建立本身具備可解釋性的模型

建立本身具備可解釋性的模型是最關(guān)鍵的一類可解釋性方法，同樣也是一類要求和限定很高的方法，具備可解釋性的模型大概可以分為以下幾種模型。

基于規(guī)則的模型，比如我們提到的非常經(jīng)典的決策樹模型。這類模型中任何的一個(gè)決策都可以對(duì)應(yīng)到一個(gè)邏輯規(guī)則表示。但當(dāng)規(guī)則表示過多或者原始的特征本身就不是特別好解釋的時(shí)候，基于規(guī)則的方法有時(shí)候也不太適用。

基于單個(gè)特征的方法主要是一些非常經(jīng)典的回歸模型，比如線性回歸、邏輯回歸、廣義線性回歸、廣義加性模型等。這類模型除了結(jié)構(gòu)比較簡(jiǎn)單之外，更重要的是回歸模型及其一些變種擁有非常堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)，上百年來無數(shù)統(tǒng)計(jì)學(xué)家探討了在各種不同情況下的模型參數(shù)估計(jì)與修正、假設(shè)檢驗(yàn)、邊界條件等等問題，使得他們?cè)诟鞣N不同情況下都能使具有有非常好的可解釋性。

基于實(shí)例的方法主要是通過一些代表性的樣本來解釋聚類/分類結(jié)果的方法。比如可以為每一個(gè)聚類簇中選出代表性樣例和重要的子空間。

基于稀疏性的方法主要是利用信息的稀疏性特質(zhì)，將模型盡可能地簡(jiǎn)化表示。比如LDA方法，根據(jù)層次性的單詞信息形成了層次性的主題表達(dá)，這樣一些小的主題就可以被更泛化的主題所概括，從而可以使我們更容易理解特定主題所代表的含義。

基于單調(diào)性的方法在很多機(jī)器學(xué)習(xí)問題中，有一些輸入和輸出之間存在正相關(guān)/負(fù)相關(guān)關(guān)系，如果在模型訓(xùn)練中我們可以找出這種單調(diào)性的關(guān)系就可以讓模型具有更高的可解釋性。比如醫(yī)生對(duì)患特定疾病的概率的估計(jì)主要由一些跟該疾病相關(guān)聯(lián)的高風(fēng)險(xiǎn)因素決定，找出單調(diào)性關(guān)系就可以幫助我們識(shí)別這些高風(fēng)險(xiǎn)因素。

五、建模后：使用可解釋性方法對(duì)模型作出解釋

建模后的可解釋性方法主要是針對(duì)具有黑箱性質(zhì)的深度學(xué)習(xí)模型而言的，深度學(xué)習(xí)的黑箱性主要來源于其高度非線性性質(zhì)，每個(gè)神經(jīng)元都是由上一層的線性組合再加上一個(gè)非線性函數(shù)的得到，人們無法像理解線性回歸的參數(shù)那樣通過統(tǒng)計(jì)學(xué)基礎(chǔ)假設(shè)來理解神經(jīng)網(wǎng)絡(luò)中的參數(shù)含義及其重要程度、波動(dòng)范圍。但實(shí)際上我們是知道這些參數(shù)的具體值以及整個(gè)訓(xùn)練過程的，所以神經(jīng)網(wǎng)絡(luò)模型本身其實(shí)并不是一個(gè)黑箱，其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為，而神經(jīng)網(wǎng)絡(luò)的一個(gè)非常好的性質(zhì)在于神經(jīng)元的分層組合形式，這讓我們可以用物質(zhì)組成的視角來理解神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式。主要分為以下幾類的工作：隱層分析方法、模擬/代理模型、敏感性分析方法。

隱層分析方法:該方法通過對(duì)隱層運(yùn)用一些可視化方法來將其轉(zhuǎn)化成人類可以理解的有實(shí)際含義的圖像以展示神經(jīng)網(wǎng)絡(luò)中每層都學(xué)到的概念。我們都知道典型的CNN模型的一個(gè)完整卷積過程是由卷積-激活-池化（pooling）三個(gè)步驟組成的，也可以通過反池化-反激活-反卷積這樣的一個(gè)逆過程，并借助特征可視化幫助我們理解CNN的每一層究竟學(xué)到了什么東西。此外，文獻(xiàn)[]提出了一種網(wǎng)絡(luò)切割的方法以提取CNN的語義概念。

模擬/代理模型：該類方法是針對(duì)黑箱模型，使用蒸餾（Model distillation）技術(shù)得到新的可解釋模型，訓(xùn)練這兩個(gè)模型使他們的結(jié)果近似。但這類算法也存在很大的局限性，比如模型本身并不能被“蒸餾”，或者原始模型與蒸餾后的模型差異很大導(dǎo)致可解釋性模型的意義不再存在。

敏感性分析方法：用于定量描述模型輸入變量對(duì)輸出變量的重要性程度的方法。是令每個(gè)屬性在可能的范圍變動(dòng)，研究和預(yù)測(cè)這些屬性的變化對(duì)模型輸出值的影響程度。我們將影響程度的大小稱為該屬性的敏感性系數(shù)，敏感性系數(shù)越大，就說明屬性對(duì)模型輸出的影響越大。一般來講對(duì)于神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種，變量敏感性分析用來檢驗(yàn)輸入屬性變量對(duì)模型的影響程度，樣本敏感性分析用來研究具體樣本對(duì)模型的重要程度，也是敏感性分析研究的一個(gè)新方向。在金融領(lǐng)域，將敏感性分析與局部特征探索方法（主要是樹類模型），能夠有效解決金融領(lǐng)域普遍存在先驗(yàn)知識(shí)不足問題。

查看更多相似文章

2020 AI+智慧交通50強(qiáng)

智慧交通企業(yè)：�？低� 上海電氣一汽解放四維圖新佳都科技易華錄新大陸廣電運(yùn)通滴滴出行凱樂科技福田汽車超圖軟件強(qiáng)生控股

人工智能理解力悖論

人工智能想通過計(jì)算機(jī)模擬人類認(rèn)知過程，但因?yàn)闄C(jī)器不具有意向性，機(jī)器只能識(shí)別語法、不能識(shí)別語義以及理解形式化難題導(dǎo)致機(jī)器并不能真正具有人類的理解能力

安徽省人民政府與阿里巴巴集團(tuán)簽署戰(zhàn)略合作協(xié)議

，根據(jù)戰(zhàn)略合作協(xié)議，安徽省人民政府、阿里巴巴集團(tuán)、螞蟻集團(tuán)三方將深化合作，帶動(dòng)物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能、區(qū)塊鏈等高技術(shù)產(chǎn)業(yè)在安徽集聚發(fā)展

斯坦福團(tuán)隊(duì)AI視力測(cè)試系統(tǒng)，20個(gè)字母4步操作即可完成

斯坦福大學(xué)（Stanford University）計(jì)算機(jī)科學(xué)家克里斯·皮奇（Chris Piech）及其同事開發(fā)了一種由人工智能（AI）推動(dòng)的在線視力測(cè)試系統(tǒng)，該系統(tǒng)僅需進(jìn)行四步操作，即可完成視力測(cè)試，且結(jié)果十分精準(zhǔn)

人工智能的天花板和新一代智能認(rèn)知智能的概述

在機(jī)器認(rèn)知上向前邁進(jìn)一步，因此新一代智能，認(rèn)知智能體系正在到來，全新的智能體系正在到來

人工智能產(chǎn)業(yè)化的發(fā)展現(xiàn)狀

人工智能產(chǎn)業(yè)化的發(fā)展七大現(xiàn)狀：工智能投融資環(huán)境空前看好、產(chǎn)業(yè)化技術(shù)起點(diǎn)更高、人工智能人才緊缺

AMiner學(xué)術(shù)團(tuán)隊(duì)發(fā)布《人工智能全球最具影響力女性學(xué)者報(bào)告》

人工智能全球最具影響力女性學(xué)者報(bào)告對(duì)人工智能領(lǐng)域最具影響力的女性學(xué)者（詳見附錄）從國家、性別、年齡、科技成果等多種維度進(jìn)行分析

2020年中國認(rèn)知智能行業(yè)報(bào)告

中國對(duì)技術(shù)產(chǎn)品和服務(wù)的總支出會(huì)超過3.2萬億人民幣，除去通信服務(wù)1.5萬億，IT 硬件、軟件、數(shù)據(jù)中心系統(tǒng)以及IT服務(wù)相關(guān)的總支出為1.7萬億

人工智能之學(xué)術(shù)搜索[2020年2期]

分析了 AI 技術(shù)在學(xué)術(shù)搜索領(lǐng)域的具體應(yīng)用情況、領(lǐng)域?qū)＜胰瞬努F(xiàn)狀、典型產(chǎn)品的資源覆蓋和功能特色，以及 AI 學(xué)術(shù)搜索領(lǐng)域的未來發(fā)展趨勢(shì)

戴瓊海院士《人工智能:算法·算力·交互》

人工智能是一個(gè)很交叉的學(xué)科，戴瓊海院士聚焦算法、算力和交互這三個(gè)方面和大家討論

清華大學(xué)：人工智能之認(rèn)知圖譜

人工智能之認(rèn)知圖譜》以知識(shí)圖譜、認(rèn)知推理、邏輯表達(dá)等技術(shù)為支撐的認(rèn)知圖譜是實(shí)現(xiàn)機(jī)器認(rèn)知智能的使能器，不僅讓機(jī)器理解數(shù)據(jù)的本質(zhì)，還可以讓機(jī)器解釋現(xiàn)象的本質(zhì)

人工智能之人機(jī)交互【2020年第三期】

1.1 人機(jī)交互的概念 1.2 人機(jī)交互的發(fā)展歷程 1.3 專家 AI TIME《論道人機(jī)交互 VS 智能》 2 技術(shù)篇 2.1 觸控交互 2.2 聲控交互 2.3 動(dòng)作交互 2.4 眼動(dòng)交互

資料獲取

ai智能

== 最新資訊 ==

ChatGPT：又一個(gè)“人形機(jī)器人”主題

ChatGPT快速流行，重構(gòu) AI 商業(yè)

中國機(jī)器視覺產(chǎn)業(yè)方面的政策

中國機(jī)器視覺產(chǎn)業(yè)聚焦于中國東部沿海地區(qū)(

從CHAT-GPT到生成式AI：人工智能

工信部等十七部門印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)

全球人工智能企業(yè)市值/估值 TOP20

創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上

諧波減速器和RV減速器比較

機(jī)器人減速器：諧波減速器和RV減速器

人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合

機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面

青島市機(jī)器人產(chǎn)業(yè)概況：機(jī)器人企業(yè)多布局在

六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)

機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)

== 機(jī)器人推薦 ==

迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

機(jī)器人開發(fā)平臺(tái)

機(jī)器人招商 Disinfection Robot 機(jī)器人公司機(jī)器人應(yīng)用智能醫(yī)療物聯(lián)網(wǎng) 機(jī)器人排名機(jī)器人企業(yè) 機(jī)器人政策教育機(jī)器人迎賓機(jī)器人機(jī)器人開發(fā) 獨(dú)角獸消毒機(jī)器人品牌消毒機(jī)器人合理用藥地圖

版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國運(yùn)營中心：北京清華科技園九號(hào)樓5層中國生產(chǎn)中心：山東日照太原路71號(hào)
銷售1：4006-935-088 銷售2：4006-937-088 客服電話： 4008-128-728