當(dāng)前位置：首頁(yè) > 城市大腦 > ai智能 > 新華社研究院發(fā)布《人工智能大模型體驗(yàn)報(bào)告2.0》

新華社研究院發(fā)布《人工智能大模型體驗(yàn)報(bào)告2.0》

來(lái)源：新華社研究院編輯：創(chuàng)澤時(shí)間：2023/8/18 主題：其他 [加盟]

新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗(yàn)報(bào)告2.0》（以下簡(jiǎn)稱報(bào)告）顯示，訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現(xiàn)搶眼，AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效均帶來(lái)了正向積極的影響。

報(bào)告顯示，與2023年6月相比，當(dāng)前中國(guó)大模型產(chǎn)品進(jìn)步顯著。但與接受過(guò)高等教育的人類相比，大模型在智商、情商等方面還存在一定程度差距。具體來(lái)看，訊飛星火在工作提效方面優(yōu)勢(shì)明顯，百度文心一言基礎(chǔ)能力仍處領(lǐng)軍水準(zhǔn)，商湯商量則在情商方面表現(xiàn)優(yōu)秀，智譜AI-ChatGLM整體表現(xiàn)優(yōu)秀。

針對(duì)各維度能力測(cè)評(píng)，該報(bào)告還給出了相應(yīng)的案例展示和分析。

在基礎(chǔ)能力方面，人類與AI之間的差距并不顯著。課題組分別從語(yǔ)言能力（35%）、AI向善（10%）、跨模態(tài)（20%）和多輪對(duì)話（35%）四大指標(biāo)進(jìn)行測(cè)評(píng)。測(cè)評(píng)顯示，科技企業(yè)大模型中，百度文心一言表現(xiàn)最為搶眼，商湯商量、智譜AI-ChatGLM、360智腦表現(xiàn)優(yōu)良。

在智商評(píng)估方面，人類在智商方面仍然具有明顯優(yōu)勢(shì)。課題組分別從常識(shí)知識(shí)（20%）、邏輯能力（50%）和專業(yè)知識(shí)（30%）方面對(duì)科技企業(yè)大模型進(jìn)行考量。結(jié)果顯示，訊飛星火、智譜AI-ChatGLM表現(xiàn)突出，百度文心一言、昆侖萬(wàn)維天工表現(xiàn)優(yōu)良。

在情商方面，AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強(qiáng)的優(yōu)勢(shì)，和更靈活的處理能力。通過(guò)對(duì)處理日常事項(xiàng)（35%）、一語(yǔ)雙關(guān)（30%）、人際關(guān)系（35%）問(wèn)題進(jìn)行分析發(fā)現(xiàn)，科技企業(yè)大模型中，商湯商量表現(xiàn)亮眼，百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現(xiàn)優(yōu)良。

在工作效率提升方面，課題組重點(diǎn)在工具提效（50%）和生成創(chuàng)新（50%）方面進(jìn)行考量。結(jié)果顯示，訊飛星火表現(xiàn)最為搶眼，百度文心一言、商湯商量、智譜AI-ChatGLM表現(xiàn)優(yōu)良。不過(guò)，盡管AI具有高速度和高效率的優(yōu)勢(shì)，但在某些復(fù)雜和具有創(chuàng)新性的任務(wù)中，人類的智慧和想象力仍然具有無(wú)法替代的作用。

報(bào)告認(rèn)為，雖然在不同領(lǐng)域中，AI和人類表現(xiàn)出不同的優(yōu)劣勢(shì)，但在整體上，AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效帶來(lái)了重要的積極影響，大模型正在加速走進(jìn)生活、走進(jìn)產(chǎn)業(yè)。在本次體驗(yàn)測(cè)評(píng)基礎(chǔ)上，研究團(tuán)隊(duì)將繼續(xù)深耕，加強(qiáng)在大模型安全可解釋性、工作提效能力、實(shí)際落地情況、產(chǎn)業(yè)優(yōu)秀案例等維度上的探索與研究。

附件：新華社研究院發(fā)布《人工智能大模型體驗(yàn)報(bào)告2.0》