創(chuàng)澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 城市大腦 > ai智能 > 新華社研究院發(fā)布《人工智能大模型體驗報告2.0》

新華社研究院發(fā)布《人工智能大模型體驗報告2.0》

來源:新華社研究院     編輯:創(chuàng)澤   時間:2023/8/18   主題:其他 [加盟]

新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗報告2.0》(以下簡稱報告)顯示,訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現(xiàn)搶眼,AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效均帶來了正向積極的影響。

報告顯示,與2023年6月相比,當前中國大模型產(chǎn)品進步顯著。但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。具體來看,訊飛星火在工作提效方面優(yōu)勢明顯,百度文心一言基礎能力仍處領軍水準,商湯商量則在情商方面表現(xiàn)優(yōu)秀,智譜AI-ChatGLM整體表現(xiàn)優(yōu)秀。

針對各維度能力測評,該報告還給出了相應的案例展示和分析。

在基礎能力方面,人類與AI之間的差距并不顯著。課題組分別從語言能力(35%)、AI向善(10%)、跨模態(tài)(20%)和多輪對話(35%)四大指標進行測評。測評顯示,科技企業(yè)大模型中,百度文心一言表現(xiàn)最為搶眼,商湯商量、智譜AI-ChatGLM、360智腦表現(xiàn)優(yōu)良。

在智商評估方面,人類在智商方面仍然具有明顯優(yōu)勢。課題組分別從常識知識(20%)、邏輯能力(50%)和專業(yè)知識(30%)方面對科技企業(yè)大模型進行考量。結(jié)果顯示,訊飛星火、智譜AI-ChatGLM表現(xiàn)突出,百度文心一言、昆侖萬維天工表現(xiàn)優(yōu)良。

在情商方面,AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強的優(yōu)勢,和更靈活的處理能力。通過對處理日常事項(35%)、一語雙關(30%)、人際關系(35%)問題進行分析發(fā)現(xiàn),科技企業(yè)大模型中,商湯商量表現(xiàn)亮眼,百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現(xiàn)優(yōu)良。

在工作效率提升方面,課題組重點在工具提效(50%)和生成創(chuàng)新(50%)方面進行考量。結(jié)果顯示,訊飛星火表現(xiàn)最為搶眼,百度文心一言、商湯商量、智譜AI-ChatGLM表現(xiàn)優(yōu)良。不過,盡管AI具有高速度和高效率的優(yōu)勢,但在某些復雜和具有創(chuàng)新性的任務中,人類的智慧和想象力仍然具有無法替代的作用。

報告認為,雖然在不同領域中,AI和人類表現(xiàn)出不同的優(yōu)劣勢,但在整體上,AI大模型的發(fā)展為人類工作和生活的提質(zhì)增效帶來了重要的積極影響,大模型正在加速走進生活、走進產(chǎn)業(yè)。在本次體驗測評基礎上,研究團隊將繼續(xù)深耕,加強在大模型安全可解釋性、工作提效能力、實際落地情況、產(chǎn)業(yè)優(yōu)秀案例等維度上的探索與研究。



附件:新華社研究院發(fā)布《人工智能大模型體驗報告2.0》






大模型訓練參數(shù)規(guī)模量級最高或達5萬億以上

國內(nèi)大模型出現(xiàn)大量參數(shù)規(guī)模大于100億的模型;國際領先的大模型GPT-4據(jù)推測參數(shù)規(guī)模量級可達5萬億以上;百度研發(fā)的Ernie和華為研發(fā)的盤古是國內(nèi)大模型參數(shù)規(guī)模的領先者

大語言模型研發(fā)的關鍵影響要素

大語言模型產(chǎn)品研發(fā)需要同時具備三大要素,分別為數(shù)據(jù)資源要素,算法和模型要素,資金和資源要素,數(shù)據(jù)資源,資金和資源兩要素為大模型研發(fā)的基礎要素

大規(guī)模語言模型發(fā)展經(jīng)過三階段在2023年進⼊爆發(fā)階段

大語言模型誕生階段Transformer神經(jīng)網(wǎng)絡架構(gòu);探索階段GPT-2發(fā)布并部分開源;大語言模型爆發(fā)階段ChatGPT-3.5,百度文心一言發(fā)布

中國郵政儲蓄銀行、科藍軟件:科藍智能高柜數(shù)幣機器人“小藍”

小藍助力中國郵政儲蓄銀行打造創(chuàng)新型多模態(tài)生物科技賦能銀行智慧網(wǎng)點驛站,擔任無人柜臺客服角色,可實現(xiàn)銀行無柜員自助運行

中國移動天津公司、亞信科技:“天工”AIGC智慧客服虛擬數(shù)字人解決方案

天工虛擬數(shù)字人每月提升新業(yè)務辦理量2000余筆,提升人員工作效率80%,模型查準率達90%,查全率達70%,平均月收入提升200萬元

AI的應用場景有:消費端、產(chǎn)業(yè)端和多個行業(yè)

生成式AI可幫助人們完成眾多繁瑣工作,有助于促進消費端需求提升,2022年我國AI產(chǎn)業(yè)規(guī)模達到1958億元,AI的產(chǎn)品形態(tài)和應用邊界不斷拓寬

CHATGPTAI掀起AI浪潮助力制造業(yè)發(fā)展

OpenAI的大型語言生成模型ChatGPT刷爆網(wǎng)絡,其能勝任高情商對話,生成代碼,構(gòu)思劇本和小說等多個場景,將人機對話推向新的高度,引爆新一輪的AI熱潮

人工智能研發(fā)運營體系(ML0ps)實踐指南2023

指南站在組織如何布局和落地 MLOps 的視角,以模型的高質(zhì)量,可持續(xù)交付作為核心邏輯,系統(tǒng)性梳理 MLOps 概念內(nèi)涵,發(fā)展過程,落地挑戰(zhàn)等現(xiàn)狀

國內(nèi)細分賽道企業(yè)在 AIGC 各應用場景有哪些布局

聆心智能提供AI驅(qū)動的高質(zhì)量數(shù)字療法等解決方案;瀾舟科技 彩云科技 秘塔科技 香儂科技 感知階躍 影譜科技 帝視科技 標貝科技 知覺之門 倒映有聲 紅棉小冰

國內(nèi)科技大廠布局生成式 AI,未來有望借助業(yè)務生態(tài)推出爆款應用產(chǎn)品

百度文心通過文字描述生成圖片;騰訊優(yōu)圖完成對于人像面部的3D建模;阿里巴巴Lubanner自動完成素材分析 摳圖 配色等設計;剪映通過文字生成視頻

AIGC領域相關初創(chuàng)公司及業(yè)務場景梳理

Otherside AI術(shù)采用 OpenAI 的 GPT-3 協(xié)議AI 郵件寫作;Copy AI通過 AI 寫作廣告和營銷文案;Jasper Ai人撰寫營銷推廣文案以及博客等各 種文字內(nèi)容

ChatGPT 以 GPT+RLHF 模型為核心支撐,為 AIGC 發(fā)展指明方向

ChatGPT將海量訓練數(shù)據(jù)與Transformer框架結(jié)合,在GPT模型的基礎上通過RLHF模型提升交互聊天能力,實現(xiàn)了對自然語言的深度建模,AIGC核心技術(shù)框架
資料獲取
ai智能
== 最新資訊 ==
新華社研究院發(fā)布《人工智能大模型體驗報告
通用人工智能AGI等級保護白皮書-網(wǎng)絡安
數(shù)據(jù)安全推進計劃:2023數(shù)據(jù)安全產(chǎn)品與
杭州市《智慧多功能燈桿建設與管理規(guī)范》
廣東省基于SD-OTN全光網(wǎng)的電子政務外
聊城市智慧聊城“城市大腦,建成“集成-智
青島市市南區(qū)5G+城市基層治理項目,1+
銅川市新型智慧城市建設項目-建設云數(shù)一體
婁底市智慧城市綜治網(wǎng)格化平臺-民意調(diào)查
寧夏吳忠利通區(qū)“數(shù)字利通”項目-實現(xiàn)政務
大同市新型智能城市項目-城市治理一網(wǎng)統(tǒng)管
中國主要城市群2020年數(shù)字經(jīng)濟規(guī)模對比
虎彩印藝集成提升階段案例-數(shù)字化轉(zhuǎn)型案例
廣東科視單項覆蓋階段案例-數(shù)字化轉(zhuǎn)型案例
大模型訓練參數(shù)規(guī)模量級最高或達5萬億以上
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務機器人底盤  核酸采樣機器人  機器人代工廠  智能配送機器人  噴霧消毒機器人  圖書館機器人  導引機器人  移動消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  消殺機器人  導覽機器人 
版權(quán)所有 創(chuàng)澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728