什麼是 Chat GPT-4 聊天機器人?5個驚喜3個遺憾!

OpenAI 推出的ChatGPT 測試版在一個月內就突破了一億用戶,成為科技史上最短時間用戶破億的產品,讓全球科技從業者再次因AI 的進展而興奮起來。而在僅僅三個月後,OpenAI 推出了GPT-4,這款新一代產品的進化速度非常快,展現了OpenAI 的必勝之心。
內容目錄
驚喜一:具有讀圖能力
聽說Open AI 的GPT-4 不僅能聊天,還可以讀懂圖片?!想像一下,你可以直接用一張圖片提問,它就會讀懂圖片內容,然後給你一個有邏輯的回答。比如,你傳給它一張牛奶、雞蛋、麵粉的圖片,問它「這些材料可以用來做什麼?」它可以快速地給你一系列的選項,讓你不得不佩服它的讀圖能力。
更神奇的是,GPT-4 還可以幫你寫代碼!在發布會上,Open AI 展示瞭如何讓GPT-4 幫你製作網頁。只要你在筆記本上畫出草圖,拍照傳給他對它說:「用簡短的HTML/JS 將這個草圖變成彩色的網站」,幾秒鐘之內,一個完整的網頁就可以出現。簡直是讓人嘆為觀止。
為了更好地優化圖像輸入功能,OpenAI 正在與BeMyEyes 密切合作。這家在丹麥的公司做的事情是用軟件讓視障人群與志願者遠程互動,後者做前者的眼睛,協助他們有更好的生活作息。現在接入了最新的圖像識別能力,視障人士就像有了一個「更聰明的眼睛」,也被稱為「virtual volunteer」。這個新的功能不僅在於交談能力,還提供了分析能力。以前只會告訴你眼前發生了什麼事,但是現在已經能夠判斷地面上出現的事物,並加上分析,像是「這是一顆球,而且它有可能會絆倒你。」這項功能也是GPT-4 與之前的視覺算法最大的區別,讓我們對未來的科技充滿了期待!
驚喜二:更聰明了
聽說Open AI 的GPT-4 在答題方面也變得更加可靠和有創意了?!它參加了一系列考試,並在涉及到邏輯、複雜考題上表現出色。甚至有些考試成績直接從GPT-3.5 的不及格變成了優等生,讓人驚嘆不已。在模擬律師資格考試上,它成績在前10% 左右,而GPT-3.5 的成績則是在後10% 左右。在SAT Math 考試中,它的成績也從590 分提升到了700 分,讓人感受到了它的強大實力。

驚喜三:能接收更大的信息量
同時,GPT-4 在單次問答的信息處理量上也有了大幅提升。一次性能夠輸入長達25000 單詞的問題,這意味著它可以直接幫你讀文章,並且可以處理更細微的指令。比如,你可以給它一個美國歌星Rihanna的維基百科連結,然後問它在超級杯上的表現和特別之處,GPT-4 都可以在短時間內給出詳細的答案:
Rihanna在第七屆超級杯上的表演很特別,原因有很多。第一,這是她五年多來的第一次現場表演,也是她第一次在超級杯亮相。第二,她成為第一個在懷孕期間在超級杯表演的人。這場演出本身就廣受好評,許多人稱讚她充滿活力的表演和令人印象深刻的歌聲。它也獲得了大量的觀眾,成為歷史上收視率第二高的中場秀。
驚喜四:升級速度更快
OpenAI GPT-4 進化速度變得更快了,僅花費6 個月就完成了調整和優化。與此同時,GPT-4 落地應用的速度也非常快,微軟的New Bing 已經用上了GPT-4 超過一個月。雖然GPT-4 還沒有全面開放API 接口,但是已經有了強大的數據飛輪優勢,使機器基於人類反饋的強化學習(RLHF)更快地形成。這意味著未來,我們可以看到更多更快速的落地應用。
在隨意的交談中,GPT-3.5 和GPT-4 之間的區別可能是差不多的。但當處理更複雜的任務時,它們的差異就會出現。GPT-4 比GPT-3.5 更可靠、更有創意,並且能夠處理更詳細的指令。這是一個非常重要的進步,將極大地推動人工智能的發展。
驚喜五:微軟Bing已用上GPT-4
微軟已經將GPT-4 應用到了其搜索引擎Bing 中。除此之外,微軟表明準備在GPT-4基礎上大幹一場,將ChatGPT與其業務體系整合起來。微軟的很多業務已經可以看到ChatGPT的身影,在全球最大商業軟件Office 和基建Azure 雲上落地ChatGPT,通過開放API 接口接入更多商業合作夥伴,成功將自己轉型為類似雲一樣的平台型企業,開創了研究成果轉商業的先河。還有很多其他應用也加入了GPT-4 的使用陣營,如Stripe、Duolingo、摩根士丹利和可汗學院等。這些應用將從GPT-4 中受益,提高其性能和效率:
- Stripe 宣布使用 GPT-4 掃描商業網站並向客戶支持人員提供摘要;
- 語言學習工具軟件 Duolingo 將 GPT-4 構建到新的語言學習訂閱中;
- 摩根士丹利正在創建一個由 GPT-4 驅動的系統,該系統將從公司文件中檢索信息並將其提供給金融分析師;
- 可汗學院正在利用 GPT-4 構建某種自動化導師。
OpenAI 的速度也越來越快了,相對於上一代產品,GPT-4 的進化不算“革命性”,但是各項指標上有百分之幾十的提升。除了開放給客戶使用獲得數據飛輪,他們還開源了用於自動評估AI 模型性能的框架OpenAI Evals,允許任何人報告其大模型中的缺點,以幫助指導進一步改進。其中我們舉出三個GPT-4的遺憾,不知道你們認不認同呢?
遺憾一、參數規模沒有大幅度升級
GPT-4作為一款大規模預訓練模型,參數規模一直是業界關注的重點。然而,GPT-4的參數規模並沒有大幅提升,這讓業界對其的期待有所降低。此前還有傳言稱GPT-4的參數規模將達到100萬億級,但現實卻讓人有些遺憾。
遺憾二、還不能生成圖片、視頻
另一個讓人感到失望的地方是GPT-4在多模態方面的表現。多模態是大模型的發展趨勢之一,可以實現不同模態信息之間的相互轉換。比如,用戶輸入一段文字,AI應用可以依據文字描述生成一幅畫或一個視頻。然而,GPT-4在多模態方面的突破有限,雖然可以輸入圖片內容,但輸出仍然只能是文字,而不能生成用戶最期待的圖片和視頻,這是一個巨大的遺憾。
ChatGPT在文字領域表現很強,但還不能跨越到其他模態。業界最期待的GPT-4的一個關鍵升級是多模態,但現在看來,它在這方面有待增強。
遺憾三、“發瘋”情形沒解決
GPT-4在“胡編亂造”方面仍存在問題,但OpenAI表示在捏造事實的內部測試中,GPT-4的表現比GPT-3.5高出40%。然而,GPT-4對於生成有害想法的風險也引起了OpenAI的關注。為了改進模型的安全性能,OpenAI增加了一個額外的安全獎勵信,並聘請了50多名專家對模型進行對抗性測試。雖然GPT-4相對於以前的模型已經有比較顯著的改善,但仍然存在局限性和推理錯誤。在OpenAI的內部對抗性真實性評估中,GPT-4的得分比GPT-3.5高40%。然而,在外部基準測試中,GPT-4並沒有顯著提升。除了技術性能的提升,GPT-4的商業化進展也備受關注,微軟已經將ChatGPT與其業務體系整合,並準備在GPT-4基礎上展開更大規模的商業化行動。

此次發布會中,OpenAI宣布GPT-4的技術性能得到一定程度的提升,但仍存在局限性和推理錯誤。除了技術性能的提升,GPT-4的商業化進展也備受關注。然而,隨著人工智能技術的不斷發展,我們也需要更加關注其對社會產生的影響,並採取相應的措施確保其安全性和可靠性,以避免潛在的風險和負面影響。
雖然GPT 是否通向人工智能的聖杯,通用人工智能的正確道路還不好說,但是GPT 的成功已經讓人們像當年互聯網革命一樣想利用AI “重新改造一切”。GPT-4 的及時推出,給那些渴望改造和變革的人們又打了一針強心劑。