OpenAI 剛剛發布了 GPT-4

OpenAI 剛剛發布了 GPT-4

OpenAI 於今天稍早公布了GPT-4 大型語言模型,ChatGPT 更聰明了,目前有 Plus 訂閱的用戶可以先行使用,但每小時有次數上限的限制。

功能亮點:

  • 最大特色是能輸入圖片,不只能解釋還能看設計草圖生成對應網頁程式碼
  • 可同時輸入圖片和文字而生成文字解釋,情境如用來考試…
  • GPT-4「考大學」成績贏過90%考生!34項考試都名列前茅包括 Stanford 的基準測試
  • 可轉向性、更加投入扮演多種不同角色

9大重點整理

  • GPT-4 更為聰明且準確;
  • GPT-4 具備視覺輸入功能,能夠進行圖像識別;
  • GPT-4 具有更高的可塑性,能更投入地扮演各種不同角色
  • GPT-4 降低了胡言亂語的機率
  • GPT-4 在回應敏感問題上提供更優質的答案;
  • GPT-4 所提供的資料仍止於 2021 年;
  • GPT-4 優先對 ChatGPT Plus 訂閱者開放使用;
  • GPT-4 的 API 需通過候選名單申請取得;
  • GPT-4 每 1,000 個提示 Token 的費用為 0.03 美元。

GPT4 的學術測驗

GPT-4 在專業和學術能力的 benchmark 上已經達到了人類水平。例如模擬律師考試分數占所有應試者的前 10%,而 GPT-3 的測試結果為倒數 10%。

提前體驗的 2 種方法:

  • ChatGPT Plus 訂閱(可能不是所有人都有)
  • Poe 中已經整合了 GPT-4(同時整合的還有 Claude+ 這個新的 AI)
  • 需要申請加入 waitlist
  • 現在只支持純文本的請求(圖像輸入還在 alpha 階段)
  • 定價:prompt - $0.03 per 1k token, completion - $0.06 per 1k token
  • context 長度為 8192 tokens,並且提供 32768 token 的版本(價格也更貴,$0.06 & $0.12)

部分 ChatGPT Plus 的用戶已經可以體驗到 GPT-4 模型了

  1. 使用會有上限,並且根據訪問量來控制
  2. 可能會引入除 Plus 外的新的訂閱級別

API 中使用的模型是:gpt-4-0314

GPT-4 標準化考試中的表現

以下是GPT-4在許多標準化考試中的表現:BAR、LSAT、GRE、AP等。

事實上,GPT-4現在可以作為斯坦福大學的學生申請入學。人工智能的推理能力超出了想象。指數增長是最可怕的事情,對吧!

GPT-4 在各種考試中的結果

幾個接近滿分的測試項目:

  • USABO Semifinal 2020(美國生物奧林匹克競賽)
  • GRE Writing

可以看到數據大部分都是好於 GPT-3 的。

GPT-4 現在已經遠優於大部分現有的大語言模型了,包括在許多領域上達到了 state-of-the-art (SOTA) 的模型。 Benchmark 的數據 !

:point_down:

GPT-4 在不同語種上的能力表現

中文的準確度大概在 80% 左右,已經要優於 GPT-3.5 的英文表現了。

基於 GPT-4 的第一個產品:

be my eyes 目前看起來是一個幫助視力障礙人群的輔助工具,可以使用 GPT-4 的多模態能力來識別、解釋圖片中的內容。 具體介紹

開發團隊,現在可以做的第一件事就是先申請一下 GPT-4 的 API
https://openai.com/waitlist/gpt-4-api

OpenAI 官網給了一些使用的樣例

第一個可以簡單理解為就是解釋圖片中的內容。

這個例子就有點厲害了,直接通過圖片的方式就能夠總結論文

直接讓 GPT-4 基於圖片中的內容來回答對應的問題。

可以通過 system 參數的方式來定義 AI 的行為(這個在 ChatGPT 中已經支持了)

例如這個例子中就是讓 AI 使用蘇格拉底的風格來回答問題,不給出具體答案,而是提出問題來幫助學生進行獨立思考。

GPT-4 的局限性

雖然現在模型所展示出的功能非常強大,但是與前幾代的 GPT 模型存在一些類似的問題,比如生成的結果不符合事實。

在這個方面,GPT-4 的得分要比 GPT-3.5 高 40%。

GPT4可以把一張餐巾紙上的草圖變成一個功能齊全的html/css/javascript網站!
這是在現場直播中剛剛Demo的畫面, Crazy

https://twitter.com/AlphaSignalAI/status/1635747039291031553/video/1