OpenAI剛剛發佈了最新的GPT-4語言模型,目前在ChatGPT Plus版本上已經可以使用文本輸入功能,API則是需要加入候補名單等待消息。
GPT-4語言模型與ChatGPT究竟有什麼不同?哪些方面升級了?今天我們就來帶大家一起了解GPT-4與ChatGPT的差異。
更準確地處理文本問題
如果你已經嘗試過與Chat GPT對話,這是一款建立在GPT-3.5語言模型的AI聊天工具,它在普通對話當中都能產出語句通順、敘述自然的文本,讓人不敢相信這是AI說出的話。
但是根據OpenAI最新發佈在官網的說明:
“GPT-4 is more creative and collaborative than ever before. It can generate, edit, and iterate with users on creative and technical writing tasks, such as composing songs, writing screenplays, or learning a user’s writing style.”
意思是說,GPT-4比起GPT-3.5更具創造性與合作性,它可以與使用者一起生成創意與技術相關的內容,像是創作歌曲、編寫劇本甚至是學習使用者的寫作風格。根據官方資料,GPT-4處理文本的能力將更強大,文本輸入與輸出的量是ChatGPT的8倍,它可以處理超過25,000個單詞的文本。
此外,以往ChatGPT被詬病邏輯推理能力弱,在GPT-4中也得到了改善,官方給出的例子是讓ChatGPT及GPT-4都針對同一段內容去給出結論,找出3人都適合的會議時間:
來源:OpenAI
在這項測驗中,ChatGPT給出了錯誤的答案,而GPT-4給出了正確的推斷。其實ChatGPT與GPT-4都有能力分析出3人個別的空閒時間,證明兩者的文本分析能力是差不多的,但是在推測結果的階段,GPT-4比ChatGPT略勝一籌,由此可見GPT-4的邏輯能力是優於原版的。
支援圖像輸入
GPT-4也比ChatGPT多了圖像輸入的功能,並且能針對圖像進行分類、分析,給予說明。原版ChatGPT只接受輸入文字內容,並不支援上傳圖像,這項新功能可說是令人非常驚喜!
OpenAI在官網說明文件以及線上Demo影片都向大家演示了GPT-4在圖像解析方面的能力,除了可以說出圖片上有的元素,也可以針對使用者的提問給出答案。 更驚人的是,圖像辨識功能可以延伸到透過圖像生成HTML與Javascript的網站。在GPT-4開發者現場直播影片中他們演示了將一張網頁前端設計圖餵給GPT-4,要求它完成一個可以自動生成笑話的網站,GPT-4還真的做到了! 但是,目前圖像辨識功能依然處在研究階段,並未公開給大家使用。 來源:OpenAI_GPT-4 Developer Livestream 無論是ChatGPT或是GPT-4都是可以透過API串接到自己的應用程序上使用的。API使用者在使用時需要填寫 “系統信息”(system message),這可以用來給ChatGPT設定一個角色或方向,目的是為了限制ChatGPT在回答問題時遵循特定的風格或條件。 過去OpenAI也提到GPT-3.5對於「系統信息」沒那麼重視,即便設定了「系統信息」,ChatGPT還是有可能直接忽略。但是現在GPT-4會更加重視「系統信息」,這樣未來開發者就可以直接指定GPT-4的風格並接到自己的App中。 ChatGPT在回答問題時容易產生「幻覺」,這是因為其訓練機制是基於大量的文本數據,透過預測下一個字或下一個句子來生成文本,而這樣的訓練方式容易導致ChatGPT缺乏對現實世界的理解和推論能力,因此有時候會產生與事實不符合的答案,產生所謂的「幻覺」。好消息是GPT-4在「對抗事實性評估」(adversarial factuality evaluation)的結果比ChatGPT高出40%,意味著GPT-4比起ChatGPT的可靠度多了百分之四十。 即便如此,GPT-4依然無法避免「幻覺」發生,這也是語言模型發展的一個挑戰,如何讓模型更好地理解和推論現實世界的知識和邏輯關係,是目前研究的重點之一。 在處理英語以外的語言表現更佳 GPT-4在處理26種語言當中,有24種語言的表現都比ChatGPT和其他語言模型來更好。意味著GPT-4的應用不僅限於英語,其他語言的表現力也許也值得期待。大家不妨也試試看ChatGPT與GPT-4針對中文的處理能力是否有明顯的落差? GPT是專門處理自然語言的模型,GPT的完整名稱是基於轉換器的生成式預訓練模型(Generative Pre-training Transformer),它通過預先訓練一個大型的神經網絡模型,使其學習自然語言的統計模式和語義信息,然後再利用這個預訓練模型來進行各種任務的微調。 GPT模型會通過在預訓練模型的基礎上對部分參數進行微調,以滿足特定任務的需求。以下是針對不同任務進行訓練的例子: 📌語言生成任務:GPT模型可以用於理解輸入文本並生成文本。例如,給定一個開頭 "今天天氣很",GPT模型可以自動產生 "晴朗"、"陰天"、"雨天" 等不同的結尾。 📌文本分類任務:GPT模型可以被用於文本分類,例如情感分析。模型可以預測一段文本的情感(如正面、負面、中性),從而對文本進行分類。 📌命名實體識別任務:GPT模型可以用於識別文本中的命名實體並標記出來,例如人名、地名、時間等。 目前OpenAI公司內部已經廣泛地使用GPT-4,無論是對銷售、內容審核、程式編碼等都造成很大的影響,甚至它能夠幫助人類評估AI的輸出,也就是說,GPT-4已經可以用來評估其他AI的表現了。 Chat GPT爆紅的速度之快,讓成立至今從未發出過紅色警報的Google首次感受到威脅,就在今年2月微軟公司宣佈將Chat GPT與旗下的Bing瀏覽器結合,結果這項功能一推出就讓Bing的單日下載量超越了Google。 因此Google總裁隔天就在推特上宣佈即將推出全新對話型人工智能服務「Bard」,然而Bard尚未正式推出就引起了爭議,未來走向仍然是個謎。Meta也透露準備推出自家的語言模型「LLaMA」,並且聲稱這款語言模型將是一套「更小、性能更好」的模型,專門開放給AI研究人員。 曾經人類以為AI統領的世界不會那麼快到來,但是Chat GPT的出現向大家展現AI技術正在以驚人的速度突破革新!未來將會是AI技術的競爭,誰能夠將AI運用得越好誰就會是下一個市場贏家。 Chat GPT出現後,業界紛紛預測未來有部分職業將會被AI取代,像是:文字工作者、客服人員以及電腦程序員等。但AI並非無所不能,已經有一些使用者在測試中發現Chat GPT依然會給出一些錯誤資訊,像是把鳥類說成是哺乳類動物。 “Chat GPT不會扼殺「寫作」,但會扼殺「內容」” Medium上有一位作家,Dan Kay,發表了一篇題為「Chat GPT不會扼殺『寫作』,但會扼殺『內容』」的文章,文中提到他認為人類今天所處的互聯網世界就是由「內容」所構成的,我們每天在Google搜尋、在社交平台瀏覽都是為了獲取資訊。 無可否認Chat GPT的出現讓人類獲取資訊的方式變得更加簡單粗暴,人人都有可能成為下一個愛因斯坦。在Chat GPT推出不到半年的時間內,網路上已經開始出現許多AI生成內容(無論任何領域、媒介),未來當越來越多AI系統佔滿整個市場時,的確,也許你已經無法分辨今天看見的內容是由「人」寫的,還是由「機器人」寫的。 但是唯一可以確定的是,AI對於人類而言是一個最佳輔助工具,而不是為了「取代」,懂得善用AI的力量,才能夠在未來社會中佔有一席之地。 官方文件: https://openai.com/blog/chatgpt https://openai.com/research/gpt-4 參考資料: https://www.pentalog.com/blog/tech-trends/chatgpt-fundamentals/ https://www.makeuseof.com/openai-chatgpt-biggest-probelms/ -可操縱性更高,更能投入於不同角色
減少胡說八道的機率
什麼是GPT?超強的自然語言處理背後是什麼秘密?
Chat GPT問世讓Google陷入紅色警報(code red)?Meta緊隨其後推出語言模型「LLaMA」?
比人類更聰明的人工智慧會取代人類嗎?AI之於人類究竟是敵是友?