一本久久a久久精品免费不卡,国产精品亚洲一区二区三区久久

微信咨詢

咨詢QQ

咨詢電話

公眾號

TOP

首頁 > 知識 > 科技前沿

GPT-4創(chuàng)造力有多強？專屬于智慧生物的發(fā)散思維，已超越人類！

來源：學術(shù)頭條

發(fā)布時間：2024-03-28

瀏覽次數(shù)：1224

版權(quán)歸原作者所有，如有侵權(quán)，請聯(lián)系我們

發(fā)散性思維（divergent thinking）被認為是創(chuàng)造性思維的核心指標，是人類創(chuàng)造性的體現(xiàn)。

如果 ChatGPT-4 等大模型具有超過人的發(fā)散性思維，那是不是意味著，這一專屬于智慧生物的獨特性，也被人工智能（AI）學會了？

近日，來自阿肯色大學的研究團隊在一項工作中發(fā)現(xiàn)：ChatGPT-4 在創(chuàng)造性思維測試中的表現(xiàn)，已經(jīng)超越了人類。

相關(guān)研究論文以“The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks”為題，已發(fā)表在 Nature 子刊 Scientific Reports 上。

研究團隊表示：“總體而言，即使在控制反應(yīng)的流暢性的情況下，GPT-4 在每項發(fā)散性思維任務(wù)上都比人類更具獨創(chuàng)性和復雜性。換句話說，GPT-4 在整個發(fā)散思維任務(wù)中表現(xiàn)出了更高的創(chuàng)造潛力?！?/p>

GPT-4的發(fā)散性思維，真的好過人類？

據(jù)論文描述，研究團隊測試了 151 名人類參與者和 ChatGPT-4 分別在 Alternative Uses Task、Consequences Task 和 Divergent Associations Task 三個創(chuàng)造性思維任務(wù)上的表現(xiàn)。

這些任務(wù)旨在評估個體的創(chuàng)造性思維能力，其中包括了對于日常物品的創(chuàng)新用途、對于假設(shè)情境的可能后果，以及對于詞語的語義差異的理解。這些標準有助于量化每個參與者在創(chuàng)造性思維任務(wù)中的表現(xiàn)，同時也為后續(xù)的分析提供了基礎(chǔ)。

Alternative Uses Task（替代用途任務(wù)）：這是一個經(jīng)典的創(chuàng)造力測試，要求參與者為一個常見物品想出盡可能多的不同用途。例如，參與者可能會被要求為一張紙想出多種用途。這個任務(wù)旨在衡量個體在生成獨特和多樣想法方面的能力。

Consequences Task（結(jié)果任務(wù)）：在這個任務(wù)中，參與者被要求想象一個不尋常的情況或事件，并描述可能發(fā)生的結(jié)果。例如，如果重力突然消失，會發(fā)生什么？這個任務(wù)考察的是個體在邏輯推理和想象力方面的創(chuàng)造力。

Divergent Associations Task（發(fā)散聯(lián)想任務(wù)）：這個任務(wù)要求參與者對一個給定的刺激詞（如“云”）提供盡可能多的關(guān)聯(lián)詞或想法。這個任務(wù)用于評估個體的思維靈活性和詞匯關(guān)聯(lián)能力。

測試結(jié)果顯示，在三個創(chuàng)造性思維任務(wù)中，ChatGPT-4 明顯優(yōu)于人類參與者。無論是在生成回答的數(shù)量、回答的長度還是語義差異方面，ChatGPT-4 都表現(xiàn)出了顯著的優(yōu)勢，突顯了其在創(chuàng)造性思維領(lǐng)域的潛力。

圖｜在 Alternative Uses Task 中，與人類相比，在給出相同數(shù)量生成答案的機會下，GPT-4 更能成功地提出不同的答案，并且表現(xiàn)出更高的原創(chuàng)性，但僅限于特定的提示。（來源：該論文）

圖｜在 Consequences Task 中，與人類相比，在相同數(shù)量的機會下，GPT-4 能夠更成功地想出更多不同的反應(yīng)，并且根據(jù)提示類型也表現(xiàn)出更高的原創(chuàng)性。（來源：該論文）

為了排除其他因素的影響，研究還對回答流暢性進行了控制比較。結(jié)果顯示，即使在控制了回答流暢性的情況下，ChatGPT-4 仍然表現(xiàn)出了更高的創(chuàng)造性潛力，進一步證實了其在創(chuàng)造性思維任務(wù)中的優(yōu)越性。

這一研究結(jié)果引發(fā)了關(guān)于創(chuàng)造性潛力和實際應(yīng)用的討論。雖然 ChatGPT-4 在創(chuàng)造性思維任務(wù)中表現(xiàn)出了顯著的優(yōu)勢，但研究團隊也指出了其適用性的局限性。

例如，與人類相比，ChatGPT-4 缺乏自主性和實際經(jīng)驗，其創(chuàng)造性潛力依賴于人類用戶的指導和輸入。因此，盡管 ChatGPT-4 能夠生成創(chuàng)造性的想法，但其實際應(yīng)用仍受到限制。

另外，在評估 ChatGPT-4 的創(chuàng)造性潛力時，還需要考慮其回答的適用性和實用性。盡管 ChatGPT-4 可以生成大量原創(chuàng)的想法，但這些想法是否適用于實際情境，以及是否能夠產(chǎn)生有意義的成果，仍然需要進一步的研究和驗證。

最后，研究團隊還強調(diào)了人類創(chuàng)造力的獨特性和多樣性。與 ChatGPT-4 相比，人類具有更廣泛的經(jīng)驗和情感體驗，能夠以更靈活和多樣的方式思考和創(chuàng)造。因此，在探討創(chuàng)造性潛力時，不能簡單地將 ChatGPT-4 的表現(xiàn)與人類相提并論，同時也需要更全面地考慮其在實際應(yīng)用中的適用性和局限性。

AI取代人類？還有待觀察

與之前的研究相比，此次研究的測試結(jié)果揭示了 ChatGPT-4 在多個創(chuàng)造性思維任務(wù)上的顯著優(yōu)勢，為我們提供了有關(guān)人工智能在創(chuàng)造性思維方面的新認識。

然而，這也引發(fā)了更多問題和未來的探索方向。我們需要深入研究人工智能與人類創(chuàng)造性思維之間的關(guān)系，探討如何更好地利用人工智能來促進創(chuàng)新。

未來的研究將致力于開發(fā)更智能、更全面的測量方法，以更好地理解和評估創(chuàng)造性思維的各個方面。隨著人工智能技術(shù)的不斷發(fā)展，我們對于人類創(chuàng)造力的認識也將不斷深化，為構(gòu)建更具創(chuàng)意和智能的未來奠定堅實基礎(chǔ)。

研究團隊認為，這些測試是否能完美地衡量人類的創(chuàng)造潛能并不是問題的關(guān)鍵。關(guān)鍵在于，大模型正在快速演化，并以前所未有的方式超越人類，它們是否有可能取代人類的創(chuàng)造力還有待觀察。

他們也表示，在未來，人工智能作為靈感工具、作為個人創(chuàng)造過程的輔助工具或克服固定性（fixedness）的工具，都大有可為。

參考鏈接：

https://www.nature.com/articles/s41598-024-53303-w

https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/

歡迎掃碼關(guān)注深i科普！

我們將定期推出

公益、免費、優(yōu)惠的科普活動和科普好物！