cryptonerdcn

cryptonerdcn

上周(3.26~4.1)的AI大新聞總覽:

上一周除了大企業之間仍在進行的 AI 競賽之外,一部分人類也開始對 AI 發起反擊 -- 以 elonmusk 為首的科技巨頭企業家和以深度學習獲得圖靈獎的 Yoshua Bengio 研究者等聯名請求暫停 AI 研究。意大利甚至直接禁用了 ChatGPT。

前一周見此:
https://xlog.app/_site/cryptonerdcn/preview/50622-14

3 月 27 日
微軟的一篇長達一百多頁的 “人工通用智能的火花:GPT-4 的早期實驗” 的論文(的最新版)討論了人工智能研究人員如何開發和完善大型語言模型。他們的結論是:GPT-4 不只是單純會記一些東西,它具有某種形式的通用智能。

https://arxiv.org/abs/2303.12712

簡而言之,這篇論文通過讓 GPT-4 解決一些難題並觀察其過程,得出了上面的結論。

"我們的目標是產生新穎而困難的任務和問題,令人信服地證明 GPT-4 遠遠超出了記憶的範圍,它對概念、技能和領域有深刻而靈活的理解... 我們承認,這種方法有些主觀和不正式,可能無法滿足科學評估的嚴格標準。"

他們進行的一部分測試如下:

1,GPT-4 可以通過理解文本和使用代碼生成圖像

與 Dall-E 2 等人工智能圖像生成器不同的是,GPT-4 只用文本進行訓練。GPT-4 能夠通過使用代碼來繪製所要求的東西。

image

當然,這個模型有可能記住了畫貓的代碼。然而,下面的測試表明,它不是只會記東西,而是能夠理解繪圖任務。

image

2,GPT-4 不能理解音樂的和聲

該團隊讓該模型使用 ABC 記譜法製作新的音樂,並能夠修改這些新曲子。它還能夠用技術術語解釋這些曲子。然而,該模型似乎不懂什麼叫和聲。此外,它沒法得出用 ABC 記譜法的一小段旋律來自哪裡,哪怕是來自最知名的曲子。

3,寫代碼

GPT-4 對許多編程語言都非常精通。它能夠合理地解釋它的代碼執行效果,它能夠模擬指令的效果,並且能夠用自然語言解釋它的工作。根據該團隊的說法,GPT-4 還不完美,但它的寫代碼的能力肯定比一般的軟件工程師好。

image

4,數學能力:懂應用。

GPT-4 在數學方面還不錯,但與數學專家相比仍有很大差距

研究小組推斷,GPT-4 在數學方面比以前的模型要好得多,包括那些明確為數學訓練和微調的模型。雖然如此,他們也得出結論,該模型離專家的水平還很遠,它無法進行數學研究。

image

5,與世界的互動

GPT-4 沒有經過最新的數據訓練,所以它們不能回答簡單的時事問題,如誰是美國現任總統?該模型在符號運算方面也很吃力,如推導兩個大數的平方根。然而,在適當的提示下,GPT-4 能夠在互聯網上搜索並可能找到時事問題的正確答案。這說明 GPT-4 能夠使用不同類型的工具來獲得正確的答案。

image

6,現實世界的問題

該團隊測試了 GPT-4 是否能協助人類解決現實中物理問題。論文的一位作者作為人類的代理人,然後模型幫助他識別並(可能)修復了廚房的漏水。團隊承認,他們只做了很少的真實場景模擬,因此無法對該模型的有效性得出有把握的結論。

image

7,辨識能力

該團隊通過讓該模型識別個人身份信息(PII)的任務來測試該模型的辨識能力。他們使用的測試方法如下:給定一個特定的句子,識別構成 PII 的片段並計算這種片段的總數。這是一個相當困難的測試,因為沒有明確定義個人可識別信息到底是什麼。

image

GPT-4 的局限性

該團隊認為,GPT-4 的主要限制是它沒有內部對話。擁有內部對話將允許模型進行多步驟的計算,並在得出正確答案的同時存儲中間結果。如圖所示直接問會有個錯誤答案,但讓它給出計算步驟則可以得到正確答案。

image

3 月 28 日
Googlecloud 和 Replit 聯合發布代碼生成工具,意與微軟的 Copilot X 對抗。

Replit 是一家提供在線多人開發環境的企業,曾經拒絕了微軟的收購。去年 11 月,它發布了自己的代碼生成工具。

https://replit.com/site/ghostwriter

3 月 29 日
Future of Life Institute 發出了暫停 AI 研究的呼籲,千人聯名,其中包括 @stevewoz @elonmusk 等知名 IT 業界相關人士和研究者。

但其中也發生了一些小插曲,由於聯名並無審核機制,很多名人莫名其妙的就上了榜,其中就包括 OpenAI 的創始人 Sam Altman (現已撤下)

image

同日。

南加州大學 Joshua Yang 宣稱,硬件已經成為人工智能發展的瓶頸。人工智能所需的神經網絡的規模每 3.5 個月翻一番,但處理它們所需的硬件能力每 3.5 年才翻一番。他們已經開發出一種新型的芯片,其內存是迄今為止所有芯片中最好的,用於邊緣人工智能(便攜式設備中的人工智能),可突破硬件性能瓶頸。

https://techxplore.com/news/2023-03-chip-greatest-precision-memory-date.html

3 月 30 日
三星被經濟學人韓文站曝出員工直接將半導體相關的機密資料餵給 ChatGPT,可能導致信息泄漏。三星表示已經提醒員工謹慎使用,如果再次發生可能考慮公司內網禁止使用 ChatGPT。

3 月 31 日
意大利隱私保護監管機構 31 日表示,該機構已封鎖爭議性聊天機器人 ChatGPT,這項決定 “立即生效”,將 “暫時限制 OpenAI 處理意大利用戶資料”。

該機構還表示,ChatGPT 沒有年齡核驗系統來驗證用戶年齡,導致兒童接受到 “完全不適合他們發育和自我意識階段的回答”。

此舉動遭到意大利副總理的批評,稱因隱私問題而實施的封鎖似乎過於嚴格。

4 月 1 日
推特推薦算法開源,離之前的代碼泄漏事件才過不到一周。

其中的注目點在於推薦的權重,以點贊 (30x),轉發 (20x),關注 (4x),藍標 (2~4x) 為最高。

如果這篇有幫助,請訂閱轉發,也可以 fo 我的推特。我將帶給你更多關於 Web3,Layer2,AI,以及日本相關咨詢:

https://twitter.com/cryptonerdcn

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。