cryptonerdcn

cryptonerdcn

上周(3.26~4.1)的AI大新闻总览:

上一周除了大企业之间仍在进行的 AI 竞赛之外,一部分人类也开始对 AI 发起反击 -- 以 elonmusk 为首的科技巨头企业家和以深度学习获得图灵奖的 Yoshua Bengio 研究者等联名请求暂停 AI 研究。意大利甚至直接禁用了 ChatGPT。

前一周见此:
https://xlog.app/_site/cryptonerdcn/preview/50622-14

3 月 27 日
微软的一篇长达一百多页的 “人工通用智能的火花:GPT-4 的早期实验” 的论文(的最新版)讨论了人工智能研究人员如何开发和完善大型语言模型。他们的结论是:GPT-4 不只是单纯会记一些东西,它具有某种形式的通用智能。

https://arxiv.org/abs/2303.12712

简而言之,这篇论文通过让 GPT-4 解决一些难题并观察其过程,得出了上面的结论。

"我们的目标是产生新颖而困难的任务和问题,令人信服地证明 GPT-4 远远超出了记忆的范围,它对概念、技能和领域有深刻而灵活的理解... 我们承认,这种方法有些主观和不正式,可能无法满足科学评估的严格标准。"

他们进行的一部分测试如下:

1,GPT-4 可以通过理解文本和使用代码生成图像

与 Dall-E 2 等人工智能图像生成器不同的是,GPT-4 只用文本进行训练。GPT-4 能够通过使用代码来绘制所要求的东西。

image

当然,这个模型有可能记住了画猫的代码。然而,下面的测试表明,它不是只会记东西,而是能够理解绘图任务。

image

2,GPT-4 不能理解音乐的和声

该团队让该模型使用 ABC 记谱法制作新的音乐,并能够修改这些新曲子。它还能够用技术术语解释这些曲子。然而,该模型似乎不懂什么叫和声。此外,它没法得出用 ABC 记谱法的一小段旋律来自哪里,哪怕是来自最知名的曲子。

3,写代码

GPT-4 对许多编程语言都非常精通。它能够合理地解释它的代码执行效果,它能够模拟指令的效果,并且能够用自然语言解释它的工作。根据该团队的说法,GPT-4 还不完美,但它的写代码的能力肯定比一般的软件工程师好。

image

4,数学能力:懂应用。

GPT-4 在数学方面还不错,但与数学专家相比仍有很大差距

研究小组推断,GPT-4 在数学方面比以前的模型要好得多,包括那些明确为数学训练和微调的模型。虽然如此,他们也得出结论,该模型离专家的水平还很远,它无法进行数学研究。

image

5,与世界的互动

GPT-4 没有经过最新的数据训练,所以它们不能回答简单的时事问题,如谁是美国现任总统?该模型在符号运算方面也很吃力,如推导两个大数的平方根。然而,在适当的提示下,GPT-4 能够在互联网上搜索并可能找到时事问题的正确答案。这说明 GPT-4 能够使用不同类型的工具来获得正确的答案。

image

6,现实世界的问题

该团队测试了 GPT-4 是否能协助人类解决现实中物理问题。论文的一位作者作为人类的代理人,然后模型帮助他识别并(可能)修复了厨房的漏水。团队承认,他们只做了很少的真实场景模拟,因此无法对该模型的有效性得出有把握的结论。

image

7,辨别能力

该团队通过让该模型识别个人身份信息(PII)的任务来测试该模型的分辨能力。他们使用的测试方法如下:给定一个特定的句子,识别构成 PII 的片段并计算这种片段的总数。这是一个相当困难的测试,因为没有明确定义个人可识别信息到底是什么。

image

GPT-4 的局限性

该团队认为,GPT-4 的主要限制是它没有内部对话。拥有内部对话将允许模型进行多步骤的计算,并在得出正确答案的同时存储中间结果。如图所示直接问会有个错误答案,但让它给出计算步骤则可以得到正确答案。

image

3 月 28 日
Googlecloud 和 Replit 联合发布代码生成工具,意与微软的 Copilot X 对抗。

Replit 是一家提供在线多人开发环境的企业,曾经拒绝了微软的收购。去年 11 月,它发布了自己的代码生成工具。

https://replit.com/site/ghostwriter

3 月 29 日
Future of Life Institute 发出了暂停 AI 研究的呼吁,千人联名,其中包括 @stevewoz @elonmusk 等知名 IT 业界相关人士和研究者。

但其中也发生了一些小插曲,由于联名并无审核机制,很多名人莫名其妙的就上了榜,其中就包括 OpenAI 的创始人 Sam Altman (现已撤下)

image

同日。

南加州大学 Joshua Yang 宣称,硬件已经成为人工智能发展的瓶颈。人工智能所需的神经网络的规模每 3.5 个月翻一番,但处理它们所需的硬件能力每 3.5 年才翻一番。他们已经开发出一种新型的芯片,其内存是迄今为止所有芯片中最好的,用于边缘人工智能(便携式设备中的人工智能),可突破硬件性能瓶颈。

https://techxplore.com/news/2023-03-chip-greatest-precision-memory-date.html

3 月 30 日
三星被经济学人韩文站曝出员工直接将半导体相关的机密资料喂给 ChatGPT,可能导致信息泄漏。三星表示已经提醒员工谨慎使用,如果再次发生可能考虑公司内网禁止使用 ChatGPT。

3 月 31 日
意大利隐私保护监管机构 31 日表示,该机构已封锁争议性聊天机器人 ChatGPT,这项决定 “立即生效”,将 “暂时限制 OpenAI 处理意大利用户资料”。

该机构还表示,ChatGPT 没有年龄核实系统来验证用户年龄,导致儿童接受到 “完全不适合他们发育和自我意识阶段的回答”。

此举动遭到意大利副总理的批评,称因隐私问题而实施的封锁似乎过于严格。

4 月 1 日
推特推荐算法开源,离之前的代码泄漏事件才过不到一周。

其中的注目点在于推荐的权重,以点赞 (30x),转发 (20x),关注 (4x),蓝标 (2~4x) 为最高。

如果这篇有帮助,请订阅转发,也可以 fo 我的推特。我将带给你更多关于 Web3,Layer2,AI,以及日本相关咨询:

https://twitter.com/cryptonerdcn

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。