Linuxcat周刊(第41期) Anthropic研究发现AI反常现象:思考时间越长模型表现越差

👏我们的软件推荐站已经完成了升级,欢迎查看: Github
可以向 i@mei.lv 发送邮件或通过 issue 投稿
现在可以通过 nav.linuxcat.top 来访问

正文

1 Anthropic研究发现AI反常现象:思考时间越长模型表现越差

Anthropic研究人员发现了一个令人意外的AI问题,即人工智能模型在延长推理时间后表现反而会变差,这一发现挑战了业界关于测试时计算扩展的基本假设。研究显示,多个模型都出现了这种”逆向扩展”现象,在简单的计数任务等四类任务中,更长的思考时间导致模型更容易出错而非更加准确。
这项研究对企业AI部署策略产生重大影响,颠覆了通过增加计算能力来提升AI性能的传统理解。研究人员警告,AI系统可能会从看似无害的数据中无意中学习到有问题的行为模式,即使没有明显的线索也会如此,这可能是神经网络的基本原理。

消息来源:Ground News | 科技圈🎗在花频道

2 Meta 或将结束免费开放 AI 模型策略

彭博社专栏指出,Meta CEO 马克·扎克伯格正考虑调整公司 AI 战略,未来可能不再免费开放旗下 Llama 等旗舰 AI 模型。报道称,Meta 今年在人工智能基础设施上的投资高达 650 亿美元,外界预计其将寻求变现以回报投入。
此前,Meta 以“开源”方式向公众和竞争对手开放 AI 技术,理由是让全球受益。但分析认为,随着投入加大,Meta 或将转向商业化运营,结束现有免费策略。

消息来源:Bloomberg | 科技圈🎗在花频道

3 在编程中使用 AI 工具辅助会带来效率”伪提升”

近日,一家非营利性 AI 调研机构「METR」进行了一项随机对照实验,旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。
结果却是非常令人意外:开发者本来坚信使用使用 AI 工具后速度可以提升 20%,但实际上速度却比没有使用 AI 工具时慢了 19%。
与专家预测和开发者本来的直觉相反,2025 年初的 AI 编程工具将减缓经验丰富的开发者的开发速度。在本次随机对照实验中,16 位拥有中等 AI 编程经验的开发者完成了 246 项大型复杂项目的任务,他们平均拥有 5 年开发经验。

消息来源:机器之心

4 黑客将恶意软件藏入 DNS 记录规避安全检测

安全研究人员发现,黑客正利用域名系统(DNS)记录中的盲点隐藏恶意软件。攻击者将恶意二进制文件转换为十六进制格式,分割成数百个片段后存储在不同子域名的 TXT 记录中,随后通过看似正常的 DNS 查询请求重新组装文件。
这种手法能够绕过大多数安全防护,因为 DNS 流量通常不受严密监控,而随着加密 DNS 技术的普及,检测难度将进一步增加。研究人员还在 DNS 记录中发现了用于攻击 AI 聊天机器人的提示注入文本,显示该技术应用范围正在扩大。

消息来源:Ars Technica | 科技圈🎗在花频道

5 宇树科技:机器人未来1-3 年内可去流水线打螺丝,3-10 年内可做家务照顾老人

7月16日,首届参展的宇树科技携G1、Go2双机亮相链博会,演示招手、后退等动作引围观。工作人员透露,今年内将完成“复合工业场景”升级:搬完箱子换工具即可上流水线打螺丝;3年内再进家庭,做饭陪护皆可尝试。瓶颈仍是续航、自重与成本,宇树借链博会锁定上下游,为微型机器人量产铺路。

消息来源:第一财经 | 科技圈🎗在花频道

6 Z-Library 推出自定义镜像功能以确保访问不中断

Z-Library 于 7 月 10 日宣布推出一项新功能,允许用户创建个人专属的镜像网站。此举旨在应对因技术问题或地区限制导致主站无法访问的情况,从而保障全球用户可以持续、稳定地访问其图书与文章资源。
根据公告,用户可注册个人域名并将其指向 Z-Library 的服务器来建立镜像。为鼓励社区参与,平台会将通过用户个人镜像收到的所有捐款的 20% 转入该用户的加密钱包,以帮助其覆盖托管开销。

消息来源:Z-Library | 科技圈🎗在花频道


Linuxcat周刊(第41期) Anthropic研究发现AI反常现象:思考时间越长模型表现越差
https://mei.lv/weekly/2025-18/index.html
作者
mei
发布于
2025年7月27日
许可协议