奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: diaspora*项目七成流量来自 AI 机器人

Wilson(42865)

发表于2025年01月01日 21时58分星期三
来自猛兽的财富

去中心化社交网络个人服务器软件 diaspora* 项目开发者披露，其论坛、维基和项目网站七成的流量来自于 AI 公司的机器人程序。开发者称，过去 60 天 diaspora* 项目的 Web 资产共收到 1130 万次请求，相当于每秒 2.19 次请求，其中 24.6% 的请求来自 OpenAI 的 gptbot 机器人爬虫，17.1% 来自亚马逊；4.3% 来自 Anthropic，2.2% 来自 Meta。两大搜索引擎 Google 和 Bing 的网络爬虫分别只占 0.14%。开发者愤怒的指出，AI 公司的爬虫不关心 robots.txt，试图索引每个页面的细微变化，会不停的切换 IP 和绕过 User Agent 字符串封锁。开发者认为这是对整个互联网的 DDoS 攻击。

科技: Mozilla 发布 Firefox AI 助手 Orbit

Wilson(42865)

发表于2024年12月31日 14时21分星期二
来自电波骑士

现代浏览器不能没有 AI 助手，至于用户需要不需要是另一回事。Mozilla 发布了 Firefox AI 助手 Orbit。Orbit 是通过扩展形式提供给 Firefox 用户，用户可选择使用，它可用于在不牺牲用户隐私的情况下帮助汇总电子邮件、文档、文章和视频。目前版本的 Orbit 使用的是托管在 Mozilla GCP 实例中的 Mistral LLM (Mistral 7B)，适用的网站包括了 Gmail、维基百科、纽约时报、YouTube 等，使用 Orbit 不需要创建账号，不会使用用户信息训练，也不会保存用户访问的网页内容。

科技: DeepSeek 称其新模型只花了 550 万美元训练

Wilson(42865)

发表于2024年12月30日 16时22分星期一
来自人猿泰山之夺命山谷

杭州深度求索（DeepSeek）上周宣布了新系列模型 DeepSeek-V3。深度求索表示，DeepSeek-V3 在知识类任务上的水平相比前代 DeepSeek-V2.5 显著提升，接近当前表现最好的模型 Anthropic 的 Claude-3.5-Sonnet-1022。在美国数学竞赛和全国高中数学联赛上，DeepSeek-V3 大幅超过了其他所有开源闭源模型。在生成速度上，DeepSeek-V3 从 20TPS 大幅提高至 60TPS。官方技术论文披露，DeepSeek-V3 模型的总训练成本为 557.6 万美元，而 GPT-4o 等模型的训练成本约为 1 亿美元。DeepSeek-V3 有 6710 亿参数，在两个月时间内用 14.8 万亿 token 的数据进行了训练。前 OpenAI 和特斯拉高管 Andrej Karpathy 称，Llama 3 4050 亿参数模型使用了 3080 万 GPU 小时训练，DeepSeek-V3 参数规模更大，但只使用了 280 万 GPU 小时训练。如果它通过了氛围检查（vibe checks），那么这将是在资源受限的情况下研究和工程方面的一次令人印象深刻的展示。

科技: OpenAI 公布转变为营利性公司的计划

Wilson(42865)

发表于2024年12月28日 23时11分星期六
来自梦海

OpenAI 公布了转变为营利性公司的计划，以更容易筹集资金。根据拟议中的计划，OpenAI 的营利性公司总部位于特拉华州，将是一家公益公司（PBC）——即除了股东价值外还会考虑社会利益。OpenAI 的原非营利组织将会在新公司持有股份，OpenAI 声称它将会成为“史上资源最丰富的非营利组织之一”。公司法教授 Ann Lipton 表示成为公益公司并不能保证公司会将其使命置于利润之上，它在法律上只要求公司董事会平衡其使命和盈利，它实际上没有真正的执行权。

科技: 微软正尝试 AI 模型多元化在 Microsoft 365 Copilot 引入其它公司的模型

Wilson(42865)

发表于2024年12月25日 23时42分星期三
来自勇者物语

OpenAI 的最大投资者和盟友微软正致力于为其 AI 产品 Microsoft 365 Copilot 引入其它公司的 AI 模型，以实现多元化并降低成本，同时减少对 OpenAI 的依赖。微软发言人对此回应称，OpenAI 仍然是该公司在前沿模型（Frontier Models）上的合作伙伴。微软表示它根据产品和体验整合来自 OpenAI 和微软的各种模型。微软旗下的代码托管平台 GitHub 已经整合了 Anthropic 和 Google 的 AI 模型。

科技: Google 合同工被要求对比 Gemini AI 和 Claude 的结果

Wilson(42865)

发表于2024年12月25日 23时14分星期三
来自冰上斯芬克斯

帮助 Google 改进 AI 模型的合同工被要求对比 Gemini AI 与竞争对手 Anthropic 公司的 Claude 模型的输出结果。科技巨头们正在竞相构建更出色的 AI 模型，模型的性能通常会与竞争对手进行比较，但主要是通过行业基准测试，而不是让合同工们费力去评估竞争对手 AI 的反应。Google Gemini AI 模型的合同工们被要求根据真实性和详细程度等指标对每个 AI 响应进行评分，每次提示有最多 30 分钟时间去判断 Gemini 和 Claude 谁的答案更好。

科技: 微软称 Edge 用户过去一年完成了百亿次 AI 聊天

Wilson(42865)

发表于2024年12月25日 22时48分星期三
来自异形：走出阴影

微软官方博客公布了 MS Edge 浏览器过去一年的一系列统计数字：用户完成了逾百亿次 AI 聊天；自动翻译了 38 万亿个字；休眠标签节省了 7 万亿 MB 内存；在 MSN 上每天浏览了逾 8 亿篇文章；使用 Drop 跨设备共享了 4600 万条消息和文件；Bing 日活用户逾 1.4 亿；移动应用屏蔽了逾 1.8 万亿个跟踪程序；Password Monitor 每月保护逾 73 亿个密码；阻止了逾 14 亿次钓鱼攻击...微软表示使用 Edge 购物功能还能省钱。根据 Statcounter 的统计，Edge 内置的 AI 聊天功能对其市场占有率贡献不多，Edge 的市场份额从 2023 年 12 月的 11.9% 提高到了 2024 年 11 月的 12.87%，增幅不到 1%。Chrome 浏览器仍然主导着市场，它从同期的 65.23% 提高到了 66.33%。

科技: 测试显示 AI 聊天机器人可能也有痴呆症

Wilson(42865)

发表于2024年12月23日 17时55分星期一
来自火星棋士

作为 BMJ 圣诞特刊的一部分，研究发现 AI 聊天机器人可能也有认知问题或痴呆症。研究人员使用蒙特利尔认知评估（MoCA）测试评估了 ChatGPT 4 和 4o（OpenAI 开发）、Claude 3.5“Sonnet”（Anthropic）和 Gemini 1 和 1.5（Google）。MoCA 测试被广泛用于检测认知障碍和痴呆症的早期症状，通常在老年人中。通过一些简短的任务和问题，它可以评估包括注意力、记忆力、语言、视觉空间技能和执行功能在内的能力。最高分数为 30 分，26 分或以上通常被认为是正常的。ChatGPT 4o 在 MoCA 测试中得分最高（26/30），其次是 ChatGPT 4 和 Claude（25/30），而 Gemini 1.0 最低（16/30）。所有聊天机器人在视觉空间技能和执行任务方面的表现都很差。在进一步的视觉空间测试中，聊天机器人无法表现出同理心，也无法准确解读复杂的视觉场景。

科技: OpenAI 新模型面临计算量和数据两大障碍

Wilson(42865)

发表于2024年12月22日 21时40分星期日
来自长颈龙的完美一天

OpenAI 本周五透露了新一代推理模型 o3 和 o3-mini，但因为新模型的计算量超出想象，它在短时间内不会提供给用户使用。o3 在 ARC-AGI 测试上的得分三倍于 o1，进步显著。ARC-AGI 测试用于衡量 AI 针对未见过的复杂数学和逻辑问题时的处理能力。OpenAI 将在明年初向部分申请者提供 o3 的访问。OpenAI 是在 2023 年 3 月推出 GPT-4 大模型，但近两年之后 GPT-5 迟迟没有亮相。它的进度滞后，何时推出以及成功与否都是未知数。OpenAI 的盟友和最大投资者微软原计划在 2024 年年中看到新模型。但新模型的多轮测试都未能达到研究人员预期的效果，每次训练都会遇到新问题。OpenAI 面临的一大问题是缺乏多元化高质量的数据，公共互联网没有足够的数据用于训练。另一个问题是人才流失，此外有二十多名高管包括首席科学家 Ilya Sutskever 和 CTO Mira Murati 都离开了公司，上周资深研究员 Alec Radford 宣布了离职。

科技: Waymo 的无人驾驶汽车是保险公司梦想中的汽车

Wilson(42865)

发表于2024年12月20日 18时17分星期五
来自火星战将

瑞士再保险公司(Swiss Re)的研究发现，相比人类司机驾驶汽车，Waymo 自主驾驶汽车的财产损失和人身伤害索赔显著减少，部分指标甚至减少了 92%。瑞士再保险公司分析了 Waymo 自主驾驶汽车行驶 2530 万英里的碰撞责任索赔，与逾 50 万起索赔和逾 2000 亿英里的人类司机数据进行了比较。结果发现 Waymo 自主驾驶汽车表现出更好的安全性，财产损失索赔少 88%，人身伤害索赔少 92%。即使相比配备辅助驾驶技术的人类驾驶汽车，Waymo 的自主驾驶汽车仍然有着显著的优势。

科技: 苹果与腾讯和字节跳动磋商在 iPhone 引入其大模型

Wilson(42865)

发表于2024年12月19日 23时52分星期四
来自王牌飞行员

由于在 iPhone 中集成百度大模型的进展不顺，苹果正与腾讯和字节跳动磋商在中国销售的 iPhone 引入这两大巨头的大模型。苹果已经开始在 iPhone 中推出 OpenAI 的 ChatGPT，但 ChatGPT 在中国不可用，而在中国推出生成式 AI 服务需要先获得政府的批准，这一监管要求迫使苹果为中国销售的 iPhone 寻找本地合作伙伴。苹果与腾讯和字节跳动之间的谈判还处于早期阶段。此前苹果一直与百度合作整合百度的大模型，但双方在很多方面都存在分歧，百度希望保留 iPhone 用户数据用于分析，而这与苹果的隐私政策相悖。

科技: 苹果与英伟达合作改进大模型文本生成速度

Wilson(42865)

发表于2024年12月19日 15时50分星期四
来自天渊

苹果工程师在官方博客上透露与英伟达合作改进了大模型生成文本的速度。苹果今年早些时候开源了 Recurrent Drafter(ReDrafter) 技术，ReDrafter 代表了一种使用大模型生成文本的新方法，速度更快，它结合了束搜索（beam search）和动态树注意力（dynamic tree attention）。苹果与英伟达合作将 ReDrafter 应用于生产中，ReDrafter 被集成到在英伟达 GPU 上运行大模型的工具 NVIDIA TensorRT-LLM 中。基准测试显示，使用 ReDrafter 能显著减少延迟，使用更少的 GPU 消耗更少的电力。

科技: GitHub Copilot 有限制的免费提供给所有用户

Wilson(42865)

发表于2024年12月19日 14时12分星期四
来自棕榈上的霜

GitHub 宣布其辅助编程助手 Copilot 免费提供给所有用户，但免费并非意味着用户可以无限制的使用，GitHub 此举还是希望用户在用惯 Copilot 之后会选择付月费。免费用户在一个月内可以使用最多 2000 次代码辅助完成以及 50 次聊天请求，支付 10 美元月费则不再有限制。

YouTube 让内容创作者选择允许其视频用于第三方 AI 训练

Wilson(42865)

发表于2024年12月17日 21时26分星期二
来自星火

科技: Google DeepMind 宣布新视频生成模型 Veo 2

Wilson(42865)

发表于2024年12月17日 16时03分星期二
来自第七元素

Google DeepMind 宣布推出下一代视频生成模型 Veo 2，支持生成最高 4K 分辨率和超过 2 分钟时长的视频，向 OpenAI 的 Sora 发起挑战。Veo 2 目前通过 Google 的实验性视频创建工具 VideoFX 提供给用户，而 VideoFX 采用邀请制度，用户需要加入一个等候名单，Google 表示本周会扩大用户数量。Veo 2 目前使用有限制，分辨率最高 720p，时长为 8 秒。相比下，Sora 支持生成最高 1080p 时长为 20 秒的视频。DeepMind 产品副总裁 Eli Collins 表示 Veo 2 未来几个月会根据用户反馈持续迭代。

科技: Ilya Sutskever 认为因缺少数据大模型的预训练将走向终结

Wilson(42865)

发表于2024年12月16日 13时58分星期一
来自霸主的影子

OpenAI 前首席科学家、Safe Superintelligence 公司联合创始人伊利亚（Ilya Sutskever）在温哥华神经信息处理系统大会（NeurIPS）上表示，虽然计算在增长，但数据却没有增长，预训练毫无疑问会结束；并预测未来的人工智能系统将能够以更类似于思考的方式逐步解决问题，具有推理能力的人工智能将更难以预测。所谓“预训练”，即使用大量未标记数据来训练人工智能模型以理解语言模式和结构的阶段。伊利亚表示，虽然计算在增长，但数据却没有增长，因为我们只有一个互联网。“我们已经达到了数据峰值，不会再有了。”他预测，下一代模型将“以一种真正的方式实现代理化（agentic）”，未来的系统除了具有自主性，还具有推理能力。

科技: 哈佛大学发布基于百万公有领域书籍的免费 AI 训练数据库

Wilson(42865)

发表于2024年12月12日 21时51分星期四
来自梦海

哈佛大学宣布发布由近百万公有领域书籍构成的免费 AI 训练数据集，但问题是哈佛还没找到公司来托管该数据集，所以该数据集尚未提供下载。数据集由哈佛新成立的 Institutional Data Initiative 创建，得到了微软和 OpenAI 的资助，包含了 Google Books 项目扫描的部分已进入公有领域的图书。该项目希望 Google 合作公开发布，但搜索巨人尚未同意托管。哈佛大学对 Google 托管持乐观态度，Google 则对此未予置评。项目执行理事 Greg Leppert 表示希望打造一个公平的竞争环境，让任何人都能访问此前只有科技巨头才有资源去汇集高质量、深度加工和精心筛选的内容库。

科技: Google 的新 AI 助手 Jules 将帮助程序员自动修 Bug

Wilson(42865)

发表于2024年12月12日 16时06分星期四
来自无敌号

Google 宣布了新一代大模型 Gemini 2.0。同时宣布的还有多个 AI Agent，其中之一是 Google Chrome 的 AI Agent Mariner，它能浏览电子表格和购物网站，代表用户采取行动。另一个 AI Agent 是一种辅助编程助手 Jules，它能识别和解释代码，同时推荐更改和 bug 修复。Google 推出编程助手并不令人意外，CEO Sundar Pichai 今年十月曾表示逾四分之一新代码是在 AI 帮助下完成的。

科技: OpenAI 发布视频生成模型 Sora

Wilson(42865)

发表于2024年12月10日 15时12分星期二
来自星尘

OpenAI 正式发布了视频生成模型 Sora。该公司还开发了一个更快的版本 Sora Turbo。OpenAI 称用户能生成分辨率最高 1080p、最长 20 秒、宽屏、垂直或方形纵横比的视频。可在自己的资源上进行扩展、重新混合和融合，或从文本生成全新内容。Sora 的故事板工具让用户能精确指定每个帧的输入。

科技: 广电总局限制 AI 魔改

Wilson(42865)

发表于2024年12月09日 19时43分星期一
来自天渊

广电总局网络视听司发布《管理提示（AI魔改）》。《管理提示》提到，近期，AI“魔改”视频以假乱真、“魔改”经典现象频发。这些视频为博流量，毫无边界亵渎经典IP，冲击传统文化认知，与原著精神内核相悖，且涉嫌构成侵权行为。对此，《管理提示》提出具体管理要求：第一，各相关省局督促辖区内短视频平台排查清理AI“魔改”影视剧的短视频，并于12月10日反馈工作情况。第二，严格落实生成式人工智能内容审核要求，举一反三，对各自平台开发的大模型或AI特效功能等进行自查，对在平台上使用、传播的各类相关技术产品严格准入和监看，对AI生成内容做出显著提示。