文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 假新闻 (1 points, 一般) by scottcgi 在 2024年05月07日00时26分 星期二 评论到 中美 AI 芯片竞争
- 使用开源并不是因为便宜 (1 points, 一般) by Craynic 在 2024年04月18日13时19分 星期四 评论到 李彦宏声称开源大模型更昂贵
- 火星的起源找着了 (1 points, 一般) by 18611782246 在 2024年04月15日21时15分 星期一 评论到 水星可能曾和地球一样大
- (1 points, 一般) by solidot1713165490 在 2024年04月15日15时19分 星期一 评论到 美国议员呼吁禁止进口中国制造的电动车
- AI 就像拼音输入法 (1 points, 一般) by jerry 在 2024年04月10日19时48分 星期三 评论到 Google 宣布辅助编程用的开放大模型 CodeGemma
- (1 points, 一般) by solidot1563266937 在 2024年03月02日08时20分 星期六 评论到 美国总统称中国联网汽车有国家安全风险
- You either die a hero (1 points, 一般) by lot 在 2024年02月29日13时34分 星期四 评论到 空气污染与严重痴呆症相关
- 只是从众 (1 points, 一般) by scottcgi 在 2024年02月27日00时40分 星期二 评论到 共情能传播,人能通过观察环境和其他人获得或失去同情心
- 有误 (1 points, 一般) by 陈少举 在 2024年02月23日10时04分 星期五 评论到 Google 暂停了 Gemini 的图像生成功能
- (1 points, 一般) by mirus 在 2024年02月22日14时34分 星期四 评论到 美国阿拉巴马州最高法院裁决冷冻胚胎是“儿童”
英国雷丁大学的研究人员在一项小规模的研究中,创建了 33 名 AI 学生,使用 ChatGPT 参加该校本科心理学学位的模块化考试。结果显示,AI 学生的成绩平均比人类高出半级。AI 递交的论文检出率只有 6%——94% 的情况下无法被人类识别。研究报告发表在《Plos One》期刊上。研究人员测试了大学第一年、第二年和第三年的模块考试,AI 在前两年的成绩超过了人类,但第三年的成绩人类本科生更好。这与 AI 在更抽象推理中面临困难的观点一致。
过去半年深陷困境的生成式 AI 公司 Stability AI 获得了新一轮投资,稳定了局面,将加速其文本图像生成产品的开发。Stability AI 新一轮的投资者包括风险投资公司 Greycroft 和 Coatue Management,以及前 Facebook 总裁 Sean Parker 和特效公司 WETA Digital 前 CEO Prem Akkaraju,以及前 Google CEO Eric Schmidt 和知名投资人 Robert Nelsen。Sean Parker 将担任 Stability AI 的执行主席,Akkaraju 将担任 CEO。自创始人 Emad Mostaque 于 3 月离职后,Stability AI 一直没有任命新 CEO,原因是投资者对其财务状况感到不满,它的财务状况非常糟糕,甚至难以支付云服务账单。
AI 研究人员表示,Meta 和微软等科技巨头称其 AI 模型是开源模型,但它们并没有披露模型底层技术的重要信息。荷兰 Radboud 大学语言科学家 Mark Dingemanse 表示,大公司正从宣称开源模型上受益,但与此同时试图尽可能少的披露信息。这种做法被称为“open-washing”。Dingemanse 指出,相比下资源更少的小型 AI 企业则表现更令人称赞。他和同事创建了一个最开放和最不开放模型排行榜。他们评估了 40 个声称开源或开放的大模型,根据代码和训练数据的可用性、文档以及模型易访问性等 14 个参数制定了排行榜。研究人员发现, Meta 的 Llama 以及 Google DeepMind 的 Gemma 虽然自称开源或开放,但实际上只是开放权重,外部研究人员可以访问和使用预训练模型,但无法检查或定制模型,也不知道模型如何针对特定任务进行微调。根据他们的排行榜,BigScience 的 BloomZ 是最开源开放的模型,其次是 Allen Institute for AI 的 OLMo,Mistral AI 的 Mistral 7B-Instruct。
字节跳动正与博通合作开发先进 AI 芯片,以在中美关系紧张的局势下获得充足的高端芯片供应。路透社援引知情人士的消息称,双方合作开发的是 5 纳米 ASIC 定制芯片,将满足美国的出口限制,由台积电代工。知情人士表示,台积电预计不会在今年内制造这种新芯片,它尚未进入流片试产阶段。字节跳动、博通以及台积电都未对此置评。为了发展 AI,字节跳动已经囤积了大量英伟达的 GPU,其中包括了美国第一轮制裁前可采购的 A100 和 H100 GPU,以及英伟达专为中国市场定制但被第二轮制裁限制的 A800 和 H800 芯片。字节跳动去年投入了 20 亿美元采购英伟达芯片。
苹果本月初宣布与 OpenAI 合作,在其语音助手 Siri 中整合 ChatGPT。但苹果不想过于依赖单一合作伙伴,它正在与 Facebook 的母公司 Meta 商讨在 AI 方面展开类似的合作。苹果不会为这方面的合作付费,而是提供分销,让 AI 合作伙伴销售增值付费订阅版本。苹果表示,在与 ChatGPT 分享任何问题和数据之前会征求用户的许可,与 Meta 的 AI 合作应该与之类似。
俄罗斯入侵乌克兰之后在各地埋了大量地雷,清理这些地雷可能需要七百年的时间。乌克兰科学家正利用 AI 筛选出扫雷的优先地点,他们也承认部分地区可能会成为永久的“伤疤”。乌克兰使用的模型考虑了税收和财产所有权记录、农业地图、土壤肥力数据、军方和紧急服务部门记录的炸弹和炮弹落点、卫星图像中收集的信息以及对当地平民和军方的采访纪录,甚至还有气候变化模型和移动电话运营商的人口密度数据。AI 会权衡平民安全和潜在经济效益等因素,以确定特定地块的重要性和确保安全的紧迫性。
美国中佛罗里达大学的研究人员在《自然》期刊上发表论文,分析了 2,100 起涉及 SAE Level 4 级(即具有完全自主驾驶能力的汽车)自动驾驶和SAE Level 2 级辅助驾驶的事故数据,以及 35,113 起涉及人类驾驶的事故数据。研究根据事故变量对风险进行分类,如车辆是直行还是转弯,以及道路状况和天气。结果显示,SAE Level 4 级自动驾驶汽车发生中度受伤事故的可能性降低 36%,发生致命事故的可能性降低 90%。相比人类驾驶,其追尾碰撞风险降低一半,侧面碰撞降低五分之一,冲出道路的可能性降低近五分之一。研究发现,自动驾驶汽车更擅长直行,但在转弯、黎明和黄昏时表现较差。
中国 AI 创业公司 DeepSeek 的 DeepSeek Coder 成为第一个打败 GPT-4 Turbo 的开源代码模型。DeepSeek 上个月发布了混合专家模型 DeepSeek-V2,它的代码模型 DeepSeek Coder V2 就是基于该模型,它支持逾 300 种编程语言,在编程任务中超过了最先进的闭源模型如 GPT-4 Turbo、Claude 3 Opus 和 Gemini 1.5 Pro。在 MBPP+、HumanEval 和 Aider 编程测试中,DeepSeek Coder V2 获得了 76.2、90.2 和 73.7 分;在 MATH 和 GSM8K 等数学测试中,DeepSeek Coder V2 表现也类似。DeepSeek Coder V2 采用了 MIT 许可证,对商业使用不设限制,它有 160 亿和 2360 亿参数两个版本。
OpenAI 联合创始人和首席科学家 Ilya Sutskever 上个月离开公司,现在正式宣布成立新公司 Safe Superintelligence,表示将专注于打造安全的 AI。Safe Superintelligence 的联合创始人还包括了苹果 AI 前负责人 Daniel Gross 以及以在 OpenAI 训练模型闻名的 Daniel Levy。Ilya 三人在联合声明中表示,他们在致力于提高 AI 能力的同时将安全性置于优先地位,这一目标让他们的商业模式可以保证安全和进步都不受短期商业压力的影响。Sutskever 表示他花了数年时间思考安全,已经想出了一些方法,但没有提供更多细节。他表示安全的 AI 将以人类过去几百年发展的自由民主价值观为基础。
深度神经网络在很多任务中的表现与人类相当或超过人类,但它们也面临很多问题。其中之一是随着规模和能力的增长,能耗跟着大幅增长。其二是不稳定,训练数据稍有变化结果就会发生巨变,比如改变图像的一个像素就会导致 AI 指鹿为马。为了克服这些问题,Palm Pilot 联合发明人 Jeff Hawkins 联合创办的 AI 公司 Numenta 宣布了千脑计划(Thousand Brains Project)。该开源项目得到了盖茨基金会的资助,项目名称的灵感来自大脑皮层结构:它由数千个皮质柱组成,而每个皮质柱又有多层神经元。Hawkins 表示大脑有约 15 万个皮质柱,每个都是自己的学习机器。深度神经网络本质上是生成世界的单一模型,逐步处理从简单特征到复杂对象的数据。而千脑智能理论的原理与之有根本性差异,大脑皮质柱会生成世界的多幅地图,好像人的大脑实际上是数千个大脑同时并行工作。
帝国理工学院商学院、哈佛商学院和德国经济研究所的报告发现,自 2022 年 11 月 ChatGPT 推出以来,对写作和编程自由职业者的需求下降了 21%。写作、软件和应用开发等易于自动化的领域的职位空缺减少了 21%,数据录入和社交媒体后期制作减少了 13%,包括平面设计和 3D 建模的图像生成任务相关职位减少了 17%。这项被称为《Who is AI Replacing? The Impact of Generative AI on Online Freelancing Platforms》的研究分析了 2021 年 7 月到 2023 年 7 月间 61 个国家近 200 万招聘信息。它将工作分为易于自动化、体力劳动和图像生成,发现 ChatGPT 推出后这些行业的招聘信息大幅减少。
因安全和隐私争议,微软再次推迟 Windows Recall 的发布。微软原计划是随 6 月 18 日 Copilot+ PC 的发布提供 Recall 的公开预览版,现在它改变了计划,而是首先在数周后向 Windows Insider 测试者提供 Recall 的预览版。Recall 会每 5 秒截取活动窗口的快照,然后用 AI 分析和提取快照信息加入到本地的 SQLite 数据库中。Recall 快照会将用户的一举一动,其中包括敏感信息如密码保存下来,被认为存在巨大的安全隐患。
Adobe 宣布它更新了服务条款,澄清不会使用客户的作品训练 AI。此前它发送给 Creative Cloud Suite 用户的服务条款更新引发了广泛争议,该条款声称它可以使用机器学习用客户的内容训练去改进其产品和服务,以及用户体验。Adobe 数字媒体总裁 David Wadhwani 表示,新服务条款将于 6 月 18 日推出,澄清对此前条款的解读。他说,Adobe 从未用客户的内容训练生成式 AI,从未拥有客户作品的所有权,除了法律所允许的它不会访问客户的内容。
世界最大的无人驾驶汽车试验正在武汉繁忙的街道上进行。一个由 500 辆出租车组成的车队由电脑导航,在街头穿梭,通常没有安全驾驶员作为后备。运营这些出租车的百度上个月表示,将在武汉再增加 1000 辆所谓的机器人出租车。在中国,已经有至少 16 座城市允许公司在公共道路上测试无人驾驶汽车,至少有 19 家中国汽车制造商及其供应商正竞相在该领域建立全球领导地位。没有哪个国家在采取如此激进的行动。汽车咨询公司 JD Power 的调查发现,中国司机比美国人更愿意相信电脑能引导他们的汽车。6 月 4 日北京授权九家中国汽车制造商——包括蔚来、比亚迪和上汽——开始测试先进的辅助驾驶系统。至少在最初阶段,测试将在限制区域进行,而不是在公共道路上。中国汽车工程学会预测,到 2030 年,在中国销售的汽车中,20% 将是完全无人驾驶汽车,另外 70% 将采用先进的辅助驾驶技术。
苹果宣布了它的生成式 AI Apple Intelligence,将深度集成到 iOS 18、iPadOS 18 和 macOS Sequoia 中。苹果称,Apple Intelligence 的一条底层逻辑就是在设备端处理任务,所用到的模型也有很多全程仅在设备端运行。但在处理更加复杂、需求更多处理能力的请求时,将调用 Private Cloud Compute 拓展智能化能力。Private Cloud Compute 能帮助 Apple Intelligence 灵活配置和扩充计算资源,运用容量更大型的基于服务器的模型处理更复杂的请求。苹果还将 ChatGPT 整合至 iOS 18、iPadOS 18 和 macOS Sequoia,使用 GPT-4o 模型。用户无需创建账号便可免费使用,ChatGPT 订阅用户则可在绑定已有账号后直接使用付费功能。
大模型如 OpenAI 的 Chatgpt 彻底改变了 AI 与人类互动的方式,它能生成类似人类写作的流畅文本。尽管其能力令人影响深刻,但大模型也以其不准确性著称,它犯下的错误被称为 AI 幻觉。根据发表在《Ethics and Information Technology》上的一篇论文《ChatGPT is bullshit》,格拉斯哥大学 Michael Townsen Hicks 等人认为,这种不准确性应该被称为胡说八道。大模型是旨在生成类似人类文本的复杂程序,其实现方法是通过分析大量语料使用统计技术按顺序预测下一个特定单词的可能性。它们能对提示生成连贯且上下文恰当的响应。人类大脑有着丰富的目标和行为,大模型与之不同,它只有单一的目标,即生成与人类语言极为相似的文本。这也意味着它们的主要功能是复制人类语言和写作的模式和结构,不是理解或传递事实信息。AI 幻觉这一形容词暗示大模型有理解和传达真实的意图,但实际上它并没有。AI 不在乎正确性,只在乎内容是否能说服人或符合特定叙述。它们只是在胡说八道。如果生成的信息是正确的,那只是巧合罢了。
荷兰警方考虑在毒品实验室突搜中使用 AI 驱动的机器狗,以避免警员面临犯罪分子、危险化学品和爆炸的威胁。如果模拟场景的测试进展顺利,警方将在真实行动中使用。荷兰警方每周执行至少在 3-4 次毒品实验室突击搜查行动,从 2021 年开始使用波士顿动力的 Spot 用于搜查和监视。Spot 并不具有自动行驶能力,而是通过远程控制,技术的巨大进步促使荷兰警方探索 Spot 完全自主行动。
资金正在涌向生成式 AI 初创企业。该领域的“独角兽”(估值 10 亿美元以上的未上市公司)截至 4 月底达到 37 家,过去一年里翻了一番。截至 2023 年 4 月底,美国企业占据了 AI 独角兽的9成,但在最近 1 年内成为独角兽的 17 家企业中,有 10 家在美国以外设立主要基地。法国 Mistral AI 和加拿大 Cohere 就是代表性案例。在中国,最近 1 年内诞生了 5 家 AI 独角兽。李开复等人创立的中国零一万物在最近的融资中获得了 10 亿美元的企业估值。在过去一年成为独角兽的17家企业中,英伟达向 Cohere 等 7 家企业出资,Alphabet 向涉足视频生成的 Runway 等 4 家企业出资。来自中国的 5 家AI独角兽企业均获得阿里巴巴集团投资。
DuckDuckGo 推出了一项匿名 AI 聊天服务 AI Chat,允许用户匿名使用热门 AI 模型,包括 GPT-3.5、Claude 3 以及开源 Llama 3 和 Mixtral。用户不需要任何注册,可通过网站、DuckDuckGo 搜索引擎或在搜索框加入“!ai”或“!chat”快捷方式访问 AI Chat。DuckDuckGo 称,聊天是匿名的,元数据和 IP 地址被移除,防止追溯到个人。DuckDuckGo 称与 AI 模型提供商达成协议,确保在 30 天内完全删除所有保存的聊天记录,其聊天记录不会被用于训练或改进模型。
阿里巴巴发布了最新的 Qwen 2 模型。Qwen 2 包含了 5 个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。阿里巴巴称,在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。