奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: 日本 AI 草案提出使用方需承担部分责任

Wilson(42865)

发表于2023年10月08日 14时52分星期日
来自勇者物语

为了妥善利用生成文本和图像的生成式 AI，日本政府正推进制定面向企业等的指导方针。草案显示不仅是 AI开发商和服务提供商，使用 AI 开展业务的企业和团体也将承担一定的责任。指导方针明确了创造 AI 基础性技术的“算法开发者”、提供基于 AI 的服务和软件的“服务实施者”以及运用 AI 开展业务的企业等五大业务主体须共同担负责任和义务。草案指出，社会所追求的方向是“开发和使用 AI 是为了拓展人们的能力，使追求幸福成为可能”，“不得以企图侵犯人权、实施恐怖主义及犯罪为目的、或助长上述行为的不当输入输出方式提供或使用 AI”。

科技: AMD 如何跨过英伟达的 CUDA 护城河

Wilson(42865)

发表于2023年10月08日 11时31分星期日
来自歌剧院魅影

生成式 AI 使用的 GPU 基本上指的都是英伟达的产品。英伟达被广泛视为是一家硬件公司，但它的软件工程师数量多于硬件工程师。它对使用其软件工具（CUDA）设定了非常低的门槛，围绕其硬件构建了强大的软件护城河。完全依赖于英伟达的产品对生成式 AI 领域的众多科技公司而言并非好事，其中一大问题是英伟达的产品供不应求。部分大公司拥抱了自研 AI 芯片，而 AMD 和英特尔等也都努力进入这一市场。因为 CUDA 工具的广泛使用，即使不使用英伟达的硬件，其它公司的 GPU 和加速器仍然需要设法支持 CUDA。PyTorch 已经将用户与底层 GPU 架构分离开来，而 AMD ROCm 提供了 CUDA 的开源替代，今天跨越 CUDA 护城河可能就像使用 PyTorch 一样简单。

科技: OpenAI 探索制造自己的 AI 芯片

Wilson(42865)

发表于2023年10月07日 18时38分星期六
来自侦图机

路透援引知情人士的消息报道，OpenAI 正探索自己制造 AI 芯片，评估潜在收购目标。该公司尚未决定是否推进该计划。目前 AI 芯片主要依赖于英伟达的芯片，该公司控制着逾八成的市场份额。OpenAI 想要 AI 芯片供应的多元化。OpenAI 的聊天机器人 ChatGPT 运行成本昂贵，分析师估计每次查询的成本为 4 美分。如果 ChatGPT 的查询份额达到 Google 的十分之一，那么 OpenAI 早期阶段需要价值 481 亿美元的 GPU，后续运行每年还需要 160 亿美元的芯片。

科技: 研究显示大模型在无损压缩上能超过 PNG 和 FLAC

Wilson(42865)

发表于2023年10月01日 21时58分星期日
来自来自12个星球的敌人

Google DeepMind 和 Meta 的研究人员在预印本平台 arXiv 上发表论文《Language Modeling Is Compression》，他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。Chinchilla 70B 能将 ImageNet 图像数据库无损压缩到原始大小 43.4%，超过了 PNG 算法的 58.5%。Chinchilla 能将 LibriSpeech 音频数据集中的样本无损压缩到原始大小 16.4%，超过 FLAC 算法的 30.3%。Chinchilla 70B 主要是训练去处理文本，但它在压缩其它类型的数据集上的效果也表现优异，甚至优于专门的算法。

科技: Signal 总裁认为 AI 本质上是一种监控技术

Wilson(42865)

发表于2023年09月27日 17时54分星期三
来自消失吧！书本

AI 模型需要大数据集训练，那数据集来自何处呢？网民。AI 要快速变现，最方便的途径是什么呢？显然是监控。Signal 总裁 Meredith Whittaker 对此评论道，AI 本质上是一种监控技术。这是依赖于货币化用户数据的企业对 AI 十分热衷的一个原因。AI 有助于巩固和扩展监控商业模式。她说，当你走过一个面部识别摄像头，它配备了伪科学的情绪识别功能，它会生成你的数据，不管对错，会说你“快乐、悲伤、脾气不好或骗子”诸如此类。这些终极监控系统正在推销给有权力监控的人，如雇主和政府，其决策和预测将影响我们对资源和机会的获取。

科技: ChatGPT 支持图像和语音命令

Wilson(42865)

发表于2023年09月26日 21时25分星期二
来自空气的颜色

OpenAI 宣布 ChatGPT 的新版本能通过图像和语音与用户交流。举例来说，上传冰箱内部的照片，ChatGPT 能列出根据现有食材可制作的菜肴清单。对于语音交流，用户可选择五种不同的 ChatGPT 的合成声音，其中包括男性和女性声音。新版本将通过 ChatGPT Plus 付费服务提供给客户，该服务月费为 20 美元。语音交流则需要使用 iPhone、iPad 和 Android 设备。ChatGPT 自去年 11 月推出后吸引了数亿用户，新功能将使得 ChatGPT 能挑战 Alexa 和 Siri 等传统语音助手。

科技: 盖蒂与英伟达发布用授权图像训练的生成式 AI

Wilson(42865)

发表于2023年09月25日 23时24分星期一
来自白鸟异传

盖蒂与英伟达合作发布了 Generative AI by Getty Images，完全使用盖蒂图库的授权图像训练的生成式 AI，将该工具生产的图像商业化会受到法律保护。该工具使用了英伟达的 Edify 模型。测试显示，盖蒂 AI 工具的图像质量与 OpenAI 的 DALL-E 3 相近，优于开源图像模型 Stable Diffusion。Getty 工具对用户生成图片的类型有限制，不允许生成任何真实人名的图像。盖蒂对此表示，它无意操纵或再现现实生活的事件。

Meta 准备推出具有个性的 AI 聊天机器人

Wilson(42865)

发表于2023年09月25日 18时38分星期一
来自力量

Meta 最快将于本周在其各社交媒体应用中发布具有鲜明个性的 AI 聊天机器人，以此吸引年轻用户。AI 机器人正在内部测试，Meta 预计会在周三开始的 Meta Connect 会议上宣布首批 AI 智能体(AI agent)。这些机器人将用来推动用户的参与，不过其中一些机器人也可能拥有与生产力相关的技能，比如帮助完成编码或其他任务的能力。Meta 正计划开发几十个 AI 个性聊天机器人。该公司还在开发一款产品，让名人和创作者可以使用自己的 AI 聊天机器人与粉丝和追随者互动。

科技: 亚马逊向 Anthropic 投资最多 40 亿美元

Wilson(42865)

发表于2023年09月25日 17时46分星期一
来自原罪之战：天赐之力

亚马逊宣布向 AI 创业公司 Anthropic 投资至多 40 亿美元，推动 AI 军备竞赛升级。此前微软向 OpenAI 投资数十亿美元。作为交易的一部分，Anthropic 将用亚马逊的定制芯片构建 AI 软件，并使用亚马逊的 AWS 云计算服务。亚马逊则将整合 Anthropic 的 AI 技术。Anthropic 开发了 ChatGPT 之外另一个备受瞩目的 AI 聊天机器人 Claude 2，支持最高 100k 上下文。

科技: 芬兰囚犯帮助训练大模型

Edwards(42866)

发表于2023年09月25日 11时43分星期一
来自科玛

AI 模型需要大量“点击工人”对数据进行训练，比如教 AI 区分行人和棕榈树，或者组合描述暴力或性虐待的词语。“点击工人”通常来自低工资的南半球国家。比如 OpenAI 雇佣的一家外包公司在肯尼亚、乌干达和印度招募“点击工人”。但南半球国家懂芬兰语的很少。因此芬兰 AI 创业公司 Metroc 找到了监狱劳工帮助它训练大模型。40 多岁的女囚 Marmalade 就成为了一名“点击工人”，她的时薪为 1.54 欧元，轮班时间为 3 小时。芬兰以其开放式监狱闻名——囚犯可以在附近城镇工作或学习。但还有部分监狱是封闭式的，关押重刑犯。Marmalade 被判了 6 年，在一个终身监禁囚犯关押 12 年后可申请释放的国家，6 年是一个重刑。

科技: DeepMind 的蛋白质结构预测模型获拉斯克奖

Wilson(42865)

发表于2023年09月22日 18时18分星期五
来自风神秘抄

Google 旗下的 AI 子公司 DeepMind 研发的蛋白质结构预测模型 AlphaFold 获得了拉斯克奖的基础医学研究奖，拉斯克奖颁发三个奖项，另外两个是临床医学研究奖和医学科学特殊成就奖。Demis Hassabis 博士和 John Jumper 博士领导 AlphaFold 团队借助 AI 系统成功解决了蛋白质结构预测难题，实现了准确性和速度的巨大突破。James Fujimoto、David Huang和Eric Swanson 发明的光学相干断层扫描（OCT）技术赢得了临床医学研究奖，OCT 使医生能够迅速检测并治疗影响视力的视网膜疾病，从而拯救了数百万人的视力。医学科学特殊成就奖授予了 Piet Borst。

科技: OpenAI 宣布 DALL-E 3

Wilson(42865)

发表于2023年09月21日 16时07分星期四
来自墨水心

OpenAI 宣布了它的下一代文本图像生成模式 DALL-E 3。该公司计划 10 月份向 ChatGPT+ 和企业客户提供 DALL-E 3，提供给 API 客户的时间未定，只是表示在秋季的某个时候。OpenAI 称，DALL-E 3 改进了细节处理，此前的模型在手指的生成上会出现问题。新版本也改进了图像内文本的处理。DALL-E 3 还与 ChatGPT 紧密集成，允许 ChatGPT 根据当前对话的上下文生成图像。

科技: 亚马逊用生成式 AI 加强 Alexa 功能

Wilson(42865)

发表于2023年09月21日 14时47分星期四
来自月光狂想曲

亚马逊周三演示了其先进 AI 技术。在其中一场演示中，亚马逊设备业务主管 Dave Limp 展示了 Alexa 加强后的对话功能。在听到用户的自然请求而不是脚本化命令短语后，该语音助手推荐了电影并执行了智能家居例行程序。该语音助手的回答听起来也更自然，用语更加生动，不再是用户多年来听到的固定笑话和回答。新功能的预览版将于今年秋天在家庭现有的 Echo 和 Fire TV 产品中推出。亚马逊表示，即使是 2014 年的原版Echo扬声器也将兼容新功能。

科技: 代表乔治RR马丁的作家协会加入对 OpenAI 的侵权诉讼

Wilson(42865)

发表于2023年09月21日 11时22分星期四
来自火星棋士

代表知名作家如 John Grisham、Jonathan Franzen、George Saunders、Jodi Picault 和 George R.R. Martin 的美国作家协会周二加入了对 OpenAI 的集体诉讼，指控该公司非法使用作家们的作品训练 AI 聊天机器人 ChatGPT。除了微软支持的 OpenAI，其它 AI 公司如 Meta Platforms 和 Stability AI 也面临类似的诉讼。AI 使用大量版权作品训练之后会生成相似但有差异的内容，因此有时候它被称为是终极洗稿工具。

科技: 告诉大模型“深呼吸”能大幅提升数学得分

Wilson(42865)

发表于2023年09月20日 21时56分星期三
来自飞行中的阴影

Google DeepMind 的研究人员在预印本平台 arXiv 发表论文《Large Language Models as Optimizers》，介绍了大模型的一种优化方法：用一个大模型修饰提示，改进另一个大模型的数学能力。初步结果显示，使用“深呼吸，一步步解决问题”的提示效果最为显著，能大幅提升数学测试得分。对 Google 的 PaLM 2 大模型使用该提示，它在小学数学应用题数据集 GSM8K 中的正确率达到了 80.2%，而不使用该提示正确率只有 34%，“让我们一步步思考”提示的正确率为 71.8%。为什么会有如此惊人的变化？大模型显然不会呼吸，也不像人类那样思考和推理。它们所做的推理都源自从书籍和互联网上抓取的短语数据集。其中包括问答形式的论坛，此类论坛包含了大量“深呼吸”，“一步步思考”等短语，后面紧跟着更细致入微的推理方案。这些短语可能有助于大模型产生更好的答案。

科技: Bard 支持关联 Google 应用和服务

Wilson(42865)

发表于2023年09月19日 23时00分星期二
来自十二魔

Google 宣布它的 AI 聊天机器人 Bard 现在能关联该公司旗下的各种应用和服务。Google 针对英文版发布了 Bard Extensions。Bard 能从用户日常使用的 Gmail、Docs、Drive、Google Maps、YouTube 和 Google Flights 等工具中查找和显示相关信息，即使你所需要的信息跨越了多个应用和服务。举例来说，你准备去大峡谷旅行，可以在一次对话中要求 Bard 从 Gmail 中获取适合每个人的日期，查找实时航班和酒店信息，查看前往机场的 Google Maps 路线，观看相关的 YouTube 视频。

科技: Uber 和无人出租车都可能恶化交通

Wilson(42865)

发表于2023年09月18日 20时40分星期一
来自科玛

2010 年代，MIT 的 Senseable City 实验室利用大数据分析了打车和拼车如何让街道更干净交通更高效，它的结论是：纽约出租车队的规模能减少 40%，更多的人能花更少的钱乘更少的汽车出行，汽车拥有率能减少，停车场能腾出用于新用途。这项研究在技术上是正确的，但未考虑到人类行为的变化。汽车比步行、公交和地铁更方便更舒适，这是它受欢迎的原因。通过打车和拼车让乘车变得更便宜，人们会远离其它形式的交通。几年后这一结果在数据中凸显出来：打车出行产生了更多的交通量，二氧化碳排放量增加了 69%。无人驾驶出租车也将产生相同的结果。新的技术将会进一步恶化交通。让城市更便捷、更高效和更环保的方法不是新技术而是旧技术。公交、地铁、自行车和双腿步行比硅谷梦想的任何东西都更清洁、更便宜、更高效。与其让自动驾驶技术用于出租车，不如将其用于扩大公共交通。

科技: DeepMind 联合创始人认为 AI 的下一个阶段是交互式

Wilson(42865)

发表于2023年09月18日 14时47分星期一
来自迷宫之屋

DeepMind 联合创始人 Mustafa Suleyman 认为生成式 AI 只是一个阶段，下一个阶段是交互式 AI：机器人能通过调用其它软件和呼叫其他人来执行你为它们设置的任务。Suleyman 在 2022 年创办了 AI 公司 Inflection，从微软、英伟达、比尔盖茨和 LinkedIn 创始人 Reid Hoffman 获得了 15 亿美元的投资，今年初推出了 AI 聊天机器人 Pi，其一大特性是有礼貌。他接受采访时表示，人权原则基本上是一种权衡取舍，是一种持续的协商。我们充满了自身的偏见和盲点，所有的一切都是缓慢、低效且容易出错。他认为构建出真正反映人类集体自我的 AI 是可能的，能代表人类做出更好的权衡、更一致且更公平。他认为 AI 的第一波是分类，深度学习表明可以训练计算机对不同类型的输入数据分类。第二波是生成式 AI，第三波是交互式 AI。他长期以来一直坚信对话是未来的界面，你将与 AI 进行交流，而不是点击按钮和打字。未来 AI 将更富有主动性，这将代表着技术的巨大转变。今天的技术是静态的，它只是执行你让它执行的任务。未来的技术在采取行动上将有着某种自由度。

科技: 科技行业高管讨论 AI 未来

Wilson(42865)

发表于2023年09月14日 19时06分星期四
来自地下航线

马斯克(Elon Musk)、盖茨(Bill Gates)、扎克伯格(Mark Zuckerberg)等科技行业的高管和名人周三参加了一场闭门会议，与 60 多名美国参议员就 AI 的各种可能性和风险展开了辩论。参议员们正在考虑通过立法监管 AI 技术。马斯克警告称，AI 有可能威胁到人类。盖茨则指出，AI 可能有助于解决全球饥饿问题。非营利组织 Center for Humane Technology 负责人Tristan Harris 警告开源 AI 系统会被滥用，如 Llama 2 模型能被用于获取制造危险生物化合物的指南。扎克伯格反驳说，类似的指南本来就可以在互联网上找到。扎克伯格告诉参议员，开源“使这些工具的获得变得民主化，这有助于公平竞争，促进个人和企业创新”。

科技: Stability AI 宣布文本音乐生成模型 Audio Diffusion

Wilson(42865)

发表于2023年09月14日 15时49分星期四
来自生命之书

Stability AI 宣布了文本音乐生成模型 Audio Diffusion，允许任何人用简单的文本去生成音乐片段。Stability AI表示会在未来发布基于 Audio Diffusion 的开源模型和训练代码，允许你训练自己的音乐生成模型。Audio Diffusion 使用了音频库 AudioSparks 中超过 80 万首授权音乐训练，大约有 12 亿个参数，与最早发布的图像生成模型 Stable Diffusion 相当。Audio Diffusion 有免费和付费方案，免费版本允许每月生成 20 首最长 20 秒的音乐，付费版本提高到 500 首最长 90 秒。