文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
ken:feigaobox@gmail.com
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 我不同意 (1 points, 一般) by Craynic 在 2023年09月05日10时33分 星期二 评论到 为什么说加密货币是史上最大的庞氏骗局
- 非常河里 (1 points, 一般) by Craynic 在 2023年09月04日14时35分 星期一 评论到 Valve 封杀 Dota 玩家小号
- Googleverse (1 points, 一般) by Reinhardt 在 2023年09月04日10时24分 星期一 评论到 我们正目睹 Googe 宇宙的终结
- 这是致歉? (1 points, 一般) by Craynic 在 2023年08月31日16时40分 星期四 评论到 数字广东网络公司承认其软件是基于微软开源的 VSCode
- re: (1 points, 一般) by spiiiiky 在 2023年08月25日09时12分 星期五 评论到 阿尔茨海默治病基因可能帮助祖先繁育更多后代
- (1 points, 一般) by Craynic 在 2023年08月14日18时53分 星期一 评论到 阿尔茨海默治病基因可能帮助祖先繁育更多后代
- 开倒车 (1 points, 一般) by kokerkov 在 2023年08月12日12时00分 星期六 评论到 Firefox 桌面扩展将扩大支持 Android 版本
- (1 points, 一般) by 7086945 在 2023年08月11日16时15分 星期五 评论到 研究称中国对未成年人游戏时间限制没有减少游戏沉迷
- re:智人并不需要真相 (1 points, 一般) by devfsdvyui 在 2023年08月10日11时19分 星期四 评论到 人类尚未在精神上做好准备迎接 AI 渗透的后真相世界
- 广州泳池男泳客游泳途中脱裤屙屎:) (1 points, 一般) by zagfai 在 2023年08月08日14时06分 星期二 评论到 研究发现在同伴身后游泳可减少 40% 阻力
美国联邦贸易委员会(FTC)正在调查 OpenAI 的 ChatGPT 是否因发布有关人们的虚假信息而对他们造成了伤害,意味着该款热门应用面临潜在的诉讼风险。FTC 表示,该机构对 ChatGPT 的调查重点是 OpenAI 是否“从事了与消费者受伤害的风险有关的不公平或欺骗性行为,其中包括名誉损害”。FTC 向 OpenAI 提出的一个问题是,要求该公司“详细描述其在多大程度上采取了措施来应对或降低风险,即该公司的大语言模型产品可能会生成关于真实个人的虚假、误导或诋毁性陈述的风险”。在发给 OpenAI 的民事传票中,FTC 提出了有关该公司数据安全操作的详细问题。FTC 援引了 2020 年的一起事件,当时 OpenAI 披露了一个漏洞,该漏洞可以让用户查看其他用户的聊天信息和一些与支付相关的信息。FTC 传票提出的其他问题还包括 OpenAI 的营销活动、AI 模型的训练做法以及该公司对用户个人信息的处理。
网信办等七部门发布了《生成式人工智能服务管理暂行办法》,2023 年 8 月 15 日起施行。《暂行办法》规定:
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
Google 在早些时候的年度开发者大会 Google I/O 上宣布了一款设计帮助人们更快学习的新笔记本 Project Tailwind。周三它宣布了 Project Tailwind 的正式名字 NotebookLM。Google 还没有向公众开放其使用,感兴趣的用户可加入等待名单。NotebookLM 来自 Google Labs,其核心是一个语言模型,因此名字里包含了 LM。NotebookLM 能自动生成添加的 Google Doc 文档的摘要,上传文档后用户能要求笔记本回答文档相关的各类问题,它还能帮助用户提出创新的新想法。Google 同时警告 NotebookLM 仍然可能存在大语言模型常见的“幻觉”(或者说虚构内容),因此用户需要事实核查,它会通过回复中的相关引文简化核查。
马斯克(Elon Musk)宣布成立了一家新 AI 公司 xAI,其宗旨是理解宇宙的真实性质。xAI 招募了曾在 DeepMind、OpenAI、Google 研究院、微软研究院、特斯拉和多伦多大学工作过的研究人员。xAI 在一篇官方博客文章中称,它的团队曾参与并领导了 AI 领域最重大突破的研发,其中包括 AlphaStar、AlphaCode、Inception、Minerva、GPT-3.5 和 GPT-4。马斯克曾是 OpenAI 的联合创始人,但早在 ChatGPT 火热前就已经退出。
英伟达已成为 AI 革命早期的领跑者,但大大小小的竞争对手已经在奋起直追。AMD 和英特尔等重量级企业正花费数以十亿美元计的资金扩充 AI 产品组合,另一方面初创企业正吸引那些渴望捕捉下一个潜在芯片巨头的投资者。与此同时,亚马逊和谷歌等云计算公司也在开发自己的芯片,成为这一赛道上的大块头选手。从 AI 软件架构的角度来看,英伟达的一众竞争对手或许有能力挑战英伟达。英伟达的软件是专有的,这意味着软件开发者不能自由地对其进行调整。英特尔和 AMD 提供开源的替代方案,一些客户可能会发现这种选择很有吸引力。
AI 创业公司 Anthropic 宣布了新大语言模型 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问,它同时推出了面向公众的 beta 网站 claude.ai(尚未对中国大陆开放)。Anthropic 称,Claude 2 在律考多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%;相比申请研究生院的大学生,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,数量推理得分与申请者的中位数相当。Anthropic 表示,Claude 2 的企业 API 价格与 Claude 1.3 相同。
OpenAI 今年初公布的新一代大模型 GPT-4 的技术细节泄露,它有 1.8 万亿个参数,利用了 16 个混合专家模型(mixture of experts),每个有 1110 亿个参数,每次前向传递路由经过两个专家模型。它有 550 亿个共享注意力参数,使用了包含 13 万亿 tokens 的数据集训练,tokens 不是唯一的,根据迭代次数计算为更多的 tokens。GPT-4 预训练阶段的上下文长度为 8k,32k 版本是对 8k 微调的结果。如果是在云端进行训练,以 每 A100 小时 1 美元计算,那么一次的训练成本就高达 6300 万美元。不过今天的训练成本能降至 2150 万美元。
喜剧演员 Sarah Silverman 以及两名作家 Richard Kadrey 和 Christopher Golden 向旧金山联邦法院提起集体诉讼,指控 Meta 和 OpenAI 使用受版权保护的材料训练 AI 聊天机器人。诉讼凸显了生成式 AI 工具所面临的法律风险。Silverman、Kadrey 和 Golden 指控 Meta 和 OpenAI 未经授权使用其书籍开发大语言模型。在针对 Meta 的诉讼中,原告称泄露的该公司 AI 业务信息显示他们的作品未经许可被使用。针对 OpenAI 的诉讼称,ChatGPT 生成的原告作品摘要表明它接受了受版权保护内容的训练。
在 AI 热潮下,经历数个月裁员的旧金山科技行业企业恢复了招聘。5 月份,旧金山市和毗邻的圣马特奥县(San Mateo County)科技行业新增加了 2800 个岗位。旧金山首席经济学家 Ted Egan 表示,自 2022 年底科技业大规模裁员以来,新增加的职位意味着当地恢复了 38% 的就业岗位。Egan 称,大型科技巨头的股价今年表现出色,这一趋势通常是增加招聘的领先指标。他预计大部分招聘来自 AI 行业。AI 公司如 OpenAI 和 Anthropic 都在旧金山。
旧金山的一个安全街道活动人士组成的去中心化组织发现可通过在引擎盖上放置交通锥阻止 Cruise 和 Waymo 公司的无人驾驶出租车行驶。他们鼓励其他人一起效仿。这一恶作剧被称为 Week of Cone,旨在抗议 Cruise 和 Waymo 扩大在旧金山的无人出租车服务。抗议者宣称,无人出租车并没有如 Cruise 和 Waymo 所宣称的那样减少交通堵塞和碰撞事故 ,它们反而堵住了公共汽车和紧急车辆行驶的道路。它们的汽车甚至杀死了一个人和一条狗。这些公司还和警方合作,在未经同意下对每个人进行全程录音。这些说法有点夸张,Waymo 的无人出租车并没有在旧金山造成任何人身伤害,造成人死亡的事件发生在 2018 年的亚利桑那州,一辆 Uber 自动驾驶汽车在测试时撞上了一位行人。Waymo 将抗议者的做法形容为某种破坏行为。Cruise 则表示它有良好的安全记录。
OpenAI 宣布其最新的文本生成模型 GPT-4 Generally Available,开放给付费 API 开发者使用。从现在起,所有有成功支付史的 OpenAI API 开发者都可访问 GPT-4。OpenAI 计划在月底向新开发者开放 GPT-4,基于计算的可用性逐步提高可用性限制。相比前一代的 GPT-3.5,GPT-4 可生成包括代码在内的文本,支持图像和文本输入,在不同专业和学术基准测试上的表现达到了“人类水平”。
上海 AI 实验室发布了开源模型 InternLM-7B,中文名书生·浦语大模型,包含有 70 亿参数。开发者称,“InternLM 是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。在此基础上,通过高质量的人类标注对话数据结合 RLHF 等技术,使得 InternLM 可以在与人类对话时响应复杂指令,并且表现出符合人类道德与价值观的回复。”源代码在 Apache-2.0 协议下开源,权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。
根据 Similarweb 的估计,去年 11 月底发布的 AI 聊天机器人 ChatGPT 的流量首次出现下降。ChatGPT 在去年 12 月吸引了约 2.66 亿次访问,与 Yahoo News 相近,之后 1 月份流量增长 131.6%,2 月 62.5%,3 月 55.8%,到了 4 月增长 12.6% 至 17.6 亿次,指数级增长势头开始消退。它的流量超过了 bing.com、nytimes.com 和 cnn.com,但仍然只有 google.com 的 2%。如今 6 月份的桌面和移动 ChatGPT 访问量比 5 月下降了 9.7%,独立访客人数下降了 5.7%,用户在网站上花费的时间下降了 8.5%。即便如此,ChatGPT 仍然是至今增长最快的消费者应用,其访问量排名全球前 20,远超使用 OpenAI 技术的微软搜索引擎 Bing。
UCLA 数学教授陶哲轩在个人博客以及微软网站发表文章谈论了用 GPT-4 研究数学问题。他说,GPT-4 等生成式 AI 工具的出现将改变我们对于软硬件如何发展的预期。在以对话形式使用中,GPT-4 能充当一位富有同情心的倾听者,热情的共鸣者,创意灵感之源,翻译者或教师,魔鬼代言人。它们能在很多方面帮助我们。他以及很多人都开始使用 GPT-4 撰写文章的初稿。大模型确实会向用户返回经不起推敲的无稽之谈,但它们今天能为数学家提供线索并参与决策。陶哲轩预测到 2026 年生成式 AI 将能成为数学和其它领域的研究合作者。
Google 于 7 月 1 日更新了它的隐私政策,其中包括保留权利抓取公开 Web 内容训练 AI。Google 在新版隐私政策中称,“我们可能会收集网络上可公开访问的信息或其它公共来源的信息去帮助训练 Google 的 AI 语言模型,构建产品和功能如 Google Translate、Bard 和 Cloud AI。”整个互联网正成为搜索巨人的 AI 游乐场。
Valve 发言人确认它正对使用 AI 生成内容的游戏实施限制,除非开发者能证明他们使用的 AI 模型不是用侵犯现有版权的数据训练的。Valve 发言人表示该公司的目的不是阻碍使用 AI 生成内容,它相信生成式 AI 必将创造令人兴奋的新体验。然而 AI 生成艺术存在版权方面的挑战,它受到了现有法律的约束。随着法律和政策的不断发展,它的审批流程也会不断变化。
在今年五月举行的 Build 开发者大会,微软宣布将为 Windows 11 加入 AI 辅助功能 Windows Copilot。Windows Copilot 将以一个独立的窗口展示在屏幕右侧,能根据用户的要求完成多项任务。现在,微软通过其开发版本(Dev Channel)向测试者(Windows Insiders)提供了 Windows Copilot 预览版。首个预览版的重心是集成 UI 体验,未来的版本会逐步加入额外的功能。要测试 Windows Copilot,用户需要运行 Windows Build 23493 及以上版本, Microsoft Edge 版本需要 115.0.1901.150 及以上。
Valve 成为最新一家拒绝 AI 生成内容的公司。一位匿名开发者递交的游戏遭到了拒绝,理由是包含 AI 生成素材。这位化名 potterharry97 的用户承认使用了文本图像开源模型 Stable Diffusion 生成了相当大一部分的游戏素材。Valve 的审核人员认为游戏素材的知识产权属于一个或多个第三方,由于 AI 生成艺术的所有权尚不清晰,因此它无法发行包含 AI 生成素材的游戏。Valve 表示它不清楚模型训练所用的数据集的版权。不过也不是所有包含 AI 生成内容的游戏都被 Valve 拒绝了,它的游戏商店 Steam 已经上架了多个包含 AI 内容的游戏。
以纽约和香港为基地的初创企业 Insilico Medicine 发布消息称,“首次由 AI 发现、设计的”治疗药已在美国和中国启动验证其疗效的二期临床试验。Insilico Medicine围绕肺系统疑难症“特发性肺纤维化(IPF)”的候选治疗药,将在美国和中国的40家机构面向 60 人开展临床试验。IPF 是肺变硬、不能顺畅呼吸的原因不明的疾病。全世界患者人数达到 300万~500 万人,之前一直没有找到疗效好的药物。Insilico Medicine 利用 AI 分析了庞大的医疗数据。找到了与 IPF 发病及进展有关的蛋白质等,作为候选治疗药筛选出了抑制这种蛋白质作用的物质。由于以往借助人工的工作变得省力,因此可以大幅削减成本和缩短时间。
WSJ 援引知情人士的消息报道,美国政府考虑对中国 AI 芯片出口实施新的限制。美国商务部可能最快在下月初采取行动,禁止英伟达和其他芯片制造商在事先未获得许可证的情况下,向中国和其他关注国家的客户出口芯片。美国去年限制英伟达向中国出口 A100 芯片,英伟达的回应是专门针对中国市场推出了性能低于限制门槛的 A800 芯片。如今美国商务部正考虑禁止在没有许可证的情况下销售 A800 芯片。