solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年07月17日 23时01分 星期一
来自遥远地球之歌
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

人工智能
Wilson(42865)
发表于2023年07月17日 15时34分 星期一
来自时空折叠
一方面 ChatGPT 的流量在下降,另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据,上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了,但代价是输出质量下降了。一位用户打了一个比喻说,前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利,但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变,它将大模型分解成几个在特定领域训练的小模型,此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容,而如果用 AI 使用 AI 生成的数据集进行训练,它的质量会下降。

人工智能
Wilson(42865)
发表于2023年07月16日 22时30分 星期日
来自追光的孩子
网络犯罪分子正将生成式 AI 工具用于 Business Email Compromise (BEC) 攻击。以 OpenAI 聊天机器人 ChatGPT 为代表的生成式 AI 能生成类似人类的文本,网络罪犯可利用它自动创建高度可信的钓鱼邮件,对收件人高度定制,增加攻击的成功率。在地下黑客论坛,网络罪犯演示了利用生成式 AI 改进网络钓鱼或 BEC 攻击所用邮件的潜力。即使攻击对象使用的语言不是攻击者的母语,在生成式 AI 的帮助下攻击者将可以轻而易举的伪造可信的邮件。网络罪犯甚至创建了专门用于恶意目的的工具 WormGPT。WormGPT 是基于 2021 年开发的大模型 GPTJ,它的功能包括无限字符支持、聊天记忆保留和代码格式化等。开发者声称 WormGPT 使用了恶意程序相关的数据进行训练。

人工智能
Wilson(42865)
发表于2023年07月16日 21时45分 星期日
来自沉船岛
从互联网诞生之初,垃圾信息就是使用者面临的一大难题。如何从无数信息中寻找到有用信息?搜索引擎的需求由此而来。早期的垃圾信息都是由人工生成,因此其数量受制于人类工作的局限性。但随着生成式 AI 的到来,大批量生成将使得垃圾信息的量级远超过去。五月初,新闻评级公司 NewsGuard 发现有 49 个假新闻网站使用 AI 生成内容。到 6 月底,这个数字增加到了 277。这些 AI 生成内容网站旨在通过 Google 的广告获利。

人工智能
Wilson(42865)
发表于2023年07月15日 13时29分 星期六
来自失眠
Meta 的大语言模型 LLaMA 过去几个月推动了开源大模型的快速发展,但 LLaMA 目前不支持商业使用,而是在非商业授权下提供给社区和研究人员使用。Meta 现在准备推出 LLaMA 的商业版本,允许开发者和企业在 LLaMA 基础上构建商业应用。LLaMA 有 70 亿、130 亿、330 亿和 650 亿参数多个版本,相比下 ChatGPT 使用大模型 GPT-3.5 有 1750 亿个参数,而新一代的 GPT-4 据报有超过 1 万亿个参数。

人工智能
Wilson(42865)
发表于2023年07月14日 15时31分 星期五
来自影舞
Google 宣布了其 AI 聊天机器人 Bard 的重大更新:对全世界大部分国家开放访问(不包括中国大陆和香港),支持阿拉伯语、中文、德语、印度语和西班牙语在内的四十多种语言。此前因为欧盟的隐私要求,Google 推迟了向欧盟地区提供 Bard,最新更新包含了额外的隐私功能,而 Bard 也正式提供给了整个欧洲地区。新功能包括:固定和重命名对话,导出代码到更多地方,与朋友分享 Bard 聊天记录,可在提示中上传图像,目前只支持英文,未来会支持更多语言。

人工智能
Wilson(42865)
发表于2023年07月14日 13时50分 星期五
来自人猿泰山之密林追踪
美国联邦贸易委员会(FTC)正在调查 OpenAI 的 ChatGPT 是否因发布有关人们的虚假信息而对他们造成了伤害,意味着该款热门应用面临潜在的诉讼风险。FTC 表示,该机构对 ChatGPT 的调查重点是 OpenAI 是否“从事了与消费者受伤害的风险有关的不公平或欺骗性行为,其中包括名誉损害”。FTC 向 OpenAI 提出的一个问题是,要求该公司“详细描述其在多大程度上采取了措施来应对或降低风险,即该公司的大语言模型产品可能会生成关于真实个人的虚假、误导或诋毁性陈述的风险”。在发给 OpenAI 的民事传票中,FTC 提出了有关该公司数据安全操作的详细问题。FTC 援引了 2020 年的一起事件,当时 OpenAI 披露了一个漏洞,该漏洞可以让用户查看其他用户的聊天信息和一些与支付相关的信息。FTC 传票提出的其他问题还包括 OpenAI 的营销活动、AI 模型的训练做法以及该公司对用户个人信息的处理。

人工智能
Wilson(42865)
发表于2023年07月13日 19时24分 星期四
来自沙皇的邮件
网信办等七部门发布了《生成式人工智能服务管理暂行办法》,2023 年 8 月 15 日起施行。《暂行办法》规定:
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。

人工智能
Wilson(42865)
发表于2023年07月13日 16时03分 星期四
来自再会,谢谢所有的鱼
Google 在早些时候的年度开发者大会 Google I/O 上宣布了一款设计帮助人们更快学习的新笔记本 Project Tailwind。周三它宣布了 Project Tailwind 的正式名字 NotebookLM。Google 还没有向公众开放其使用,感兴趣的用户可加入等待名单。NotebookLM 来自 Google Labs,其核心是一个语言模型,因此名字里包含了 LM。NotebookLM 能自动生成添加的 Google Doc 文档的摘要,上传文档后用户能要求笔记本回答文档相关的各类问题,它还能帮助用户提出创新的新想法。Google 同时警告 NotebookLM 仍然可能存在大语言模型常见的“幻觉”(或者说虚构内容),因此用户需要事实核查,它会通过回复中的相关引文简化核查。

人工智能
Wilson(42865)
发表于2023年07月13日 15时44分 星期四
来自42
马斯克(Elon Musk)宣布成立了一家新 AI 公司 xAI,其宗旨是理解宇宙的真实性质。xAI 招募了曾在 DeepMind、OpenAI、Google 研究院、微软研究院、特斯拉和多伦多大学工作过的研究人员。xAI 在一篇官方博客文章中称,它的团队曾参与并领导了 AI 领域最重大突破的研发,其中包括 AlphaStar、AlphaCode、Inception、Minerva、GPT-3.5 和 GPT-4。马斯克曾是 OpenAI 的联合创始人,但早在 ChatGPT 火热前就已经退出。

人工智能
Wilson(42865)
发表于2023年07月12日 13时56分 星期三
来自跃入虚空
英伟达已成为 AI 革命早期的领跑者,但大大小小的竞争对手已经在奋起直追。AMD 和英特尔等重量级企业正花费数以十亿美元计的资金扩充 AI 产品组合,另一方面初创企业正吸引那些渴望捕捉下一个潜在芯片巨头的投资者。与此同时,亚马逊和谷歌等云计算公司也在开发自己的芯片,成为这一赛道上的大块头选手。从 AI 软件架构的角度来看,英伟达的一众竞争对手或许有能力挑战英伟达。英伟达的软件是专有的,这意味着软件开发者不能自由地对其进行调整。英特尔和 AMD 提供开源的替代方案,一些客户可能会发现这种选择很有吸引力。

人工智能
1
Wilson(42865)
发表于2023年07月11日 22时58分 星期二
来自沙皇的邮件
AI 创业公司 Anthropic 宣布了新大语言模型 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问,它同时推出了面向公众的 beta 网站 claude.ai(尚未对中国大陆开放)。Anthropic 称,Claude 2 在律考多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%;相比申请研究生院的大学生,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,数量推理得分与申请者的中位数相当。Anthropic 表示,Claude 2 的企业 API 价格与 Claude 1.3 相同。

人工智能
1
Wilson(42865)
发表于2023年07月11日 19时30分 星期二
来自天堂的喷泉
OpenAI 今年初公布的新一代大模型 GPT-4 的技术细节泄露,它有 1.8 万亿个参数,利用了 16 个混合专家模型(mixture of experts),每个有 1110 亿个参数,每次前向传递路由经过两个专家模型。它有 550 亿个共享注意力参数,使用了包含 13 万亿 tokens 的数据集训练,tokens 不是唯一的,根据迭代次数计算为更多的 tokens。GPT-4 预训练阶段的上下文长度为 8k,32k 版本是对 8k 微调的结果。如果是在云端进行训练,以 每 A100 小时 1 美元计算,那么一次的训练成本就高达 6300 万美元。不过今天的训练成本能降至 2150 万美元。

人工智能
Wilson(42865)
发表于2023年07月10日 14时25分 星期一
来自苍穹微石
喜剧演员 Sarah Silverman 以及两名作家 Richard Kadrey 和 Christopher Golden 向旧金山联邦法院提起集体诉讼,指控 Meta 和 OpenAI 使用受版权保护的材料训练 AI 聊天机器人。诉讼凸显了生成式 AI 工具所面临的法律风险。Silverman、Kadrey 和 Golden 指控 Meta 和 OpenAI 未经授权使用其书籍开发大语言模型。在针对 Meta 的诉讼中,原告称泄露的该公司 AI 业务信息显示他们的作品未经许可被使用。针对 OpenAI 的诉讼称,ChatGPT 生成的原告作品摘要表明它接受了受版权保护内容的训练。

人工智能
Wilson(42865)
发表于2023年07月07日 21时21分 星期五
来自向世界倾诉爱
在 AI 热潮下,经历数个月裁员的旧金山科技行业企业恢复了招聘。5 月份,旧金山市和毗邻的圣马特奥县(San Mateo County)科技行业新增加了 2800 个岗位。旧金山首席经济学家 Ted Egan 表示,自 2022 年底科技业大规模裁员以来,新增加的职位意味着当地恢复了 38% 的就业岗位。Egan 称,大型科技巨头的股价今年表现出色,这一趋势通常是增加招聘的领先指标。他预计大部分招聘来自 AI 行业。AI 公司如 OpenAI 和 Anthropic 都在旧金山。

人工智能
Wilson(42865)
发表于2023年07月07日 17时53分 星期五
来自量子魔术师
旧金山的一个安全街道活动人士组成的去中心化组织发现可通过在引擎盖上放置交通锥阻止 Cruise 和 Waymo 公司的无人驾驶出租车行驶。他们鼓励其他人一起效仿。这一恶作剧被称为 Week of Cone,旨在抗议 Cruise 和 Waymo 扩大在旧金山的无人出租车服务。抗议者宣称,无人出租车并没有如 Cruise 和 Waymo 所宣称的那样减少交通堵塞和碰撞事故 ,它们反而堵住了公共汽车和紧急车辆行驶的道路。它们的汽车甚至杀死了一个人和一条狗。这些公司还和警方合作,在未经同意下对每个人进行全程录音。这些说法有点夸张,Waymo 的无人出租车并没有在旧金山造成任何人身伤害,造成人死亡的事件发生在 2018 年的亚利桑那州,一辆 Uber 自动驾驶汽车在测试时撞上了一位行人。Waymo 将抗议者的做法形容为某种破坏行为。Cruise 则表示它有良好的安全记录。

人工智能
Wilson(42865)
发表于2023年07月07日 16时35分 星期五
来自少女骑士变身记
OpenAI 宣布其最新的文本生成模型 GPT-4 Generally Available,开放给付费 API 开发者使用。从现在起,所有有成功支付史的 OpenAI API 开发者都可访问 GPT-4。OpenAI 计划在月底向新开发者开放 GPT-4,基于计算的可用性逐步提高可用性限制。相比前一代的 GPT-3.5,GPT-4 可生成包括代码在内的文本,支持图像和文本输入,在不同专业和学术基准测试上的表现达到了“人类水平”。

人工智能
Wilson(42865)
发表于2023年07月06日 19时44分 星期四
来自拥王者的女儿
上海 AI 实验室发布了开源模型 InternLM-7B,中文名书生·浦语大模型,包含有 70 亿参数。开发者称,“InternLM 是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。在此基础上,通过高质量的人类标注对话数据结合 RLHF 等技术,使得 InternLM 可以在与人类对话时响应复杂指令,并且表现出符合人类道德与价值观的回复。”源代码在 Apache-2.0 协议下开源,权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。

人工智能
Wilson(42865)
发表于2023年07月06日 17时18分 星期四
来自镜中世界
根据 Similarweb 的估计,去年 11 月底发布的 AI 聊天机器人 ChatGPT 的流量首次出现下降。ChatGPT 在去年 12 月吸引了约 2.66 亿次访问,与 Yahoo News 相近,之后 1 月份流量增长 131.6%,2 月 62.5%,3 月 55.8%,到了 4 月增长 12.6% 至 17.6 亿次,指数级增长势头开始消退。它的流量超过了 bing.com、nytimes.com 和 cnn.com,但仍然只有 google.com 的 2%。如今 6 月份的桌面和移动 ChatGPT 访问量比 5 月下降了 9.7%,独立访客人数下降了 5.7%,用户在网站上花费的时间下降了 8.5%。即便如此,ChatGPT 仍然是至今增长最快的消费者应用,其访问量排名全球前 20,远超使用 OpenAI 技术的微软搜索引擎 Bing。

人工智能
Wilson(42865)
发表于2023年07月04日 19时35分 星期二
来自千与千寻
UCLA 数学教授陶哲轩在个人博客以及微软网站发表文章谈论了用 GPT-4 研究数学问题。他说,GPT-4 等生成式 AI 工具的出现将改变我们对于软硬件如何发展的预期。在以对话形式使用中,GPT-4 能充当一位富有同情心的倾听者,热情的共鸣者,创意灵感之源,翻译者或教师,魔鬼代言人。它们能在很多方面帮助我们。他以及很多人都开始使用 GPT-4 撰写文章的初稿。大模型确实会向用户返回经不起推敲的无稽之谈,但它们今天能为数学家提供线索并参与决策。陶哲轩预测到 2026 年生成式 AI 将能成为数学和其它领域的研究合作者。