solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年04月12日 14时05分 星期三
来自最后一个阿特兰蒂斯人
日本东京大学和上智大学等限制学生使用 ChatGPT 写报告或论文。ChatGPT 帮助撰写的文章存在著作权以及内容可能错误的问题,部分日本大学明确禁止学生使用,还有部分大学考虑将其作为信息获取工具允许在课上使用。东京大学在校内网上发布了对 ChatGPT 和可生成图像的生成式 AI 等相关见解。其中强调称“有关报告,前提是由学生本人制作”,表示教师方面有必要结合询问情况和笔试来确认报告是否为本人所作。日本东北大学表示“完全排除使用 AI 是不现实的”,指出 AI 数据中若包含第三方的著作品,可能会构成侵犯著作权。上智大学公布文件称报告或论文“不允许使用”,明确规定了禁用,并表示一经发现使用将严格处理。 京都大学校长凑长博在入学仪式上提醒学生:“用 AI 制作文章有包含明显错误信息的风险。”他还呼吁学生“自己写出可靠妥当的文章会锻炼精神力和思考力”。

人工智能
Wilson(42865)
发表于2023年04月11日 22时44分 星期二
来自血之遗产
可汗学院创始人 Sal Khan 相信 OpenAI 最新的生成式 AI GPT-4 做好了给学生当导师的准备。可汗学院是 GPT-4 的早期用户之一,它提供的基于 GPT-4 的教育助手 Khanmigo 正在美国多个学区进行测试。Khanmigo 的工作方式类似线下或线上的辅导老师,检查学生的作业,在遇到问题时提供帮助。举例来说,对于数学题目,Khanmigo 不仅仅能判断正确还是错误,还能判断学生的哪一步推理错了。Sal Khan 表示,他理解部分学校对 ChatGPT 等生成式 AI 的担忧,指出许多批评者其实自己也在用它们,甚至让他们自己的子女使用。他认为 AI 能为发展中国家和发达国家的儿童提供一种个性化学习的机会。

人工智能
Wilson(42865)
发表于2023年04月11日 21时33分 星期二
来自诺比与错乱的时间线
在 Reddit 上,一名叫 Claudia 的用户向其他用户出售裸照。她非常受欢迎,公开的示例照片吸引了很多用户表达仰慕之情。但根据研究人员的分析,Claudia 的照片是 AI 合成的。AI 图像生成工具 Midjourney 和 Stable Diffusion 的快速进步让任何人都可以创造出足以以假乱真的色情图像。一位匿名的系统管理员表示他使用 Stable Diffusion 生成了穿尿布的成年女性的图像,表示图像质量的进步让造假变得无足轻重。他认为看色情照片的普通人根本就不在乎伪造,他们不会在现实中与照片的人见面,所以即使是假的,谁又在乎呢?一位在 OnlyFans 上出售裸照的性工作者表示不担心 AI 生成图像,说 AI 会取代性工作者的人是那些不怎么把性工作者当人的人。

人工智能
Wilson(42865)
发表于2023年04月11日 21时00分 星期二
来自灵魂骑士
阿里巴巴在北京举行的 2023 阿里云峰会上宣布,企业可以调动阿里旗下通用大模型“通义千问”的能力,训练自己的企业大模型。阿里云智能 CTO 周靖人介绍,阿里云会为企业提供专属数据空间,企业不需要对数据预处理,以 PPT、PDF、图片、企业数据库等形式将企业信息上传,阿里云便能通过多模态能力,把企业的知识体系和“通义千问”有机结合在一起,从而一键式生成大模型。企业可以通过 API 接入的方式,拓宽模型的应用场景和业务价值,包括可以根据自己的需求开发网页版、App 版等应用。

人工智能
Wilson(42865)
发表于2023年04月11日 15时13分 星期二
来自总门谷
网信办发布了《生成式人工智能服务管理办法(征求意见稿)》,意见反馈截止时间为 2023 年 5 月 10 日。《管理办法》要求:
第四条 提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:
(一)利用生成式人工智能生成的内容应当体现社会主义核心价值观,不得含有颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情信息,虚假信息,以及可能扰乱经济秩序和社会秩序的内容。
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。
(三)尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争。
(四)利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。
(五)尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权。禁止非法获取、披露、利用个人信息和隐私、商业秘密。
第五条 利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人,包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任;涉及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护义务。
第六条 利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

人工智能
Wilson(42865)
发表于2023年04月11日 13时40分 星期二
来自歌剧院魅影
一位自由撰稿人称她为客户写营销相关内容的工作被 AI 聊天机器人 ChatGPT 取代了,她已经注册了 Doordash 准备改行当送餐骑手。这位客户是她最主要的收入来源,时薪高达 80 美元。许多人说,如果你是一名优秀的写作者,你不会被 AI 取代。然而情况是:虽然 AI 的作品达不到你的高度,但能达到五成甚至六成,同时成本可能是你的千分之一甚至万分之一,对追求利润的企业而言,选择 AI 还是选择你是显而易见的。基于 GPT 3.5 的 ChatGPT 在创意写作上的能力逊于最近推出的 GPT 4,GPT 4 与人类作者之间的差距已经非常小了。

人工智能
Wilson(42865)
发表于2023年04月10日 18时22分 星期一
来自时间秘史
日本首相岸田文雄周一在首相官邸会见了 OpenAI 首席执行官(CEO)阿尔特曼(Sam Altman)。该公司的 AI 机器人 ChatGPT 因具有类似人类的自然语言对话能力而引发广泛关注。阿尔特曼向媒体透露,岸田听取了有关 ChatGPT 优缺点的介绍,对其很感兴趣。阿尔特曼还就如何应对 ChatGPT 的风险向岸田表达了自己的想法。他还对媒体表示,考虑在日本开设办事处。官房长官松野博一在记者会上就 ChatGPT 表示:“如果能消除处理机密信息及信息泄露的担忧,为了减轻国家公务员的业务负担,将就加以利用的可能性进行探讨。”

人工智能
Wilson(42865)
发表于2023年04月08日 21时23分 星期六
来自蓝莓村
多名三星软件工程师将公司的机密代码输入到 OpenAI 的 ChatGPT 中,让 AI 聊天机器人帮助调试代码和修复错误。一名员工从一个半导体数据库中拷贝存在 bug 的代码到 ChatGPT,要求它找到修正方法。另一名工程师做了同样的事,要求 ChatGPT 优化代码。第三名工程师要求聊天机器人总结会议记录。三星在监测到这些情况之后,采取行动将员工能输入到 ChatGPT 中的提示限制在 1024 个字节。

人工智能
Wilson(42865)
发表于2023年04月07日 21时33分 星期五
来自致命的发动机
法学教授 Jonathan Turley 发现自己被 ChatGPT 列入了性骚扰名单,澳大利亚一位市长发现 ChatGPT 声称他有贿赂罪被判处监禁,为什么 AI 聊天机器人 ChatGPT 和 Bing Chat 擅长捏造故事?AI 研究人员通常将此类错误称为“幻觉(hallucinations)”,一部分人认为这个形容词太拟人化了,暗示了它们能自己做决定。商业大语言模型的创造者可能会以此为借口将错误输出归罪于模型本身而不是他们自己。“虚构”可能是更恰当的比喻。在人类心理学中,记忆出现空白,在无意欺骗他人时大脑会虚构出空白部分。ChatGPT 与人脑的工作原理不同,但虚构是更合适的比喻。ChatGPT 事实上已经比它的前辈能更有效的抑制虚构了。这种虚构能力与大语言模型的工作方式相关。ChatGPT 等模型是根据统计概率挑选出一个适合上下文的词,当它寻找其数据集中不存在的信息时,它会用看似合理的词贴补空白。它是使用海量的数据集训练的,编造虚构故事对其而言就是信手拈来,它还能根据上下文让虚构的故事看起来逼真。AI 研究人员使用名叫 temperature(温度)的属性去控制模型的这种胡编乱造的“创造性”。如果它的值设置过低的话准确度会提高但会变得不太有趣。平衡创造性和准确度是微调 ChatGPT 之类模型的一大挑战。AI 公司 Hugging Face 的首席伦理科学家 Margaret Mitchel 说,ChatGPT 不是构建去实事求是,因此也不会实事求是。就是这么简单。

人工智能
Wilson(42865)
发表于2023年04月07日 16时20分 星期五
来自神间失格
微软宣布 MS Edge 成为第一个也是目前唯一一个整合 AI 图像生成器的浏览器。微软表示 Edge 用户可以通过侧边栏的“+”按钮访问其 AI 图像生成器 Image Creator——目前该功能尚未提供给中国大陆的用户。Image Creator 是基于 OpenAI 最新的 DALL∙E 模型,用户可通过文字描述生成各种风格的图像。

人工智能
Wilson(42865)
发表于2023年04月06日 21时47分 星期四
来自失眠
Alphabet 以及 Google CEO 桑达·皮采(Sundar Pichai)在接受采访时表示 Google 搜索引擎将加入 AI 聊天功能。他表示 AI 的进步将增强 Google 回答一系列搜索查询的能力。他驳斥了聊天机器人对其搜索业务构成威胁的说法,“如果说有影响的话,那就是机会空间比以前更大了。”长期以来,Google 在开发被称为大语言模型的计算机程序方面一直处于领先地位,这些模型可以用类似人类的表述处理和回复自然语言指令。但 Google 还没有应用这种技术来影响搜索的使用,皮采称这一点将会改变。

人工智能
Wilson(42865)
发表于2023年04月06日 21时41分 星期四
来自月光狂想曲
Meta 宣布了新 AI 模型 Segment Anything Model (SAM) ,能识别出图像和视频中的个别对象。代码已发布在 GitHub 上,Meta 发布了一个 DEMO 演示该功能。SAM 是一个图像分割模型,能根据用户的文本提示或点击去分离图像中的特定对象。图像分割被用于更方便的分析或处理图像,它通常需要专家的高度专业化工作,而 Meta 希望 SAM 将这一过程自动化。它将在 Apache 2.0 下公开 SAM 及其使用的数据集。

人工智能
Wilson(42865)
发表于2023年04月05日 20时37分 星期三
来自穹顶之下
斯坦福的 AI 研究所 Institute for Human-Centered Artificial Intelligence 发布了《2023 AI Index Report》,该报告由斯坦福和 AI 公司如 Google、Anthropic 和 Hugging Face 的研究人员共同编写,认为 AI 进入了新的发展阶段,随着 AI 的开发和训练日益昂贵,企业掌握了主动权。报告指出,在 2014 年之前最先进的机器学习模型都是由学术界发布,但之后业界占据主导。2022 年业界发布了 22 个重要的机器学习模型,而学术界只发布了 3 个。构建最先进的 AI 系统需要大量的数据、计算资源和资金,相比非盈利组织和学术界,企业界优势显著。报告以最近火热的大语言模型为例,2019 年发布的 GPT-2 模型包含了 15 亿参数,训练成本估计 5 万美元。2022 年发布的 PaLM 包含了 5400 亿参数,训练成本 800 万美元。大语言模型和多模态模型日益复杂而昂贵。

人工智能
3
Wilson(42865)
发表于2023年04月01日 16时00分 星期六
来自图书馆员与遗失的神灯
对于最近火热无比的 AI 聊天机器人,中国工程院院士方滨兴表示,ChatGPT是聊天形式的软件,能给出直接答案,取代了传统教学体系,当大家习惯于查 ChatGPT,什么都问它,它什么都给解答,就会形成知识茧房,甚至“三观都会被左右”,这是一个大问题。 ​​​

人工智能
Wilson(42865)
发表于2023年03月31日 23时04分 星期五
来自三个太阳
意大利隐私监管机构周五以涉嫌侵犯隐私为由对 OpenAI 的聊天机器人 ChatGPT 下达了禁令。意大利数据保护机构表示将调查 OpenAI 如何处理意大利用户的数据。对 ChatGPT 的禁令是临时性的,只要 OpenAI 遵守欧盟的数据保护规定 GDPR 即可。隐私监管机构称,OpenAI 大量收集和储存个人数据去训练 ChatGPT 的算法这一做法缺乏法律依据,该公司也没有正确的处理数据。ChatGPT 上周遭遇了数据泄露,暴露了用户的对话和支付信息。此外 OpenAI 没有验证用户的年龄,使得未成年人接触到不合适他们年龄的答案。OpenAI 有 20 天时间回答如何遵守欧盟的隐私规定。更新:OpenAI 遵守禁令限制意大利用户使用 ChatGPT。

人工智能
Wilson(42865)
发表于2023年03月31日 16时13分 星期五
来自付费可以滥用
AI 图像生成服务 Midjourney 以滥用为由暂停了免费试用。在这之前,利用 Midjourney v5 生成的前总统特朗普(Donald Trump)被捕和罗马天主教教皇身穿时尚夹克的 AI 图像在社交网络病毒式传播,让很多人信以为真。Midjourney CEO 和创始人 David Holz 在宣布这一决定时表示免费用户流量过大,试用遭滥用。

人工智能
1
Wilson(42865)
发表于2023年03月30日 13时28分 星期四
来自拥王者的女儿
包括马斯克(Elon Musk)和图灵奖得主 Yoshua Bengio 在内的科技行业高管和顶级 AI 研究人员正呼吁暂停对强大的新 AI 工具的快速开发。主张暂停的这些人士表示,六个月或更长时间的暂停,将使该行业有时间制定 AI 设计方面的安全标准,从而防止风险最高的一些 AI 技术的潜在危害。《暂停巨型 AI 实验:一封公开信》并非呼吁暂停所有 AI 开发,但敦促各公司暂时停止训练比 GPT-4 更强大的系统。OpenAI 的管理人员说他们还没有开始训练 GPT-5。OpenAI 首席执行官 Sam Altman 在接受采访时表示,公司长期以来在开发时将安全作为重点,并在 GPT-4 发布前花了六个多月的时间对其进行安全测试。

人工智能
Wilson(42865)
发表于2023年03月29日 15时23分 星期三
来自千与千寻
根据高盛的研究,生成式 AI 能取代全球 3 亿全职工作岗位。美国和欧盟四分之一的工作能被取代,但同时它也可能会创造出新的工作岗位和提升生产力。高盛表示,如 ChatGPT 之类的生成式 AI 系统能创造出与人类产出区别不大的内容,将能推动生产力的提升,在 10 年内将全球 GDP 提高 7%。但它也会给全球劳动力市场带来巨大破坏。全世界有 3 亿全职工作面临被自动化取代,律师和管理人员的工作最有可能变得过时。美国和欧洲三分之二的工作面临某种程度的 AI 自动化,大部分人将有不到一半的工作量自动化,他们的一部分工作时间将被释放出来用于更富有生产性的工作。从事体力或户外工作的人暂时不会受到影响,但他们的工作也会面临其它形式的自动化的影响。

人工智能
1
Wilson(42865)
发表于2023年03月28日 19时05分 星期二
来自飞行中的阴影
苏黎世大学的研究人员在预印本平台 arXiv 上发表论文,报告 OpenAI 的 AI 聊天机器人 ChatGPT 在文本标注任务中的表现超过了众包工人。大量的自然语言处理(NLP)应用需要高质量的标注数据,此类任务可根据复杂程度和规模交给亚马逊众包平台 MTurk 上的众包工人或专业的标注者去完成。研究人员使用了包含 2,382 则推文的样本,对比了 ChatGPT 和众包工人以及专业标注者的表现。结果显示, ChatGPT 在五项任务中有四项超过了众包工人,在评估一致性(intercoder agreement)上超过了众包工人以及专业标注者。更重要的是 ChatGPT 的标注成本每条不到 0.003 美元,是众包工人二十分之一。研究显示大语言模型可显著提高文本分类的效率。

人工智能
Wilson(42865)
发表于2023年03月28日 17时40分 星期二
来自月海沉船
2021 年,Google 研究人员在《自然》期刊上报告利用 AI 加速芯片设计。研究人员使用了 1 万张芯片设计图去训练他们的软件,基于强化学习的 AI 学习了如何在有限空间、布线和功耗下完成设计图。Google 已将这一方法应用于自己的芯片 TPU(tensor processing uni)。现在,UCSD(加州圣迭戈)计算机科学和工程学教授 Andrew Kahng 领导的一个团队尝试了重现 Google 的研究。由于 Google 以商业敏感性为由未披露模型内部工作的部分细节,研究人员花了几个月时间进行逆向工程,他们最终的模型 circuit training (CT)比使用传统方法差得多。为什么差异如此显著?一种原因被认为是 Google 利用 EDA 软件巨头 Synopsys 开发的商业软件去创造芯片逻辑门的起始布局,然后用强化学习系统优化。UCSD 团队指出 Google 没有在论文中进行披露。Google 论文的主要作者表示没有披露是因为这并不重要。他们认为 UCSD 团队的结果糟糕一则是模型没有预先训练,另一个原因是没有像 Google 那样有充足的计算能力。UCSD 团队表示没有预训练是因为无法获得 Google 使用的私有数据。