solidot新版网站常见问题,请点击这里查看。
微软
Wilson(42865)
发表于2023年04月13日 23时27分 星期四
来自华龙之宫
微软开源了 DeepSpeed Chat,帮助用户加速训练类似于 ChatGPT 的模型。DeepSpeed Chat 能够简化 ChatGPT 类型模型的训练过程、强化推理体验。其中的 DeepSpeed-RLHF 系统能够在推理和训练两种模式之间进行切换,使复杂的 RLHF 训练速率更快、易于大规模推广。DeepSpeed-HE 比现有系统快 15 倍以上,且成本更低。在微软云 Azure 上,该系统只需 9 小时即可训练一个 OPT-13B 模型,只需 18 小时即可训练一个 OPT-30B 模型,且这两种训练分别花费不到 300 美元和 600 美元。

开源
Wilson(42865)
发表于2023年04月08日 22时32分 星期六
来自全面启动
过去一年俄罗斯政府屏蔽了逾万网站,其中包括知名社交网络 Facebook、Twitter 和 Instagram。俄罗斯人转而通过 VPN 等工具绕过封锁。但俄罗斯政府随后又封锁了流行 VPN 服务使用的 IP 地址。现在一种开源 VPN 客户端 Amnezia 帮助俄罗斯用户挫败新的封锁。不同于商业 VPN 服务通过企业服务器路由用户,Amnezia 允许用户设定自己的服务器,选择自己的 IP,使用难以屏蔽的协议。Amnezia VPN 类似 Google Jigsaw 开发的开源工具 Outline,它是在 2020 年举行的一次黑客马拉松活动中创造出来的,它目前有大约 10 万用户。

开源
Wilson(42865)
发表于2023年03月31日 12时38分 星期五
来自乌鸦从高塔坠落
加州伯克利、斯坦福、卡内基梅隆和加州圣迭戈的研究团队宣布了开源聊天机器人 Vicuna-13B,它是基于 Meta 的大语言模型 LLaMA,使用了用户通过 ShareGPT 分享的 7 万对话样本进行微调。研究人员让 OpenAI 的 GPT-4 作为裁判去对比 Vicuna-13B 以及 ChatGPT 和 Google Bard,结果显示它在质量评估中能达到 ChatGPT 的九成左右。Vicuna-13B 的训练成本只花了 300 美元。 Vicuna-13B 的代码使用 Apache License 2.0 许可证,研究人员计划释出其模型权重。

开源
Wilson(42865)
发表于2023年03月30日 23时23分 星期四
来自异形博恩
curl 项目作者 Daniel Stenberg 称收到了彭博社开源项目办公室的来函,curl 项目成为彭博社 FOSS Contributor Fund 基金的首个赞助对象,它通过 Open Source Collective 向其资助 1 万美元。 curl 项目不是法人,不能自己持有资金或任何资产,它的所有资金都由 Open Source Collective 托管。

人工智能
Wilson(42865)
发表于2023年03月21日 18时02分 星期二
来自霸主的影子
OpenAI 的 ChatGPT(GPT 3 版本)是基于大语言模型,专门训练以文本形式的对话与用户互动。它不是基于多模态模型,不支持图像或语音的输入输出。如果我们想要构建一个类似 ChatGPT 的支持图像理解和生成的系统,那么可能需要使用一个多模态会话模型进行训练。但此类的训练需要消耗大量的数据和算力资源。与此从头开始构建一个全新的系统,不如站在巨人的肩膀上。微软亚洲研究院的研究人员在预印本网站 arxiv 上发表论文《Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models》,提出在 ChatGPT 和多个 Visual Foundation Models 基础上构建 Visual ChatGPT。源代码托管在 GitHub 上。

开源
Wilson(42865)
发表于2023年03月20日 21时24分 星期一
来自通往宇宙之门
庆祝项目诞生 25 周年,curl 作者 Daniel Stenberg 宣布释出 v8.0.0 ,称该版本没有 API 或 ABI 破坏,也就是不会造成向后兼容性问题。该版本修复了 6 个新漏洞,其中 5 个危险等级低,另外一个为中等。它的另一个主要变化是构建系统不再支持缺乏可工作 64 位数据类型的系统,其它主要是 bug 修复。

开源
Wilson(42865)
发表于2023年03月20日 14时15分 星期一
来自星火
curl 作者 Daniel Stenberg 回顾了项目经历的二十五年。发布 curl 首个版本时是他只有 27 岁,当时是 Frontec Tekniksystem 的软件工程师,主要是为瑞典产品开发公司从事嵌入式系统的合同开发工作。他当时养成了一个习惯,每天晚上会熬夜花一两个小时从事个人项目的开发。curl 背后的开发理念是逐步迭代在所有方面进行改进,它也并不是突然流行起来的,用户数是逐步增长的,在 1998 年只有少数用户,到 2010 年增加到数亿用户。很难估计现在 curl 有多少用户,但估计远超 100 亿,URL 的 API 库 libcurl 几乎被每一个联网的设备和系统使用。他的 curl 之路始于 1996 年底,他下载了 Rafael Sagula 开发的工具 httpget,每天自动下载货币汇率,确保他的货币兑换器能正常工作。httpget 有些漏洞,他向作者递交了补丁。Rafael 认为他可以接手维护该项目,所以他接手了。他逐步加入了对 GOPHER 的支持,改变项目名称,增加对 FTP 的支持,在 1998 年初增加了对 FTP 上传的支持...后面就是历史。

开源
Wilson(42865)
发表于2023年03月20日 13时35分 星期一
来自迷宫之屋
LLVM 编辑器套件释出了 v16.0.0,主要新变化包括:默认用 C++17 构建,工具链的软要求现在变成硬要求——构建需要 GCC 版本>= 7.1,Clang >= 5.0,Apple Clang >= 10.0,Visual Studio 2019 >= 16.7,CMake >= 3.20.0;Clang 默认的 C++/ObjC++ 标准是 gnu++17 而不是 gnu++14,等等,更多可浏览详细的发布公告。

商业
Wilson(42865)
发表于2023年03月16日 11时29分 星期四
来自喀迈拉空间
Docker 向所有 Docker Hub 用户发去邮件,如果他们是以组织的名义创建账号,那么他们的账号将被删除,所有镜像也将一并删除,除非他们升级到一个付费的团队方案——其年费为 420 美元。Docker Hub 被很多开源项目用于发布镜像,而绝大部分开源项目是没有多少资金的。此举引发了争议,很多人开始将其镜像迁移出 Docker 转到其它平台或自托管。没有自己的基础设施依赖于私有平台都会存在风险。

开源
Wilson(42865)
发表于2023年03月16日 10时27分 星期四
来自为了我们的家园
去年 8 月举办的 SIGGRAPH 国际图像学年会上,梦工厂动画宣布其私有渲染器 MoonRay 将在年内开源。梦工厂开源的进展略微滞后了几个月。本周四,梦工厂动画在 Apache License 2.0 许可证下公开了 MoonRay 源代码,项目托管在 GitHub 上。MoonRay 是梦工厂内部开发的蒙特卡洛路径追踪器,被用于制作《驯龙高手3》、《疯狂原始人2》、《坏蛋联盟》和《穿靴子的猫2》。MoonRay 使用的基于云端的分布式计算框架 Arras 也包含在开源代码库中。

云计算
1
Wilson(42865)
发表于2023年03月14日 23时49分 星期二
来自驶入深海
编程问答社区 Stack Overflow 调查了数千名开发者,询问哪些新兴的技术趋势已经证明了自己。它将一个技术根据 0-10 的尺度进行评分,其中 0 代表实验性,10 代表已被证明。结果显示,被认为已获得证明得到广泛认可的技术是开源 6.9、云计算 6.5 和机器学习 5.9,被认为尚未证明的技术包括量子计算 3.7,纳米技术 4.5,低代码/零代码 4.6。对于下一个人人都将使用的技术,AI 高居第一,之后是开源、机器学习和云计算。调查还根据 0-10 的尺度对一项技术产生正面还是负面影响进行评价(0 代表负面,10 代表正面),结果显示开源技术得分最高 7.2,可持续技术 6.6,机器学习 6.5。 低代码/零代码的评价非常低,这可以理解,因为这可能会对部分开发者的职业安全产生冲击。大多数开发者认为,低代码/零代码以及区块链在未来不会广泛使用。

开源
Wilson(42865)
发表于2023年03月14日 14时05分 星期二
来自太阳系大乐透
WordPress.com 网站将有更简单的方法整合到联邦平台。WordPress.com 和 Tumblr 等服务的母公司 Automattic 收购了 ActivityPub for WordPress 插件,招募了该插件的开发者。ActivityPub 是一个开放去中心化社交网络协议,被 Mastodon、Pixelfed 和 PeerTube 等应用使用。ActivityPub 插件允许其他联邦平台的用户订阅 WordPress 博客。该插件目前支持 Mastodon、Pleroma、Friendica、HubZilla、Pixelfed、SocialHome 和 Misskey。Automattic CEO Matt Mullenweg 去年曾表示 Tumblr 将加入对 ActivityPub 的支持,他还没有公布任何 WordPress 相关的计划。

开源
Wilson(42865)
发表于2023年03月10日 22时10分 星期五
来自平行恋人
cURL 作者 Daniel Stenberg 宣布将在 3 月 20 日举行 25 周年庆祝活动,通过 Zoom 在线举办,人人都可以参加。cURL 的官方诞辰日是 1998 年 3 月 20 日,但它的历史可以追溯到 1996 年,当年的 11 月 11 日,Rafael Sagula 发布了工具 httpget,该项目吸引了 Stenberg,他开始为它贡献代码,httpget 0.1 只有不到 300 行 C 代码。同一天另一个工具 Wget 也发布了首个版本,但它的容量高达 171 KB。之后不久 Stenberg 接管了 httpget 的维护工作,扩展了它的功能,加入了对 Gopher 和 FTP支持,后为了避免名字产生混淆而改名为 urlget,1998 年加入了对 FTP 上传的功能后再次改到为现在的名字 cURL,c 读做 see,意思是 see URL。今天 cURL 及其 API 库 libcurl 几乎被每一个联网的设备和系统使用。

开源
Wilson(42865)
发表于2023年03月10日 17时08分 星期五
来自发条人偶
字节跳动本周主办了 CloudFW Open System Firmware 研讨会,庆祝 CloudFW 2.0 的发布。CloudFW 2.0 是该公司替代 UEFI 的自由固件 Coreboot 的实现。字节跳动的开发者表示计划在该公司基础设施使用的不同架构上运行 Coreboot 和 LinuxBoot。字节跳动称,相比 Linux 社区,UEFI/EDK II 社区不怎么活跃,由于关键模块控制在 BIOS 供应商(IBV)手中,UEFI/EDK II 的问题无法快速得到修复。

Android
Wilson(42865)
发表于2023年03月03日 13时54分 星期五
来自发条女孩
开源 Android 应用商店 F-Droid 释出了 v1.16,其中一大变化是更新了库索引格式。随着愈来愈多的应用进入 F-Droid 商店,记录所有应用及其元数据的库索引的容量也愈来愈大。目前压缩后的索引大小为 8MB,每次 F-Droid 客户端更新索引时都需要重复下载这 8MB 文件。现在为了减少体积,支持增量下载,开发者实现了 RFC 7396 JSON Merge Patch,F-Droid 客户端将只下载上次更新后的索引变化,只下载新的 entry.json 文件而不是完整的索引。

游戏
Wilson(42865)
发表于2023年03月02日 14时47分 星期四
来自小无知气球旅行
开源游戏引擎项目 Godot 释出了 4.0 版本。该版本经历了四年时间开发,合并了 1.2 万个 pull requests,修正了 7000 个问题,有 1500 名贡献者。Godot 4.0 的新特性包括:新的 Vulkan 后端;支持 AMD 的 FSR 1.0,未来将支持 FSR 2.1;为大型开放世界引入了新实时全局照明技术 Signed Distance Field Global Illuminatio;新的渲染优化技术,等等。

开源
Wilson(42865)
发表于2023年02月28日 15时54分 星期二
来自月海沉船
开源多媒体框架 FFmpeg 项目释出了代号为冯·诺依曼(Von Neumann)的 v6.0。FFmpeg 被多媒体应用广泛使用,其中之一是 VLC。FFmpeg 6.0 的新特性包括:CLI 多线程,RISC-V 优化,AV1 硬件编解码支持英特尔、AMD 和英伟达,众多 API 改动,新解码器 Bonk、APAC、APAC、Mi-SC4、100i、VQC、FTR 等等。

人工智能
Wilson(42865)
发表于2023年02月28日 11时38分 星期二
来自幻想曲
Meta 的大语言模型 LLaMA 最近引起了广泛关注,它的一大优势是参数规模更小但性能强于 OpenAI 的 GPT-3 模型,而且能运行在单张显卡上,让普通消费者的硬件也有可能提供类似 ChatGPT 性能的 AI 聊天机器人。LLaMA 是一组大语言模型的集合,其参数规模从 70 亿到 650 亿,它最新的 LLaMA-13B 模型有 130 亿个参数,不到 GPT-3 模型 1750 亿个参数的十分之一。现在 Nebuly AI 推出了首个基于人类反馈强化学习的 LLaMA AI 聊天机器人开源实现 ChatLLaMA。

Linux
Wilson(42865)
发表于2023年02月27日 14时11分 星期一
来自虚拟现实
开源云数据平台公司 Aiven 分析了 GitHub 代码项目,发现最主要的代码贡献者来自于 AWS、英特尔、Red Hat、Google 和微软等科技公司。Aiven 根据贡献者的数量、贡献者的项目以及递交数量三个指标进行分析,结果是微软和 Google 并列第一,Red Hat 第三,英特尔第四,之后是 AWS 和 IBM。在 2022 年第四季度,微软开发者递交的代码数量最多为 128,247,Red Hat 第二 125,012,Google 只有 94,961。而 Google 参与开源项目的人数最多有 5,757 人,微软 5,513 人,Red Hat 3,656 人。对 Linux Kernel 5.16 到 6.1 时代码作者的分析有类似的发现,开发者主要来自 AMD(主要是驱动代码多)、英特尔、Google、Linaro、主要的 Arm Linux 开发组织,Meta 和 Red Hat 等企业,只有 7.5% 的内核开发来自个人开发者。

开源
Wilson(42865)
发表于2023年02月24日 18时27分 星期五
来自时间的地图
微软开源 .NET 运行时项目合并了初步支持 RISC-V 处理器的代码。代码已经在 RISC-V 上成功进行了测试,甚至还运行了简单的 hello world 应用。微软目前没有让 Windows 支持 RISC-V 架构的计划,代码也不是微软程序员递交的,而是三星程序员,这是他在三星工作的一部分。