solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年04月24日 21时23分 星期一
来自空气的颜色
在德国汉堡郊区的一栋房子前,邮箱上涂了一个单词 LAION。LAION 代表 Large-scale AI Open Network,是高中教师 Christoph Schuhmann 的一个业余爱好项目。他在业余时间和一群志愿者建立了世界上最大的开源 AI 数据集。该数据集被 Google Imagen 和 Stable Diffusion 等用于训练文本图像模型。Schuhmann 常去 Discord 上的一个 AI 狂热者聚集的群组,当时 OpenAI 的第一代 DALL-E 模型刚刚发布,他既受鼓舞也感到担忧,担心这可能会鼓励科技巨头不开放数据。他和该群组的成员因此创建了一个开源数据集帮助训练文本图像模型 diffusion。仅仅三个月时间,他们发布了一个包含 4 亿对图像及其文字描述的数据集。今天这个数字超过了 50 亿,是世界最大的免费图像和文字描述数据集。当 Emad Mostaque 在 2022 年创建 Stability AI 时,他使用 LAION 训练了模型 Stable Diffusion,还雇佣了两位该组织的研究人员。一年之后,该公司的估值接近 40 亿美元,很大程度上要感谢 LAION 提供的数据。 Schuhmann 没有从中获得任何收入,他也没有兴趣这么做,他想要保持独立。

人工智能
Wilson(42865)
发表于2023年04月19日 23时44分 星期三
来自怒火重燃
AI 创业公司 Stability AI 宣布开源其正在开发中的语言模型 StableLM。该模型的 Alpha 版目前有 30 亿和 70 亿参数两个版本,之后将发布 150 亿和 650 亿参数的版本。其基础模型快照(checkpoints,也就是今天提供的 StableLM-Base-Alpha)采用 CC BY-SA-4.0 授权,微调版本 StableLM-Tuned-Alpha 采用非商业的 CC BY-NC-SA-4.0 授权,所有代码使用 Apache License 2.0 授权。Stability AI 表示开发者可将其模型用于商业使用或研究目的。

开源
Wilson(42865)
发表于2023年04月18日 23时01分 星期二
来自异形:痛苦之河
开发国产 GPU 的摩尔线程开发者最近向 Video Acceleration API (VA-API) 库和 FFmpeg 项目贡献了代码,加入了 VAProfileH264High10 支持。摩尔线程的工程师在代码注解中称,该公司最新的产品 TTS80/MTTS2000/MTT3000 都具有在最高 8k 分辨率上编解码 H264High10 的能力。此外还支持 AVS+ 和 AVS2 视频解码,计划未来加入到 VAAPI。

软件
Wilson(42865)
发表于2023年04月14日 14时01分 星期五
来自火星超人
Servo 项目计划迁移到布局引擎 Layout 2020。Servo 是用 Rust 语言开发的实验性浏览器引擎项目,最初由 Mozilla 发起,2020 年 Mozilla 大裁员期间裁掉了 Servo 引擎团队,Servo 的开发此后陷入了停滞。Servo 项目后来找到 Linux 基金会托管,寻求为其它项目提供一个高性能的、安全的、可嵌入的模块化渲染引擎。过去几个月,项目的开发再次活跃。本周四,官方博客表示计划迁移到 Layout 2020 引擎。Servo 项目目前有两个布局引擎——Layout 2013 和 Layout 2020,顾名思义,其开发分别始于 2013 年和 2020 年,其中 Layout 2020 设计弥补 Layout 2013 的多个不足之处,开发者表示他们认为 Layout 2020 是项目继续前进的最佳布局引擎,计划不久之后迁移到该引擎。

微软
Wilson(42865)
发表于2023年04月13日 23时27分 星期四
来自华龙之宫
微软开源了 DeepSpeed Chat,帮助用户加速训练类似于 ChatGPT 的模型。DeepSpeed Chat 能够简化 ChatGPT 类型模型的训练过程、强化推理体验。其中的 DeepSpeed-RLHF 系统能够在推理和训练两种模式之间进行切换,使复杂的 RLHF 训练速率更快、易于大规模推广。DeepSpeed-HE 比现有系统快 15 倍以上,且成本更低。在微软云 Azure 上,该系统只需 9 小时即可训练一个 OPT-13B 模型,只需 18 小时即可训练一个 OPT-30B 模型,且这两种训练分别花费不到 300 美元和 600 美元。

开源
Wilson(42865)
发表于2023年04月08日 22时32分 星期六
来自全面启动
过去一年俄罗斯政府屏蔽了逾万网站,其中包括知名社交网络 Facebook、Twitter 和 Instagram。俄罗斯人转而通过 VPN 等工具绕过封锁。但俄罗斯政府随后又封锁了流行 VPN 服务使用的 IP 地址。现在一种开源 VPN 客户端 Amnezia 帮助俄罗斯用户挫败新的封锁。不同于商业 VPN 服务通过企业服务器路由用户,Amnezia 允许用户设定自己的服务器,选择自己的 IP,使用难以屏蔽的协议。Amnezia VPN 类似 Google Jigsaw 开发的开源工具 Outline,它是在 2020 年举行的一次黑客马拉松活动中创造出来的,它目前有大约 10 万用户。

开源
Wilson(42865)
发表于2023年03月31日 12时38分 星期五
来自乌鸦从高塔坠落
加州伯克利、斯坦福、卡内基梅隆和加州圣迭戈的研究团队宣布了开源聊天机器人 Vicuna-13B,它是基于 Meta 的大语言模型 LLaMA,使用了用户通过 ShareGPT 分享的 7 万对话样本进行微调。研究人员让 OpenAI 的 GPT-4 作为裁判去对比 Vicuna-13B 以及 ChatGPT 和 Google Bard,结果显示它在质量评估中能达到 ChatGPT 的九成左右。Vicuna-13B 的训练成本只花了 300 美元。 Vicuna-13B 的代码使用 Apache License 2.0 许可证,研究人员计划释出其模型权重。

开源
Wilson(42865)
发表于2023年03月30日 23时23分 星期四
来自异形博恩
curl 项目作者 Daniel Stenberg 称收到了彭博社开源项目办公室的来函,curl 项目成为彭博社 FOSS Contributor Fund 基金的首个赞助对象,它通过 Open Source Collective 向其资助 1 万美元。 curl 项目不是法人,不能自己持有资金或任何资产,它的所有资金都由 Open Source Collective 托管。

人工智能
Wilson(42865)
发表于2023年03月21日 18时02分 星期二
来自霸主的影子
OpenAI 的 ChatGPT(GPT 3 版本)是基于大语言模型,专门训练以文本形式的对话与用户互动。它不是基于多模态模型,不支持图像或语音的输入输出。如果我们想要构建一个类似 ChatGPT 的支持图像理解和生成的系统,那么可能需要使用一个多模态会话模型进行训练。但此类的训练需要消耗大量的数据和算力资源。与此从头开始构建一个全新的系统,不如站在巨人的肩膀上。微软亚洲研究院的研究人员在预印本网站 arxiv 上发表论文《Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models》,提出在 ChatGPT 和多个 Visual Foundation Models 基础上构建 Visual ChatGPT。源代码托管在 GitHub 上。

开源
Wilson(42865)
发表于2023年03月20日 21时24分 星期一
来自通往宇宙之门
庆祝项目诞生 25 周年,curl 作者 Daniel Stenberg 宣布释出 v8.0.0 ,称该版本没有 API 或 ABI 破坏,也就是不会造成向后兼容性问题。该版本修复了 6 个新漏洞,其中 5 个危险等级低,另外一个为中等。它的另一个主要变化是构建系统不再支持缺乏可工作 64 位数据类型的系统,其它主要是 bug 修复。

开源
Wilson(42865)
发表于2023年03月20日 14时15分 星期一
来自星火
curl 作者 Daniel Stenberg 回顾了项目经历的二十五年。发布 curl 首个版本时是他只有 27 岁,当时是 Frontec Tekniksystem 的软件工程师,主要是为瑞典产品开发公司从事嵌入式系统的合同开发工作。他当时养成了一个习惯,每天晚上会熬夜花一两个小时从事个人项目的开发。curl 背后的开发理念是逐步迭代在所有方面进行改进,它也并不是突然流行起来的,用户数是逐步增长的,在 1998 年只有少数用户,到 2010 年增加到数亿用户。很难估计现在 curl 有多少用户,但估计远超 100 亿,URL 的 API 库 libcurl 几乎被每一个联网的设备和系统使用。他的 curl 之路始于 1996 年底,他下载了 Rafael Sagula 开发的工具 httpget,每天自动下载货币汇率,确保他的货币兑换器能正常工作。httpget 有些漏洞,他向作者递交了补丁。Rafael 认为他可以接手维护该项目,所以他接手了。他逐步加入了对 GOPHER 的支持,改变项目名称,增加对 FTP 的支持,在 1998 年初增加了对 FTP 上传的支持...后面就是历史。

开源
Wilson(42865)
发表于2023年03月20日 13时35分 星期一
来自迷宫之屋
LLVM 编辑器套件释出了 v16.0.0,主要新变化包括:默认用 C++17 构建,工具链的软要求现在变成硬要求——构建需要 GCC 版本>= 7.1,Clang >= 5.0,Apple Clang >= 10.0,Visual Studio 2019 >= 16.7,CMake >= 3.20.0;Clang 默认的 C++/ObjC++ 标准是 gnu++17 而不是 gnu++14,等等,更多可浏览详细的发布公告。

商业
Wilson(42865)
发表于2023年03月16日 11时29分 星期四
来自喀迈拉空间
Docker 向所有 Docker Hub 用户发去邮件,如果他们是以组织的名义创建账号,那么他们的账号将被删除,所有镜像也将一并删除,除非他们升级到一个付费的团队方案——其年费为 420 美元。Docker Hub 被很多开源项目用于发布镜像,而绝大部分开源项目是没有多少资金的。此举引发了争议,很多人开始将其镜像迁移出 Docker 转到其它平台或自托管。没有自己的基础设施依赖于私有平台都会存在风险。

开源
Wilson(42865)
发表于2023年03月16日 10时27分 星期四
来自为了我们的家园
去年 8 月举办的 SIGGRAPH 国际图像学年会上,梦工厂动画宣布其私有渲染器 MoonRay 将在年内开源。梦工厂开源的进展略微滞后了几个月。本周四,梦工厂动画在 Apache License 2.0 许可证下公开了 MoonRay 源代码,项目托管在 GitHub 上。MoonRay 是梦工厂内部开发的蒙特卡洛路径追踪器,被用于制作《驯龙高手3》、《疯狂原始人2》、《坏蛋联盟》和《穿靴子的猫2》。MoonRay 使用的基于云端的分布式计算框架 Arras 也包含在开源代码库中。

云计算
1
Wilson(42865)
发表于2023年03月14日 23时49分 星期二
来自驶入深海
编程问答社区 Stack Overflow 调查了数千名开发者,询问哪些新兴的技术趋势已经证明了自己。它将一个技术根据 0-10 的尺度进行评分,其中 0 代表实验性,10 代表已被证明。结果显示,被认为已获得证明得到广泛认可的技术是开源 6.9、云计算 6.5 和机器学习 5.9,被认为尚未证明的技术包括量子计算 3.7,纳米技术 4.5,低代码/零代码 4.6。对于下一个人人都将使用的技术,AI 高居第一,之后是开源、机器学习和云计算。调查还根据 0-10 的尺度对一项技术产生正面还是负面影响进行评价(0 代表负面,10 代表正面),结果显示开源技术得分最高 7.2,可持续技术 6.6,机器学习 6.5。 低代码/零代码的评价非常低,这可以理解,因为这可能会对部分开发者的职业安全产生冲击。大多数开发者认为,低代码/零代码以及区块链在未来不会广泛使用。

开源
Wilson(42865)
发表于2023年03月14日 14时05分 星期二
来自太阳系大乐透
WordPress.com 网站将有更简单的方法整合到联邦平台。WordPress.com 和 Tumblr 等服务的母公司 Automattic 收购了 ActivityPub for WordPress 插件,招募了该插件的开发者。ActivityPub 是一个开放去中心化社交网络协议,被 Mastodon、Pixelfed 和 PeerTube 等应用使用。ActivityPub 插件允许其他联邦平台的用户订阅 WordPress 博客。该插件目前支持 Mastodon、Pleroma、Friendica、HubZilla、Pixelfed、SocialHome 和 Misskey。Automattic CEO Matt Mullenweg 去年曾表示 Tumblr 将加入对 ActivityPub 的支持,他还没有公布任何 WordPress 相关的计划。

开源
Wilson(42865)
发表于2023年03月10日 22时10分 星期五
来自平行恋人
cURL 作者 Daniel Stenberg 宣布将在 3 月 20 日举行 25 周年庆祝活动,通过 Zoom 在线举办,人人都可以参加。cURL 的官方诞辰日是 1998 年 3 月 20 日,但它的历史可以追溯到 1996 年,当年的 11 月 11 日,Rafael Sagula 发布了工具 httpget,该项目吸引了 Stenberg,他开始为它贡献代码,httpget 0.1 只有不到 300 行 C 代码。同一天另一个工具 Wget 也发布了首个版本,但它的容量高达 171 KB。之后不久 Stenberg 接管了 httpget 的维护工作,扩展了它的功能,加入了对 Gopher 和 FTP支持,后为了避免名字产生混淆而改名为 urlget,1998 年加入了对 FTP 上传的功能后再次改到为现在的名字 cURL,c 读做 see,意思是 see URL。今天 cURL 及其 API 库 libcurl 几乎被每一个联网的设备和系统使用。

开源
Wilson(42865)
发表于2023年03月10日 17时08分 星期五
来自发条人偶
字节跳动本周主办了 CloudFW Open System Firmware 研讨会,庆祝 CloudFW 2.0 的发布。CloudFW 2.0 是该公司替代 UEFI 的自由固件 Coreboot 的实现。字节跳动的开发者表示计划在该公司基础设施使用的不同架构上运行 Coreboot 和 LinuxBoot。字节跳动称,相比 Linux 社区,UEFI/EDK II 社区不怎么活跃,由于关键模块控制在 BIOS 供应商(IBV)手中,UEFI/EDK II 的问题无法快速得到修复。

Android
Wilson(42865)
发表于2023年03月03日 13时54分 星期五
来自发条女孩
开源 Android 应用商店 F-Droid 释出了 v1.16,其中一大变化是更新了库索引格式。随着愈来愈多的应用进入 F-Droid 商店,记录所有应用及其元数据的库索引的容量也愈来愈大。目前压缩后的索引大小为 8MB,每次 F-Droid 客户端更新索引时都需要重复下载这 8MB 文件。现在为了减少体积,支持增量下载,开发者实现了 RFC 7396 JSON Merge Patch,F-Droid 客户端将只下载上次更新后的索引变化,只下载新的 entry.json 文件而不是完整的索引。

游戏
Wilson(42865)
发表于2023年03月02日 14时47分 星期四
来自小无知气球旅行
开源游戏引擎项目 Godot 释出了 4.0 版本。该版本经历了四年时间开发,合并了 1.2 万个 pull requests,修正了 7000 个问题,有 1500 名贡献者。Godot 4.0 的新特性包括:新的 Vulkan 后端;支持 AMD 的 FSR 1.0,未来将支持 FSR 2.1;为大型开放世界引入了新实时全局照明技术 Signed Distance Field Global Illuminatio;新的渲染优化技术,等等。