solidot新版网站常见问题,请点击这里查看。

“没有数据这回事”

评论 人工智能
wanwan (42055)发表于 2022年06月01日 16时36分 星期三

来自破译滑铁卢
技术充满了各种叙事,但是最大声也是最持久的一个是人工智能和所谓的“数据”。我们被告知,AI是未来,一切都与数据有关——所以数据就是未来,我们应该拥有它,也许还会为此付出代价。各国也需要数据战略和数据主权。数据是新的石油。这多半是胡说八道。没有所谓的“数据”,它一文不值,它无论如何也不会属于你。更明显的是,数据不是一个东西,而是无数不同信息的集合,每一种信息都专属于特定的应用,不能用于别的事情。例如西门子有风力涡轮机遥测数据,伦敦交通局有刷票的数据,这是不可互换的。你无法用涡轮机的遥测数据规划新公交线路,如果你把这两套数据都交给 Google 或者腾讯,也不能帮他们建立更好的图像识别系统。

这种直截了当的说法似乎不值一提,但是它指出“中国有更多数据”之类常见的论调是无用的——更多的什么数据?美团每天要交付 5000 万份餐厅订单,这让它可以构建更高效的路由算法,但是不能将其用于导弹制导系统。你甚至不能用它在伦敦建立餐厅外卖业务。“数据”是不存在的——只有许多的数据集。当人们谈论数据时,他们主要指的是“你的”数据——你的信息以及你在互联网上所做的事情,其中一些被科技公司筛选、汇总并获取。我们想要更多的隐私控制,我们也认为应该拥有这些数据,无论它们在哪里。麻烦在于,“你的”数据中的大部分意义并不在于你,而是在于所有你与其他人的互动。你在 Instagram 上发布的内容意义不大:重要的是谁喜欢你的内容,他们还喜欢什么,你喜欢什么,还有谁喜欢它,谁关注了你,他们还关注了谁,以及谁关注了他们等等,在数以百万计的人的互动网络中向外延伸。