Page 1 of 1

支持大数据及其相关开放

Posted: Sat Jun 14, 2025 9:47 am
by Bappy10
“数据挖掘”一词在媒体上出现一段时间后,遭到了强烈反对。不出所料,这在很大程度上源于对隐私的担忧。一个典型的例子是美国的“全信息感知”项目。该项目的基本目标是在海量个人数据中寻找可疑的行为模式,以识别可能犯罪(尤其是恐怖主义犯罪)的个人。它的数据包括网页浏览、信用卡交易、驾驶执照、法庭记录、护照信息等等。在引发担忧后,该项目于2003年被叫停(尽管据称该软件仍在被各机构使用)。从最近的事件可以看出,人们对安全机构监控公众的担忧仍在持续。

关键问题在于,那些数据理念的巨大潜力的人是否正在汲取过去的教训。最近,英国媒体对家庭医生记录与医院记录合并的担忧,导致该项目启动被推迟了六个月,这正说明了其中的危险性。就其前景和风险进行合理的、知情的讨论至关重要。

技术是无道德的——它本身既非道德,也非不道德。道德掌握在使用它的人手中。大数据技术、核技术和生物技术都如此。仅从我们已知的案例来看,海量数据集确实有望增进人类福祉,这一点显而易见,但我们必须意识到其中的风险。我们必须找到一个合适的平衡点。

同样需要注意的是,仅仅存在庞大的数据文件本身对任何人都没有好处。要使这 哥斯达黎加电报电话号码 些数据集发挥作用,就必须能够使用数据来构建模型、估计效应大小、确定观察到的效应是否应被视为偶然变异、确保它不是数据质量问题等等。也就是说,统计技能对于利用大数据资源至关重要。正如如果没有技术将大量的地下石油储备转化为动力,它们就毫无用处一样,如果没有技术来分析它们,那么大量的数据也是毫无用处的。或者,正如我有时所说的那样,人们想要的不是数据,他们想要的是答案。而统计数据提供了寻找这些答案的工具。

David J. Hand是伦敦帝国理工学院的统计学教授,也是《统计学:非常简短的介绍》一书的作者。

“非常简短的入门” (VSI)系列丛书以精简的篇幅,融合了权威的分析和涵盖数百个主题领域的宏大思想。这些丛书由我们的专业作者撰写,能够改变您对感兴趣事物的看法,是您了解此前一无所知主题的完美入门读物。每周五阅读 OUPblog 和 VSI 系列丛书,并在 Facebook 上点赞“非常简短的入门” 。通过电子邮件或RSS订阅 OUPblog 上的“非常简短的入门”文章。

通过电子邮件或RSS订阅OUPblog 。仅通过电子邮件或RSS
订阅OUPblog上的数学文章。图片来源:信息感知办公室设计的“全面信息感知”系统示意图。通过维基共享资源发布。

发表于:数学科学与医学非常简短的介绍