介绍
人类文明很早就开始整理、解释和总结数据,以挖掘其价值和洞察力。 帕坦伽利(公元 400 年之前)编纂了196 部《 瑜伽经》,试图简化瑜伽科学。应用数据科学的另一个例子是分类,希腊哲学家亚里士多德(公元前 384-322 年)首次将人类知识领域划分为数学、生物学和伦理学等不同学科。
数据科学
数据分析的演变
20 世纪初,统计学家Gosset在一 埃及手机号码列表 家啤酒厂工作,他运用自己的统计知识(无论是在啤酒厂还是在农场)来筛选产量最高的大麦品种。进入 21 世纪,统计建模在很大程度上仍是数学家和统计学家的专利,直到最近,Excel、SAS 等软件工具以及 R 和 Python 等编程语言使来自各个领域的从业者能够使用现成的方法和库来应用统计算法。
SAS 的诞生
数据科学的数字化时代始于 20 世纪中期,当时北卡罗来纳州立大学 (NCSU) 农业系启动了该项目,该项目成为统计分析系统 (SAS) 的基础。20 世纪 70 年代初,该软件主要租借给其他农业部门,以分析土壤、天气和种子品种对作物产量的影响。SAS 软件在银行、金融、保险、制药行业非常受欢迎,并在新数据时代继续占据主导地位。它已经发展到支持文本分析、自然语言处理、高性能分析和可视化的需求。这继续统治着大型企业的统计建模。