分享您在数据科学领域关注的 3 个人的名字
Posted: Sun Mar 02, 2025 8:26 am
在此之前,我运营 Decisionstats.com 已有十年。我写博客、卖广告(效果不是很好)、撰写了 3 本数据科学书籍、为 Programmable Web、StatisticsViews 撰写了数十篇文章,还做过一些数据咨询。我甚至为 KDnuggets 撰写了几篇文章。您可以查看我的维基百科个人资料。
我的一天没有固定的。有时我在训练,有时我在编码,很多时候我在开会或打电话。从数据科学的角度来看,我做了一个 CRISP-DM 阶段,使用 Impala 提取数据,运行批处理脚本,使用 PySpark 进行一些分析。用 R 或 Python 进行一些机器学习。在 excel 或 Powerpoint 中呈现数据。
您如何了解数据分析的最 爱沙尼亚手机号码列表 新趋势?您经常访问哪些数据分析资源(即博客/网站/应用程序)?
Ajay Ohri: 我阅读 r-bloggers.com、kdnuggets.com,我也经常关注 LinkedIn 新闻。
。
阿贾伊·奥赫里: 哈德利·威克姆、格雷戈里·皮亚泰斯基·夏皮罗、希拉里·梅森
团队、技能和工具
您最喜欢在工作中使用哪些数据分析工具?您的团队还广泛使用哪些其他工具?
Ajay Ohri: 我非常喜欢 R,接下来是 Python。我也喜欢 SAS。基本上,我对那些减慢分析流程的工具很不耐烦。团队使用 Hadoop 堆栈,但 Hive/Impala 和 Spark 尤其在 Cloudera 堆栈上使用。
您的数据团队中有哪些不同的角色和技能?
Ajay Ohri: 三个角色——数据科学家(PySpark、R 和 Python 上的 MLlib)、数据工程师(Sqoop、Hive)、基础设施管理员(Java、Linux、Shell 脚本)。
帮助描述一些您的团队今年正在解决的问题类型的例子?
Ajay Ohri:我们正在解决向东南亚银行的客户数据库交叉销售更多产品的长期问题。大部分工作都是保密的 - 然而我们经常使用 CDH、PySpark。
我的一天没有固定的。有时我在训练,有时我在编码,很多时候我在开会或打电话。从数据科学的角度来看,我做了一个 CRISP-DM 阶段,使用 Impala 提取数据,运行批处理脚本,使用 PySpark 进行一些分析。用 R 或 Python 进行一些机器学习。在 excel 或 Powerpoint 中呈现数据。
您如何了解数据分析的最 爱沙尼亚手机号码列表 新趋势?您经常访问哪些数据分析资源(即博客/网站/应用程序)?
Ajay Ohri: 我阅读 r-bloggers.com、kdnuggets.com,我也经常关注 LinkedIn 新闻。
。
阿贾伊·奥赫里: 哈德利·威克姆、格雷戈里·皮亚泰斯基·夏皮罗、希拉里·梅森
团队、技能和工具
您最喜欢在工作中使用哪些数据分析工具?您的团队还广泛使用哪些其他工具?
Ajay Ohri: 我非常喜欢 R,接下来是 Python。我也喜欢 SAS。基本上,我对那些减慢分析流程的工具很不耐烦。团队使用 Hadoop 堆栈,但 Hive/Impala 和 Spark 尤其在 Cloudera 堆栈上使用。
您的数据团队中有哪些不同的角色和技能?
Ajay Ohri: 三个角色——数据科学家(PySpark、R 和 Python 上的 MLlib)、数据工程师(Sqoop、Hive)、基础设施管理员(Java、Linux、Shell 脚本)。
帮助描述一些您的团队今年正在解决的问题类型的例子?
Ajay Ohri:我们正在解决向东南亚银行的客户数据库交叉销售更多产品的长期问题。大部分工作都是保密的 - 然而我们经常使用 CDH、PySpark。