蕾妮·m·p·蒂特

2022年12月19日

数据科学家的SQL

构建用于分析的数据集的初学者指南

约翰·威利父子2021年

经济学家和其他社会科学家习惯于处理数据,这些数据被很好地组织成一个表格,上面是一系列变量名,右边是一系列观察结果或数据点。当数据来自我们进行的调查时,也会自然地采用这种格式。但是,由企业和我们所有在线活动产生的大量数据通常以不同的方式组织。在企业环境中,获得正确的数据并将其放入可进行分析的表格中的第一步与后续的分析一样重要且具有挑战性。自20世纪80年代以来,SQL(结构化查询语言)一直是访问数据库中的信息的标准语言。

在这期节目中,我采访了蕾妮·蒂特,也被称为"数据科学Renee在推特上谈论她的新书,数据科学家的SQL:构建用于分析的数据集的初学者指南(威利,2022)。我是从她那里知道蕾妮的流行博客和播客“成为数据科学家”,在这篇文章中,她谈到了她和其他人成为数据科学家的道路。虽然她更多地来自工程背景,但许多经济学家已经从另一个方向成为数据科学家。他们正在培养自己的数据库和编程技能,以补充他们的统计和社会科学培训,这要么是因为科技行业的新工作,要么是因为这带来了新的学术研究可能性。SQL是这个工具包的重要组成部分,这本书是开始学习SQL的好方法。

在我们的谈话中,我们还讨论了她目前在高等教育分析公司担任首席数据科学家的角色Heliocampus以及她对有抱负的数据科学家在申请和面试第一份工作时提出的一些建议。

有关该书(以及交互式SQL编辑器)的更多信息,请访问在这里

宿主彼得Lorentzen他是旧金山大学经济系的主任,在那里他创建了一个新的应用经济学硕士学位专为培养学生经济学和数据科学技能的结合而设计,使他们能够在新的数字经济中取得成功。

收听更多节目:

您的主机

彼得Lorentzen

彼得Lorentzen是旧金山大学的经济学教授。他是旧金山大学的校长应用经济学硕士课程,专注于数字经济。主要研究方向为中国政治经济学。

了解更多

由Peter Lorentzen主持

Baidu