如何雇佣数据科学家
知识就是力量,但前提是你能从数据中提取知识。数据科学家帮助企业处理数据,收集可用于改进产品和服务,更好地达到目标市场的见解。
那么,如何找到数据科学顾问呢?以下是一些如何在Upwork上找到顶级数据科学家的建议。
如何筛选数据科学专业人士
当你在浏览可用的数据科学顾问时,列出你可能想要面试的自由职业者的候选名单是很有帮助的。您可以根据以下条件筛选配置文件:
- 的专业性。谁为你的业务和项目定制了他们的提交?看看他们的Upwork简介:他们一般是如何展示自己的?
- 人才。因为数据科学家既是工程师,又是统计学家,又是计算机科学家,所以从他们的提案、简介和作品集中可以清楚地看到,他们拥有完成这项工作所需的特定技能组合。
- 体验。这位自由职业者以前是否为你所在行业的其他人工作过,或者处理过类似你的项目?
- 反馈。之前的客户对他们的工作有什么要说的吗?回顾反馈可以让你深入了解他们的沟通能力、解决问题的能力,以及做出伟大产品的能力。
- 投资组合。他们以前处理过复杂的数据项目吗?结果是什么?每个示例都应该提供一个描述,它可以解释他们需要解决的问题和其他项目需求。确保他们能够解释他们作品集中的作品是如何与你想要回答的问题相关联的。
如何写一份有效的数据科学职位
首先,明确你想要什么,以及完成这些目标所需的技能。在此基础上,考虑将项目进一步分解为数据科学专业人员需要了解的具体技术。利用简报中的信息来创建一个详细的工作岗位,以吸引你正在寻找的自由职业者类型。首先定义一个工作范围,专注于以下三件事:
- 结果:你期望什么成果?
- 目标:你的最后期限是什么?
- 时间:你的项目的开始和结束日期是什么?
你还需要强调你所寻找的特定技能。数据科学包括一系列领域,从计算机科学到统计分析,从机器学习到数据可视化。您还需要确保他们熟悉将在项目中使用的工具,无论是像R或Python这样的统计语言,还是像Hadoop这样的数据库技术。
准备好为您的业务或组织利用数据的力量了吗?今天就登录并在Upwork上发布你的数据科学工作.
数据科学家常见问题解答
什么是数据科学?
无论是使用A/B测试在两种设计之间进行选择,还是通过收集正确的KPI来衡量营销渠道的性能,还是通过对竞争对手进行数据挖掘来获得关于如何接近目标市场的新见解,数据科学家都能为您提供所需的情报,以做出明智的商业决策。
以下是你应该在数据科学专业人士中寻找的技能的快速概述:
- 数据科学和分析(例如,定量分析,建模,统计)
- 机器学习
- 语言,如R, Python, MATLAB
- Spark和Hadoop等大数据框架
- AWS等云平台
数据科学家帮助企业利用数据获得成功所需的答案。
为什么要雇佣数据科学家?
“数据科学家”这个词有很多令人困惑和模棱两可的地方。数据科学家实际上可以描述几个不同的专业,我们将在这里概述。
- 一个数据分析员是一个花费大部分时间查询数据库的人。他们通常是最初级的数据科学家,在统计分析或算法方面可能有很多经验,也可能没有。它们最适合回答通过从Excel或SQL数据库提取数据来回答的特殊问题。他们还应该能够根据需要使用Tableau等工具生成基本的可视化效果。如果您已经有一个构造良好的数据库,并且只需要有人回答特定的问题,那么数据分析师可能非常适合您。
- 一个数据工程师比起运行特定的查询,更愿意构建系统以帮助提供答案。与数据分析师不同,数据工程师经常直接与开发人员一起工作,确保相关系统正确地捕获和存储数据。它们还确保计划的处理作业按计划运行。他们最需要的可能是Hadoop和Spark等大数据框架的专业知识,以及Java和Python等面向生产的编程语言的知识。
- 一个数据科学家需要能够监督复杂的数据项目从开始到执行。除了拥有出色的技术技能,他们还需要能够有效地将自己的发现与组织中的其他人交流。他们还应该能够管理一个团队。他们应该能够像分析师一样查询数据库,但也能够根据手头的任务,使用统计技术和机器学习执行更复杂的分析。
所以,在你继续之前,问问你自己:我想解决什么问题?数据科学家可以用数据帮助指导组织的决策过程。以下是一些数据科学家可能会帮助您回答的常见问题:
- 我们如何提高用户留存率?
- 谁是我们最有价值的客户?
- 我们怎样才能减少员工的流动率呢?
- 我们应该优先考虑哪些新特性?
正如您所见,这些问题直接关系到您业务目标的核心。一旦你确定了一个或一组问题,你就可以开始了解更多细节了。回答这些问题需要哪些数据?你目前正在收集这些数据吗?您将使用什么标准来衡量成功?
您要寻找什么样的数据科学家取决于以下几点:您试图回答什么样的问题,您的数据操作的当前状态是什么,以及您的团队目前使用的是什么技术。
这在很大程度上取决于您当前的数据设置。回答你的问题是否需要你开始收集以前没有收集过的数据?如果是这样,你就需要一名数据工程师与你的开发团队合作,确保追踪器的设置正确,并确保收集到的数据到达正确的地方。如果你还没有一个稳定的数据管道,这本身就是一笔巨大的工程支出。一旦收集了所需的数据,需要处理多少数据?如果您的数据是杂乱的(意味着它需要重新格式化或以其他方式转换后才能使用),这将增加另一层复杂性。
目前,编程语言Scala和大数据框架Spark非常有价值。根据Stack Overflow Developer Survey,使用Scala、Spark和Hadoop的数据科学家在这一领域的费率最高,而使用R、Java和Python的数据科学家通常收费较低。
雇佣一个数据科学家要花多少钱?
数据科学是一个热门领域,合格的数据科学家可以比其他类型的开发人员或业务分析师收取更高的费用。在Upwork上,自由数据科学家的收费从每小时36美元到200美元不等,平均项目成本约为400美元。但是,请记住,当考虑到Scala和Spark等更具体的技能时,这些比率会上升。也就是说,根据你的项目范围来协商项目费用可能更有意义。
请记住,除了临时查询之外,大多数数据项目都是长期承诺。你需要一个熟悉你的系统的人,他可以帮助你衡量你的决策随着时间的推移所产生的影响。出于这个原因,你也可以考虑保持器的安排。下面我们列出了一些常见的数据科学项目,以及一些相关的技能和一些数据科学家收取的小时费率范围。
类型的项目 | 相关技能 | 小时费率 |
分析和特别查询 | Excel、SQL、可视化 | $20-$100 |
建立一个数据管道 | Java、Python、Scala、Hadoop、Spark、数据清理、, | 25 - 100美元 |
构建一个推荐引擎 | 统计分析,机器学习,Python, Scala, Spark | $50-$210 |
数据科学家和数据分析师的区别是什么?
数据科学家和数据分析师是不可互换的,但他们都有一个共同的目标:从数据中提取见解。虽然他们的技能会有重叠(在很多方面,数据科学家都是高级分析师),但通常情况下,数据科学家会拥有更广泛和更深层次的技能,尤其是在商业敏锐方面。他们将拥有分析师日常不需要的技术知识,比如对Hadoop、高级统计建模、人工智能和机器学习的深入了解。
这两位专业人士都可以将数据转化为企业所有者做出更好决策所需的答案,但他们的出发点和获取这些答案所需的技能各不相同。数据分析师可以回答您的业务问题,但数据科学家可以帮助您制定新的问题,以推动业务向前发展。当涉及到复杂性时,您可能需要一位数据科学家。
让我们快速地看看它们各自做什么。
数据分析员
数据分析师利用已知的数据,收集可操作的见解,并回答你对数据的具体问题。这些专业人士将从数据中获得的见解引入教育、医疗和旅游等行业,帮助航空公司和医院等企业更好地运营,并为客户提供更好的服务。
它们的价值在于能够使数据(例如,输入CRM或从Google Analytics导出的数据)对您和您的公司更有用。一般来说,分析师会
- 清理和分类数据
- 发现新的模式和关联
- 找到可操作的见解并将其打包以供业务使用
- 使用可视化和交互式仪表板来呈现调查结果
- 查询数据以满足特定需求
- 为关键涉众创建报告
当涉及到非结构化数据时,分析师可能会与数据科学家或数据工程师一起获得帮助,提取新的数据集进行分析。
数据科学家
为什么大多数数据科学家的收费几乎是数据分析师的两倍?数据科学家拥有更广泛更深入的技能,尤其是在商业敏锐性方面。这些专业人士创建了企业用来预测未来销售、做出关键决策或推出产品的算法和模型。他们能够用更困难的数据做更多的事情,包括
- 挖掘大量的结构化或非结构化数据
- 数据仓库
- 高级编程,使用R, SQL, Python, MatLab和SAS
- 统计建模
- 开发机器学习和预测分析模型
- 使用Hadoop生态系统,包括Hive和Pig
- 制定重要的商业问题和假设,然后用数学和统计学测试有效性
一个很大的不同是他们的工作能力复杂,非结构化数据例如,您的公司目前无法理解或无法使用的数据,因为这些数据来自多个断开连接的数据源。如果分析师主要处理您的“已知数据”,那么数据科学家就可以处理您公司的任何未知或当前无法理解的数据。
当企业做出关键决策时,数据科学家扮演着关键角色。它们检验理论和假设,其结果成为关键利益相关者可以用来预测结果和做出更明智的决定的大开眼界的见解。
如何采访数据科学家?
在面试过程中,一定要抓住机会了解数据科学家解决问题的方法、他们的经验,以及他们过去是如何利用创造力和才能实现类似目标的。
提前准备面试问题,这样你会自信地认为你已经涵盖了所有相关的要点。我们创建了一个数据科学面试问题列表,你可以参考,但这里有一些额外的问题需要考虑:
- “你认为我们现有的产品怎么样?”有什么事情是我们本来可以做但现在没有做的?”对其进行裁剪,以询问与您的数据项目相关的问题。您现有的数据管道或算法,或了解他们是否做了他们的功课。
- “告诉我你参与过的三个数据科学项目?”询问他们最相似的项目、最喜欢的项目或最近的项目。倾听他们如何解决最初的问题,在这个过程中遇到的挑战,以及他们如何解决这些问题。
- “你们的生产时间表是什么?”了解更多关于他们工作的速度,他们在之前的数据项目上花费了多少时间,以及他们如何接收和执行反馈的细节。
- “是什么造就了一个伟大的[在此插入项目类型]?”了解他们如何处理你的项目,以及他们做类似工作的经验。