博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
择业需谨慎!为何数据科学或许不值得?
阅读量:2089 次
发布时间:2019-04-29

本文共 1890 字,大约阅读时间需要 6 分钟。

全文共1859字,预计学习时长6分钟

 

图源:simplilearn

 

从某种程度上说,数据科学已经成为一片红海了。所谓的21世纪最热门的工作可能并没有那么受欢迎。即使现在,人们和公司都利用它来创造价值和赚取金钱,但这真的是未来的职业吗?

 

虽然这个观点可能存在一定的偏见,每个人所在的国家地区、所具有的技能也不尽相同,不一定适合所有人,但笔者看来,这个观点仍然有一定的道理。

 

如果你正在做与软件相关的工作,或许你已经考虑过转换到数据科学领域的选择。为什么不呢?该领域的工作遍处都有,其薪水通常比软件开发工作的薪水更高,而在工作职称中加上“科学家”一词会更令人骄傲。

 

但这也许不是最后一份工作。在领域内工作了一段时间之后,探索了很多库和其他有趣的东西,写了约80篇与数据科学相关的文章,与此同时还探索了其他选项,我发现自己有能力消化关于该领域的积极内容和负面内容。

 

本文的焦点将主要集中于负面内容,互联网上充斥着“为什么要成为数据科学家”和“一个月内学习数据科学”这类文章。但或许数据科学并没有你看到的那么完美,它有好处也有缺陷,这些缺点你也应该了解。

 

图源:Unsplash

 

 

1.数据科学正在实现自动化

 

如果是一些热门词汇引导你进入该领域,诸如预测建模,机器学习等之类,不要误会,很多事物在这里还无法实现自动化,但是其中很大一部分已经实现了自动化。

 

令人遗憾的是,尽管人们担心常规工作会变得自动化,但实际上我们已经将所有有趣的工作自动化了。

 

你目睹过专业的云环境吗?没有也没关系,因为实在不怎么样。可以使用的算法数量基本上是有限的,只要以正确的方式准备数据,知道的准确度越高,任何人都可以测试所有组合,最终得到一个不错的解决方案。

 

与有着10年以上经验的资深数据科学家相比,你的开发会逊色点。如果只是提高2%的准确性,它的重要程度该如何衡量呢?

 

尽量从雇员和雇主的角度来思考这一点。由数据科学家团队提供的略微好些的模型真的值得花费时间和金钱吗?对于一些公司来说,这是值得的,但是这些企业中的大多数会完全适应 “企业云环境”。

 

图源:unsplash

 

 

2.数据科学很无聊

 

是的,你没有看错。大多数数据科学工作说到底就是从源表中提取数据,然后进行一些汇总和计算,将结果存储在适合分析的新表中。这完美地描述了ETL过程,而不是数据科学。

 

而且,你还得花费一些时间来清理和准备数据,这又与纯粹的数据科学无关。最后,处理预测建模的一个部分——该部分也不是新鲜事物,但是在最近几年中非常流行。

 

这三个组成部分结合在一起,再加上不错的演示和沟通技巧,这就是典型的数据科学家。

 

数据科学会不会改变世界?

 

既会也不会。会是因为专业人士将能够更好地完成工作,比如医生;而不会是因为你对ETL管道的兴趣绝对不会有人关注,与是不是“数据科学家”职位无关。

 

 

3.工作清单糟透了

 

进入最喜欢的工作清单网站并搜索数据科学的工作,你会期待出现SQL,Python,R语言,统计信息之类的技能。问题是,这只占到工作内容的30%!

 

其他一些可能包括常规编程,API,版本控制,甚至可能包括一些前端技能,糟糕极了。即使你有软件开发的经验而且掌握了所有涉及的技能,在数据科学领域也不一定能有你的一席之地。

 

来看看2020年5月16日Indeed.com上的列表,该列表仅适用于美国:

 

数据科学 — 9474份工作

 

软件开发员 — 66647 份工作

 

现在,情况大有不同。你现在可能会认为软件开发的前景比数据科学要广得多,所以有更多的工作可供选择。的确,这也是为什么笔者想在软件开发——Java开发员中寻找一个更狭小的领域。下面看看工作清单的数量:

 

Java开发员— 29324

 

几乎多3倍。就算这个数据说服不了你,但另一个事实绝对可以:大多数数据科学的职位都是高级职位。

 

大多数中小型公司对数据科学家的需求与对软件开发人员的需求不同,他们甚至是在寻找自己公司的首位数据科学家。你真的认为他们会雇用一名实习生或一名初级人员来处理与数据科学相关的工作?劝各位三思而后行。

 

图源:unsplash

 

也许笔者对数据科学有些苛刻。但也许事实就是如此——在做出如此重大的决定时,应该了解其利弊。

 

别误会,数据科学仍然很不错,就是大约90–95%的时间会要腾给ETL、数据处理和准备上,其余5–10%的时间做自己真正感兴趣的事情(预测模型)。

 

如果正在选择职业,笔者希望你能再次认真考虑。

 

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

转载地址:http://sghqf.baihongyu.com/

你可能感兴趣的文章
eclipse git控件操作 回退到历史提交 重置 删除(撤销)历史的某次提交
查看>>
Oracle | 给表和字段添加注释
查看>>
java比较日期大小及日期与字符串的转换【SimpleDateFormat操作实例】
查看>>
Oracle新表使用序列(sequence)作为插入值,初始值不是第一个,oraclesequence
查看>>
java中System.exit()方法
查看>>
在hbase shell中过滤器的简单使用
查看>>
java静态方法和实例方法
查看>>
java多线程并发去调用一个类的静态方法,会有问题吗?
查看>>
关于JAVA中的static方法、并发问题以及JAVA运行时内存模型
查看>>
Java命令学习系列(一)——Jps
查看>>
java如何计算程序运行时间
查看>>
Java Calendar 类的时间操作
查看>>
Java]NIO:使用Channel、Charset(字符集)、使用Charset传递CharBuffer
查看>>
Eclipse下运行Maven项目提示缺少maven-resources-plugin:2.4.3
查看>>
Java 中int、String的类型转换
查看>>
比较两个JSON字符串是否完全相等
查看>>
删除JSONArray中的某个元素
查看>>
Linux下Tomcat重新启动
查看>>
使用HttpClient请求另一个项目接口获取内容
查看>>
HttpClient get和HttpClient Post请求的方式获取服务器的返回数据
查看>>