今年4月8号的时候,我开始学习R的数据分析师课程。两个月后,我完成了全部16节课+2节额外的课(因为中间DataCamp更新了课程),成功的拿到了一个Data Analyst的毕业证书!加上现在在大学做数据分析的RA工作,我觉得以后可以不惭愧地自称为“数据分析师”了~

Data Analyst 结业证书(虽然真的很土)

刚开始学习的时候我就说,课程结束后一定来写个总结。本来只是想总结这次的学习过程,没想到大脑的思绪一下飞到了很久之前的本科时代,那时的我希望当一个心理咨询师,是万万不能想到自己现在会兼职做data analyst,并且靠这个养活自己的。所以这次的总结就从本科吧!

1 骨骼清奇,练武奇才?不存在的

有些故事的主人公是从开篇就展现出清奇的骨骼,一看就是练武的材料,于是一路升职加薪走上人生巅峰。不过我并没有这么好运。我本科在林大,虽然同样是学心理学,但跟后来读研的师大有很大不同。在师大统计好,论文多,你就牛“哔”;而在林大,释梦和心理分析才是王道。在那里大家每天最津津乐道的是早上起来相互释梦,是自我分析和分析别人,几乎没什么人会在乎你统计学的怎样。那个时候的我正在专心的学习心理动力学、释梦和自我成长。每天过的很开心,现在想起来非常怀念。不过对于统计,大概就只知道t检验和相关分析吧……

2 差一点自废武功,还好贵人相助

毕业后为了考研,自己重新把统计学了一遍。考上师大的时候应该是那段时间统计的巅峰水平了吧!不过开始上研以后,我认为数据分析就只有毕业论文用一下,到时候现学就可以了,于是统计的课并没有好好听过。现在回头想想,红云姐姐的多元统计可是很多博士和外校同学抢着来听的课,我当时就那样划水划过去了,真的完全不懂得珍惜!考研时好不容易学的统计,研一之后已经忘得差不多了。

不过就在我几乎要把之前学的统计都忘光的时候,有两个人救了我:

第一个是我的师兄,本科数学系,他教会了我SEM。 当时因为要发表论文的缘故,导师让我们分析一些师兄师姐们收的数据。分析过程需要用到结构方程模型。我当时哪会呀!于是就去抱师兄大腿。经过他的讲解,我算是懂了SEM的皮毛。尽管当时那批数据结果不好没发表,但后来我的第一篇英文文章就是用SEM分析的。非常感谢他。

第二个是我现在的老婆,她帮我让我学会了因子分析(CFA+EFA)。 事情起源于心理测量的课,其中一项课程作业是要求分组自编问卷。因为她把我拉到了一个没人干活的小组,所以那次课程的问卷编制基本是我在负责,尤其是数据分析的部分,完全是我一个人自学+问前边的提到的师兄搞定的。虽然不是出于本意,不过她确实客观上帮我掌握了一个新的技能。

不过话说回来,SEM,CFA,EFA神马的,都是红云姐姐多元统计课上的内容,我只是把课上没学好的内容通过实践的方法补上了……事实证明:出来混,迟早要还的。

3 转型之旅开始

工作以后,没想到因为师大的一点数据分析的底子,我竟然成了中心最会做数据分析的人!于是能力越大责任越大,中心所有的数据都安排给我来分析。那个时候虽然做着数据分析的工作,可是我的心情是如履薄冰的。因为我知道自己还远远不够,只是出于大家信任,我才能做这些事情。

我并不想一直这样没有信心,于是一直想好好把数据分析学习一下。尤其因为中心有很多数据分析的过程很类似,我非常想学一下编程,把这些分析过程自动化。但是一想到学编程,就觉得是一个很大很大的工作量。毕竟用SPSS已经很熟悉了,重新学编程还需要花时间,还不如直接用SPSS来得快。于是当时并没有下定决心。

神奇的是,后来又有两个榜样,激发了我学编程的信心!(想想自己还真是好运!)一个是从林大一直到师大都是同学的好朋友,他的方向是心理测量,因为工作缘故,业余时间就自学了一点R语言来分析工作中的数据。另一个是水湄物语,她2017年的新年计划上赫然写着要学编程和日语(虽然貌似都没完成 XD)。

看到一个有全职工作,利用下班时间学R语言的同学,和一个边创业边带着3个孩子还能学日语和编程的“过气网红”,我就在问自己:

凭什么自己觉得不能学???

编程听起来很吓人,可是相传是未来人人都能掌握的一个东西。更何况我的编程水平并不是零基础,为什么我不能学呢?!

在激励之下,我决定尝试一下。为了用最短的时间入门,避免少走弯路,我没有自学,而是上了SOTON的网课,理由是当时听了他的讲座**“2017成为数据分析师”**,里边把成为数据分析师需要学习的R和Python的关键内容梳理的非常清楚,让我相信这个事儿是可行的。 当时他就提到,**3个月入门数据分析是完全可行的**!我当时其实是半信半疑的,但现在是120%确信!DataCamp我也只用了2个月就刷完了数据分析师的track,绝对可以算上入门了。抛去我的基础,3个月入门应该也不是问题。所以**想学数据分析,甚至转行做数据分析师的小伙伴一定不要被吓到,真的可以的**!不过也要提一句,入门之后还有很长的路要走哦~

不过2017年我并没有完全学完SOTON的课,应该就仅仅是入门而已,尤其是后边机器学习的部分,我没跟上上课的进度,而且跟我日常工作关系也不大,于是就没有继续了。当时学完后,我应该算只是知道R和Python的基本操作,能分析简单的描述统计和相关罢了。所以2017我并没有成为自己心中认为合格的数据分析师。

4 真正成为合格的分析师

但事情总是这样,你之前学到的东西,不知道什么时候就会用到。后来我竟然依靠一点点入门的R语言技能,在澳洲找到了数据分析的工作。具体过程以前的文章里写过了,就不再赘述了。也是因为这次工作机会的原因,我坚定了学R,而不是Python的道路

刚拿到这份RA的工作,我就给自己定下了一个目标:

这次一定要成为一个合格的数据分析师!把R学好!

我本来想继续学习Udacity的课程,要1000多块钱,我觉得太贵了,就搜了一下其他的平台。很庆幸地找到了DataCamp,里边的课程只要30美元一个月。也就是说如果我3个月学完数据分析的课程,只要不到800块钱。

尽管当时仅仅因为价格原因选择了DataCamp,不过后来才发现,DataCamp上边教R语言的老师很多都是最常用的Package的开发者,还有RStutio的工作人员等等。这基本相当于跟佛洛依德学精神分析,跟荣格学心理分析,跟赛里格曼学积极心理学嘛!简直赚到了!

在报名了课程以后,我每天下班回家的乐趣就是刷一点代码,逐渐体会到了为什么有些程序员会说:刷代码才是世界上最有趣的事情。你自己亲手编的程序运行出来,显示结果,尤其是显示ggplot那种还挺好看的图片的时候,心情真的是非常愉悦的!而且当我用ggplot画图给同时看的时候,同事那种WTF的表情也让我觉得很开心。

一个日常分析时用ggplot画的图

以前我觉得自己不喜欢数据分析,打死都不会想做数据分析师的。不过现在我终于可以安心地说:

自己是一个合格的Data Analyst了,尽管我知道要学的东西还很多。

后来我意识到,自己并不是真的不喜欢数据分析,而只是以前对数据分析的认识不对。因为各种原因,以前分析数据大多是为了证明某个理论是对的,或者证明自己的研究是好的,这样就可以发表,可以毕业等等。这样做数据分析,很多时候并不是在分析数据,而是在操纵,希望可以让数据变成自己希望看到的样子。如果数据结果一致,那皆大欢喜;如果结果不一致,大多数我们不会修改结论,而是修改数据分析的方法,甚至修改数据本身。

面对这样的情况,我会想:

既然你已经心中有一个结论了,那分析这个数据还有什么意义呢?

我不喜欢做这样没有意义的事情,我想大多人都不会喜欢。而对于真正的探索和分析数据,我觉得自己还是喜欢的。从表面的数据看到背后的意义;把别人很难理解的数据,分析称非常容易理解的结果,帮助他们做决策,这些事儿正是我想做的。

希望下半年我可以从一个数据分析师 ,晋级成数据科学家那样就真的实现了小时候成为一个科学家的理想了~

尾声

尽管离完成所有课程已经过去两三天了,不过对当时的感觉印象非常深,没有非常兴奋,只是感觉很寂しい。可能和很多小伙伴刚考完一个重大的考试,或者完结了一个重大的项目的感觉类似吧。那种感觉就是,有一段时间,你花了很多精力和时间投入到一个事情中,每天过的很充实,但是那个东西突然没了,就感觉心理空落落的。

不知不觉学了这么多课程

虽然平时也会听点《得到》什么的,而且毕竟是在读博士,还是要读很多论文,不过很久没有利用业余时间系统性的学习一个新技能了

能完成这个课程让我感觉到自己还有无限的可能,并不会因为30岁了就觉得自己记忆力不行了,或者不能静下心来新的技能了。我在想,可能很多时候我们会低估了自己的学习能力

以前我会认为学一项技能需要很久很久:

  • 觉得学了10年英语都还是不能开口跟外国人说话,觉得一辈子能把一种语言学会就不错了;
  • 觉得学音乐美术都要从娃娃抓起,现在想学已经晚了
  • 觉得编程什么的,那必须是小时候数学很好的人才能学的东西

这些想法都阻碍了我们学习新的技能。

以前学得慢,很多时候是外界条件所限,并不是人的学习能力不够。学英语需要用磁带,反复播放不方便,人们因此还发明了复读机。想看《经济学人》原版杂志可能需要去中关村某个特定的报摊才有几本好几个月前的杂志。可现在在网上可以搜到很多听力材料,youtube上可以直接订阅The Economist的频道。还有很多软件可以给听力断句,想一句一句跟读听写都比以前方便多了。

想学R语言,如果放到10年前,可能真的没办法,因为找不到好老师,相关的书籍也不多。可是现在通过网络,你就可以直接找dplyr的开发者来给你讲课了!

其实在现代社会,尤其是网络如此发达的情况下,学习一门技能的时间已经可以大大缩短了。我觉得平均3个月到1年绝对可以入门一项技能了。甚至有个TED演讲说是20小时,纯的20个小时分散开大概1个月。而纯的100个小时,分散开大概3个月到半年,已经可以完成DataCamp的Data Scientist的track了

而这么好的条件却很少人珍惜。德鲁克每过三四年,就学一个新的学科;扎克伯格每年学习一个新技能。而我们自己呢?你有没有想过大学毕业之后你还学真正掌握过什么新技能?可能很多人唯一掌握的新技能就是开车了

哈,不知不觉从数据分析学习总结文写成了鸡汤文,就此打住吧。总之这次完成数据分析师的课程的意义不仅仅是学会了如何使用R语言做数据分析,更是给了我不断学习的动力和勇气。在这样的激励之下,我又重新捡起了多年前丢下的日语!这是我从高中起就想学的东西!本来因为觉得年龄太大了,已经准备放弃了,但现在我又重新有信心了。希望可以像数据分析师一样,再完成一个长久以来的心愿!

很多小伙伴应该都有很多想学的技能,音乐、运动、美术、编程、日语、摄影、练字、心理学、做饭、打扮、理财等等等等。现在这些技能都可以很容易在网上找到很好的老师,作为入门网络教学也够了。不要担心自己年龄大了(我以前竟然刚上大学就担心自己是不是年龄太大了,学钢琴还来得及么),或者自己工作忙没时间。如果真的想学就尝试开始学吧!最好是能报一个课程或找找一个靠谱的老师,这样比较容易坚持,可以先坚持一个月看看。尝试以后,最大的可能损失就是大概就是一两件衣服的钱,以及少看了两集连续剧,少跟朋友吃了两顿饭的时间。 如果真的学了一个月还没有入门,或者发现自己并不是真的喜欢,再放弃也不迟。到时候,即使是放弃,也会放弃得心安。不过,更可能的是,你发现自己这一个月过得非常充实,以后你会很怀念那段快乐的时光。

最后以一张图作为结尾吧:


原文首发于简书的个人主页