分类
期权简介

技术分析入门的一些感悟

07-16 1126

数据分析入行半年之经验、感悟与思考

louwill12 于 2018-05-27 08:57:23 发布 304 收藏

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?

12-14 395

03-08 技术分析入门的一些感悟 146

你想成为一名数据分析师,你想进数据分析业,你想从事数据分析工作,但是你不想接受数据分析师培训,可以吗? 你觉得自己有很好的数学功底,你觉得自己的统计学学得非常好,你不想通过数据分析师培训,认为可以自学成才,可以吗? 技术分析入门的一些感悟 生活中,好多人都是这样,对于好多事情,都停留在想象当中,而完全不付诸动,或懒于付诸动。认为自己能力超群,可以自学而达到绽放光彩的目的。确实,这世.

11-03 1831

目录业务数据分析提升酒店订单量额外提升工作smtp自动邮件分析过程自动化 业务数据分析 这篇博客用来记录自己在携程任职数据分析师期间涉及的一些业务数据分析知识,分别是碰到不同业务需求时自己的分析思路以及预期结果,业务决策等,希望以此方式来进归纳总结,提升自己。 技术分析入门的一些感悟 提升酒店订单量 业务需求:挖掘酒店订单量相关变量,探究不同业务场景酒店订单转化率,并制定相应业务决策。 解决思路:获取用户订单数据,.

04-02 1052

08-07 技术分析入门的一些感悟 2689

03-29 1502

11-28 2091

05-14 2万+

前言 这篇文章是我读《成为数据分析师:6步练就数据思维》后,进的一篇梳理回顾的文章。我将对这本书中我认为重要的知识点大家分享,感兴趣的小伙伴可以找这本书看看。 一这是一本什么样的书? (1)书本概述 这是一本科普性质的文章,让我们能更好的理解数据分析的每一个过程步骤,其中包含的大量例子能够帮助我们很好的理解每一个步骤。书本风格是欧美风,是国外书的译本。 书本共分为三个模块: 技术分析入门的一些感悟 引言(了.

11-14 6004

07-16 1126

03-11 202

刚毕业半年,半吊子水平的数据分析师,面试官基本上也不问你特别深层次的东西,问了一些有关职业的理解和发展规划,现在把他记录在博客上面,后续继续改正,如有不妥处,还望批评指正。 0X01数据分析师的理解: 一数据分析师的产生 数据分析师并不像产品和开发那样在公司创业初期不可或缺,是公司发展到一定程度后的产物;因为在产品初期,产品本身就可以做数据分析,到后来业务线不断增加,产品那些忙不过来,这个时.技术分析入门的一些感悟

02-25 1035

近期感悟: 近期工作: 近期被指派了战略分析组里的数据分析的活儿,试图从数据角度找到一些insights。目前感觉自己的数据分析中提炼出来的insights非常表面和数据向,但是战略分析的上级可以从我的数据中提炼出来更多业务向的内容,从而对业务产生价值。目前,因为做过一点PPT战略咨询的锻炼,写的PPT明显会对flow和insights深度更有考量,这是value plus。 如何让数据更有业务sense: 建议从商业化的角度来观察数据。毕竟公司还是以盈利为主导,因此数据尽可能从效益提升角度思考

09-03 2212

1SQL中最近30天数据,最近30天的表达方式 SELECT*FROM表名whereDATE_SUB(CURDATE(),INTERVAL30DAY)、贝叶斯定理 P(A|B)=P(B|A)P(A)/P(B),是一个条件概率,后验。通过例子来回答。 手机照相功能好,那么他购买手机的概率是多少?已知用户购买的手机的照相功能好的概率是4.

11-09 996

当我们拿到数据集的时候,我们应该做些什么呢?在数据的汪洋大海中,你是否体会到了同在北上广奋斗的人们一样的在午夜的孤寂感?在充实着林林总总的数据表格中,你试图从中发现规律,可是否感受到了像心上人在身边却无法说出口的那层窗户纸。 今天写下这篇文章,算是自己对处理数据的一些感受,同大家分享。 导,清洗 当我们拿到初始数据的时候,我们首先要做的是将数据读并对数据进筛选和规整。 原始数据的类型有.

09-13 1773

读《红楼梦》所感 最近在读《红楼梦脂评汇校本》,在第二回“贾夫人仙逝扬州城 冷子兴演说荣国府”前有一段脂评描述红楼梦的写作手法,很有感触,摘录如下: 本旨只在冷子兴一人,即俗谓“冷中出热,无中生有”也。其演说荣府一篇者,盖因族大人我,若从作者笔下一一叙出,尽一二回不能得明,则成何文字?故借用冷子一人,略出其大半,使阅者心中,已有一荣府隐隐在心,然后用黛玉宝钗等两三次皴染,则耀然于心中眼.

09-04 2012

提及数据分析工具相信小伙伴们都不陌生,但是很多人都会有个疑惑? 数据分析工具这么多,它们有什么区别?哪个更好?哪个更强?我应该学习哪个? 虽然这个问题有点俗套,但是很重要,我也一直努力在追求这个终极问题的答案。如果大家在网上去搜索这方面相关的信息,你又很难看到一个公平的观点。因为评价某一个工具的好坏评论者都可能站在不同的角度,带上一些个人的感情色彩。 今天我们抛开这些个人色彩的东西.

数据分析师工作的一点点感悟

Labryant 于 2020-03-29 14:11:14 发布 1502 收藏 18

一直想写一篇文章梳理一下工作以来弯弯曲曲的成长路径,以及自己在成长过程中一点一滴的感触,希望对一些刚毕业或者迷茫中的人一点帮助和启发吧。
本人18年7月份毕业,应用统计学,本科。第一份工作在南京某央企做数据分析师,主要业务是替公安做一些订制化的数据分析,涉及业务都比较机密,这里不再展开。找这份工作时候我的情况大概是这样子的,考研失败,没有像样的实习经历,自学了一点机器学习的课程,工作城市选在南京。自己当时的数学和概率论的底子还算扎实,但是实际工作经验匮乏,能选择的机会其实不多。加上自己对职业规划没有什么概念,找到一份看上去对口的数据分析师工作,也没有过多考虑。在正式入职之前,我开始看一些机器学习、数据分析的课程,包括西瓜书和统计学习方法大概也看了一遍。
第一份工作,出差很多,而且刚入职就被派去独自去甲方现场完成项目,压力真的很大。然后工作之余开始努力学习,当时自己的职业目标是算法工程师,因为觉得自己数学还行而且挣钱很多。于是开始照着算法工程师的技能需求开始疯狂学习。看过的课程大概有python、计算机网络、机器学习、数据结构、大数据、自然语言处理,当然并不是每一门都看的很深入。期间自己也参加过天池和kaggle的一些数据科学竞赛,主要是为了学习如何建模。然而,由于工作中能用到的实在有限,而且更主要的是没有专业的团队带领。因为这份工作基本都是在客户现场待着,就一两个同事,所有工作中遇到的问题和成长都得靠自己不断学习,总体来说还是没什么成长。考虑到这个行业的壁垒和自己以后的发展,我决定迈入互联网金融行业,于是2019年9月底辞职,去到了魔都上海。
第二份工作,也就是我现在的工作,是在一个小型的消金公司做贷后策略分析。其实我在转行之前一直是想做风控方面的数据分析,找工作的时候也疯狂补习了很多功课,越发觉得风控很有意思。但是由于19年整个行业比较萧条,自己也没有相关的行业经验,找工作的路程还是很艰难,本来找的是风控数据分析师,还没入职就被告知调到了贷后策略分析师,导致我的转行之路只成功了一半。其实到现在我也不能算是做风控的,但是我的内心一直渴望成为一名风控人。来到新公司的最大感受,就是让我明白了一个真正的商业公司,是如何运作的。由销售带来业务(前台)、风控和资产部运营(中台)、研发部门支撑(后台),每一个环节都很重要,工作其实就是一个大家相互协作和配合的事情。自己现在的状态就是,努力完成岗位职责,不断观察和学习,然后就是学习风控知识不断输出写公众号(风控猎人),下一份工作争取转行成功。希望自己能在领域内不断成长和进步,这样自己的人生才是有意义的。
比较我现在做过的两份工作,我觉得最大的不同就是现在不迷茫了,清楚地知道自己应该朝着哪个方面去努力去提升,有了目标再去努力。但是反过来说,所有的没有方向的努力当然也不是白费的。比如我第一份工作中学习的爬虫、数据结构、计算机网络这些虽然我现在用不着了,但是起码我现在编程能力比大部分做风控模型的业务人员都要扎实,学习新东西时的感觉也更快。
如果你正在找工作,请务必先想清楚自己要做什么;如果你已经是职场人,也不要忘了一直努力进步。一个好的团队对你的成长很重要,你的路会顺畅很多,如果不幸你的团队并没有那么好,那么就努力提升自己,让自己变强,然后有能力去更好地团队。这是一个工作刚刚一年半的职场菜鸡的感悟。
最近一直在思考的问题,就是以后是去消费金融公司还是金融科技公司。说到底自己内心对算法、技术还是有一点点追求,觉得可以不断的提升自己。但是又觉得搞模型并不是长久之计,在这个商业社会,业务感觉才是最重要的。这方面希望过来人能给我指点一二,不甚感谢。
下面是我从入门开始看过的课程,希望给还在迷茫的小白们一些参考。

  1. 数据分析类
  • 小象学院金融数据分析
  • 唐宇迪python数据分析和挖掘实战
  • 邹博机器学习实战(小象学院、陆家嘴学堂,看了3遍)
  • 深度之眼的西瓜书、花书训练营
  • 传智播客python就业班的爬虫课程
  • 小象学院的分布式爬虫
  1. 编程语言类
  • 小甲鱼零基础入门python
  • 传智播客python基础班+就业班(强推)
  1. 数据结构
  • 邹博BAT算法实战(C++)
  • 牛客网左神的算法初级(java)
  • 传智播客python就业班的数据结构与算法(python)
  • PegasusWang的数据结构与算法(python)
  1. 风控类
  • FAL量化风控全线条(强推,还有FAL的其它小专题)
  • 七月在线金融风控实战(梅子行)
  • 小象学院金融信贷评分中的机器学习模型

最后分享一段最近很喜欢的话。丧完就要继续学习了。

【作者】:Labryant
【原创公众号】:风控猎人
【简介】:某创业公司策略分析师,积极上进,努力提升。乾坤未定,你我都是黑马。
【转载说明】:转载请说明出处,谢谢合作!~

科研入门必读:我的科研心得四部曲

实验技能及文献阅读能力提升
初入实验室的学习目标可以包括以下几点:
1. 首先是需要尽快转换被动学习的思维方式为主动学习的思维方式。尽可能改正大学期间老师授课,学生被动接受知识的习惯,到了课题组要主动去学习交流,因为目前很多实验室都是学徒制,努力还是需要靠自己的。
2. 接着要有系统思维和全局思维,尽可能熟悉整个课题组成员所研究的领域,不懂的地方查阅资料,再向前辈或老师请教。
这样有助于尽快找到自己感兴趣的课题且适应相应的研究方式,比如了解实验所需要耗费的实验周期以及前辈们安排实验和生活的作息表等,熟知这对平衡和稳定自己的科研和生活非常重要,因为今后你是需要跟着这位前辈一起学习奋斗的。
研究是一项持久战,需要有去钻研的兴趣和可坚持的身体。
3. 阅读实验室前期成果,包括但不限于发表的文章、专利以及已毕业或出站师兄师姐的论文。
中英文结合来学习有助于加深自己对课题的理解以及对实验技能的掌握。此时应该学习使用专门的文献阅读软件比如 Endnote,从一开始就打好管理阅读文献的能力。
将已阅读、未阅读、需要多次阅读、以及跟以后科研领域相关的参考文献等根据需要分类别整理。阅读完一篇文章过应该能过清晰的说出文章想研究的问题、研究的意义、论证的方法、使用的实验技术、文章的亮点、文章讨论部分是如何解释科学现象的、该文章的影响因子、发表的作者以及通讯作者是否长期从事于这一领域的研究等。
建议能在每一篇阅读的文章后写一份这样的总结,方便以后写文章等需要用到时快速查阅。
4. 此阶段应紧跟师兄师姐,学习实验技能(至少一个实验跟三次。第一次先掌握实验框架;第二次实验前回顾实验操作流程及细节,记录下遗忘的细节,方便在第二次跟时查缺补漏;第三次跟前辈申请可以实操,让前辈在一旁指导;第四次可以看前辈操作,查缺补漏。)
5. 此阶段还需要做好各种新知识的学习笔记。好记性不如烂笔头,记录帮助成为更好的自己。因为你不可能每个实验细节都能过记得非常清楚过目不忘,想想你记单词的样子。
6. 主动参与并完成实验室分配的公共事务,锻炼身体,常怀感恩之心,会使得前期求学过程更加顺畅。

科研思维

完成了科研入门篇,掌握了与自己课题相关大部分基础实验操作技能之后(该过程通常需要半年到一年时间),可以进入科研提升篇,即我们常说的科研思维的培养。科研思维的提升可以从以下几个方面着手:
1. 第一阶段免不了需要大量阅读领域相关文章,每一个领域都会有相似的论证方法,不同层级影响因子的文章也对研究课题的深度、新度作出要求。
大量阅读总结这些文章论证的普遍套路,了解某一领域的研究哪些实验是必须要做的;通过阅读不同影响因子的文献对比总结出哪些方法、技术是独特新颖的,哪些论证是可以加分的,可以提高文章的创新。
从而达到一看到题目就能知道作者围绕这一研究很可能使用的论证方法,并能只阅读文章题目心中就有自己的一套论证方法。
2. 第二阶段需要紧跟当前研究热点,学习先进的研究方法,从而套用到自己的文章,开辟出新的论证模式。
推荐关注科研相关的公众号、公司官网以及 stork 订阅定制自己的文献推送。这些公众号一般会推送学习方法、科研心得、CNS 的新发现、生物医药领域新进展等,非常有助于拓宽自己的知识面。
在一定程度上,能够紧跟研究热点,比如将红极一时的生信分析、非编码 RNA、外泌体等研究内容或先进技术随机取一结合起来用在自己的文章中都将有助于提升文章的档次。
科研任务一般很沉重,一般短期很难做到这一步,不必超纲要求自己。

作图以及结果分析
实验结束还不是最后一步,实验结果的分析和结果的总结提炼尤为重要。
文章图片以及使用的统计分析方法是审稿专家着重阅读的内容之一,不同的实验数据需要用不同的统计分析方法,比如差异显著性分析可能需要用到 t 检验;多组数据两两分析需要用到方差分析;连续性数据可能需要回归分析等。
这一阶段需要掌握 技术分析入门的一些感悟 SPSS/Graphpad/PS/AI 等作图软件,以及学会根据不同实验目的选择不同分析方法。学习作图和结果分析可以借助平台,之前提到的一些微信公众号都会有相应的推送也可以直接向师兄师姐请教。
此外,文章图片的审美可以通过阅读 CNS 等杂志文章的图片来「临摹」,尽可能做到细节一致,注意 legend 与结果图片字体大小、粗细、数据展示方式是图片还是表格、多幅图片之间如何排版等细节。
这一方面我也有很大提升空间就不多说啦!

文章撰写以及论文发表
将所有的数据整理成图,并用科研语言串联成文,选择合适的杂志投稿,返回修改一直到文章发表,一整套完整的科研训练才算结束。
很多初学者没有机会得到最后这一步的训练,也就没有升华的机会。根据文章选择合适的杂志投稿也是需要学习的一步,否则一篇非常用心的文章投了低分杂志会很亏。
审稿人返回的意见是领域专家对文章整体评价,很可能自己课题组内都没有发现的问题被有关专家发现指出,这也是一此学习进步的机会。至此,如何投稿、修稿、回答专家审稿建议也得学习,可以看出科研不仅仅是做出结果就完结了,长路漫漫不容松懈。
这一阶段的学习离不开前期文献阅读的笔记,为什么希望大家一开始看文献就留意文章的影响因子,它的其中一个用处正在于此。
正如我所说,不同等级的杂志对文章的要求不同: 1-3 分的文章一般不需要深入解析机制; 3-5 分文章至少需要研究间接机制; 5-10 分则需要深入研究直接机制; 10 分以上的文章除了深度还需要创新。
比如我们常说的 CNS 要求就很高,一般很难读懂,要么是紧跟趋势,比如围绕此次的新冠疫情就很容易投 CNS;要么就是具有深度、广度或者领域的突破性研究成果,比如当时 Crisper 技术的发现和发展,当时就有两篇文章同时发表在 nature 上。在掌握了不同杂志对文章的要求时我们投稿就会如鱼得水。
纸上谈兵终觉浅,这一板块的提升还需大家多加练习,可以主动帮助导师整理之前的实验结果,撰写文章并跟进投稿。
至此,在我的絮絮叨叨之中,大家在脑海终于完成一轮科研的洗礼。当然科研远不止我说的这么简单,在入门之前读完以上拙见,去糟取精并理解我的深意,相信大家的科研之路会得心应手一些。
最后,送给大家一句曾国藩的话作为结语: 物来顺应,未来不迎,当时不杂,即过不恋。共勉。