今夜,我们聊聊大数据(1) – 前言

转眼负责汇付的数据部门两年半了,时髦的大数据其实也就最近一年开始研究,而实践则是半年里的事情。

不管是不是大数据,数据都是为了某种目的服务的,这几年大数据的概念如同“云”一样,喧嚣尘上,不免有很多炒作和不实之处。

一件事情,能被炒作的这么热,hadoop以及衍伸出的很多产品,存在肯定有其道理。对于大多数人来说,大数据好像没有什么用处。说到底,大数据就是一个工具,在需要的场景下使用自然有用。就像三十年前的电脑一样,到了今天,电脑似乎哪里都在了,但实际上,有时候拿个小本子做备忘录还是最方便的,如此道理。所以,大数据既不是灵芝仙丹,也不是洪水猛兽。

大数据简单而言,就是海量数据高速运算寻找相关性。(这个概念之后会再详细解说)

我所在公司的部分业务数据的数据表都达到了亿条以上,容量几个T,在一些查询、分析、风控等业务场景需求都需要在很短时间内计算出结果,因此,随着业务发展和技术预研,一些大数据的技术被逐渐引入,积累了不少心得。

自己也是一个初学者,边学习边提高,希望对各位有所裨益。

每篇文字不会太长,之前HR负责培训的同事告诉我,现在流行微课程,7-8分钟即可,故需要与时俱进,大家时间宝贵,在几百一千字里面,简明扼要的说明一个问题。(这个前言也就到这里了)

Leave a Reply