技术角度分析大数据
我有20个整数,一把全装进内存,调用个sort,完事了。 我有2GB那么多的整数,一把全装进内存……恩恩,如果机器不那么破,勉强也完事吧。 我有20GB那么多的整数,对,往你家PC里多插几条8GB的内存条试试? 那我现在有200GB那么多的整数……看你丫的怎么装内存,哈哈哈哈哈哈! 吓尿了吧!?写外排序?你写啊!It's ONLY the beginning!很多人可是连内存里的快排都写不出的哦~ 200GB算个啥大数据啊,苍老师的合集都不止咳咳…… OK,显然我们已经意识到1台机器装不下了。咋办?多找几台机器呗。多找几台机器意味着啥啊?分布式计算懂不懂,连分布式都不懂说个毛大数据啊!!! 好,现在有200GB的整数,排个序吧……呃,给你10台机器吧。
如果数据不是200GB,而是2TB,2PB……
建议题主有空去了解下mapreduce,hadoop,yarn,mpi,vfs等等内容。 “传统行业的数据,收集和分析慢,互联网时代特别是移动互联网时代,数据收集和分析都变得更快更智能,仅此而已吧。”
只所以题主会这么说,是因为题主作为局外人,能看到的就只有这些表面的最直观的现象。一句简单的“数据分析变得智能了更快了”的背后,实际上是无数人付出的勤奋、创造力、勇敢还有艰辛! (编辑:应用网_丽江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |