媒体监测和推荐平台

大数据

当前位置:首页 > 大数据 > 详细内容

什么是大数据?

这是一个新兴的概念么?说是就是,说不是就不是。其实数据一直存在,只是需要感谢这个蓬勃发展的信息时代,使得获取并分析这些数据成为可能。于是大数据概念顺势而出。

可以简单理解,每一条行为就是一条数据。去车站买票、去银行存款、拿起电话发个短信等等等等。只是人们的日常生活越来越依赖于数字化的信息网络,所以使得行为轨迹较历史而言更加的聚集。当人们都拿着现金去市场买菜的时候,除了人工去计算谁知道交易额是多少?哪怕是摊主本人,也要数数才知道。此时的数据获取是十分昂贵而低效的。但是当在线交易已经普及到方方面面的时候,只需要打开手机就能快速统计到交易额,甚至看到每一笔往来记录。那么,也可以简单的推想,信息网络上到底有多么庞大的数据量。

说一句小白的话,大数据技术就是处理大数据的技术。如果数据量没有达到P级,我认为其实是不需要用到大数据技术的。主流的数据库软件已经能够有很强的可靠性和处理能力,部署相对也简单很多。大数据技术主要是构建了一种全新的数据处理理念;易于帮助我们去理解的,主要是数据分片和分布式处理;技术的根本是使处理庞大数据成为可能并且尽量的加快处理速度。从使用效果来看,这种能力是已经具备并十分可靠的。比如,现在主流APP都会有推荐功能。同一款APP不同的人打开有不同的主页,这就是根据单用户的历史浏览记录而生成用户画像,为用户推荐类似的内容。

大数据技术的驱动力

在这个时代里,赚钱不易。几乎每个行业都面临着激烈的竞争,用户的忠诚度下降、对服务品质的要求在提升。对于企业而言,所有的问题已经从怎么吸引用户变成如何留住用户。比用户更懂用户,提供个性化的服务、挖掘潜在的消费点等等,更好的盈利才是企业致力于加强大数据技术的驱动力。

大数据是不是无所不能?

技术永远都是手段,是手段就会有局限。大数据技术的边界在于数据源,而技术质量的边界在于使用者。

巧妇难为无米之炊。没有数据的支撑,技术手段都是空。如之前的例子,如果数据源只有交易明细,怎么用大数据技术来分析我小学同学的二舅是谁?

同时,大家也会有一个明显的感觉——有的APP比你更懂你,有的却是“呵呵”?其关键就在于谁的算法更加贴近于用户的真实画像。

大数据是怎么运转的?

我个人比较倾向于将大数据的整个过程划分为架构、算法、分析。

总的来说,最为关键的是分析。分析可以是事前分析也可以是事后分析。所谓事前分析更贴近于需求管理,就是将目的转化为可执行的具体内容。事后分析,更加倾向于策略指导;主要是分析到行为背后的归类,帮助指引修正策略。算法是将分析所设定的条件转化为具体的算法。简单举个例子,我们通过用户的历史播放记录去描述用户的喜好,然后将全量音乐进行归类,为用户推送更为贴近用户喜好的音乐。那么算法就是如何将“用户播放记录中轻音乐的次数>500次”。当然,应用级别的算法那是相当复杂了。

来源:腾讯科技