恒峰娱乐首页

广电媒体的大数据应用研究

来源:首页 | 时间:2018-06-24

  【慧聪广电网】大数据已被视为广电媒体转型的重要推手,但是,业界对大数据的认识并未统一。因为属于新兴的技术和应用,大数据在媒体人的眼中还显得神秘、距离遥远。到底什么是大数据?广电媒体的大数据包含哪些内容?广电媒体该如何利用大数据为自己服务?广电媒体需要让一线的制作团队、营销团队知道数据的参考性和价值,才能真正拥抱大数据,迎接大数据带来的机遇和挑战。

  “大数据”(BigData)这一概念,最早出现于二十世纪八十年代的美国,自2009年开始得到全球政界、商界的高度关注。美国政府是大数据研究和应用的先行者,大数据在商界的应用热潮,则由全球著名的管理咨询公司麦肯锡公司(McKinsey&Company)掀起。

  一般而言,大数据指的是大规模数据、海量数据,但是,对于大数据,难以有一个准确的定量的定义,而只能主要从定性方面加以概括,如维基百科的描述:大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数据集。

  “大数据”一词的重点,已经不仅在于数据规模的定义,它更代表着大数据处理所需的新的技术和方法。根据维克托?迈尔-舍恩伯格编写的《大数据时代》中提出:“大数据”的“大”主要体现在四个方面:Volume(数据量大)、Velocity(采集处理速度快)、Variety(数据类型繁多)、Value(价值密度低)。那么,什么是广电大数据呢?顾名思义,广电大数据是指广电媒体在生产、播出、运营过程中所产生的数据集。如果从量的方面来考查,广电的数据集并不算大,但它需要采用数据处理的技术和方法,才能进行分析和利用。

  相较其他传统媒体,广电对信息技术的应用相对广泛,因而对技术、数据并不陌生。电视信号由模拟到数字,机顶盒从标清到高清、再到4K、8K,收视、收听率每天对于节目的监控,媒体资源库的建立及对节目资源的归档,每一项都涉及数据应用。大数据处理是新兴的技术,为广电的发展带来了全新的视界。拿收视、收听率来说,传统的收视率、收听率调查是对有代表性的样本户进行抽样调查的结果,实际上并不是大数据。因为大数据是基于全样本的数据,是对所有用户在线上的一切信息和行为的收集。广电媒体的运营离不开数据应用。广电媒体的数据,因为有一定的用户规模,所以价值较大,受到重视。在互联网的夹击之下,加强对于数据的整理和应用,是广电凭借自己优势突围的重要方法。

  关于大数据的布局和应用必须建立在有数据的基础上。广电运营商的系统里,有各种数据:内容的数据,用户的数据,收视行为的数据,还有各种财务数据、管理数据等。主要可归类为内容大数据、渠道大数据、广告和整合营销大数据三个方面如图1所示。

  每一家广电媒体自诞生起,就承担起了记录本地区发展的重任,是对地区政治、经济、社会发展的全面记录。深圳广电集团也一样。自开办电台、电视台以来,从最初每天几个小时的节目内容,到现如今11个频道、4个频率每天一两百个小时的播出时长,几十年如一日,深圳广电集团描述了这座城市在改革开放形势下的成长历程。深圳广电集团新闻中心的节目每天对城市所发生的大事、要事进行权威报道;《第一现场》关注民生贴近百姓;都市、少儿、财经等从不同的视角切入生活;新闻、交通等频率留下了珍贵的音频资料;《民心桥》中市民与政府官员共话市政发展……可以说,对设立特区后深圳的政治治理、产业发展、人民生活、城市风情,没有哪一类媒体的记录有深圳广电集团那么翔实和生动。

  深圳广电集团的呼叫系统里有各种报料、咨询数据,是对广电内容数据的有益补充。集团统一对外公布的热线电线余个,为深圳市民提供节目查询、新闻报料、咨询和报名栏目活动、投诉建议等“一站式”服务。自2008年8月成立以来,集团建立了企业数据中心以及短信平台,融合了热线、短信、网站、微博等多种渠道的报料、咨询、报名、互动等数据。据了解,该平台已经积累了超过350万客户信息和超200万微博互动信息。深圳广电集团的手机客户端“壹深圳”设置的子栏目“记者帮”,是手机版“报料热线”,目前“记者帮”每天有来自用户的报料100多条,集团的8档新闻栏目均打通建立了报料输送渠道,记者每天都会采用其中的报料10-20条。

  市民类节目的采制及呼叫系统的设置,当初的定位是反映市民生活、为市民排忧解难,它实际是对当时社会风气、民生民情的真实记录,是最接地气的资料。它可以提示我们,不同时期的老百姓关注什么?对社会热点的追踪和回溯,有助于实现舆情监控的目的,也是给百姓进行画像的基础;长年对于经济社会发展的全方位记录,也足以给深圳的各行各业进行画像。这些年播出的、未播出的节目内容,都储存在集团的媒资库里,一直未加以整理和利用。

  一旦对这些内容进行归档,将其标签化,这将是集团最核心的数字资产。无论是对于音频还是视频,现有的技术已经完全可以做到精准的语音识别。给这些内容贴上标签、智能编纂归档以后,广电媒体库里那些静态的资料就可以变成动态的。这些资料可以丰富APP、网站的内容,成为其运行的知识库。客户端和网站有了内容,智能推荐就是水到渠成的事了。我们的平台互联网化之后,发展也将顺畅起来。

  近年电视传播的渠道不断拓宽:电视节目的传输渠道从无线、有线向IPTV、OTT等方式拓展,“两微一端”成为广电媒体“标配”,“头条号”成为新的节目输出方式等。来自于各渠道的数据,为我们提供了用户信息和全媒体收视数据。

  有线电视机顶盒的数据,是目前最为重要的渠道数据。因为有线专网仍然是电视节目传输的最主要渠道。以深圳有线电视网络公司天威视讯为例,天威视讯作为深圳唯一的有线传输网络,其登记在册的用户有近300万户,至2017年7月,其宽带用户已发展至30多万户。这远大于IPTV的70万用户规模。所以广电媒体目前的渠道数据,仍然是以有线网络的数据为主。

  天威视讯的数据包括两类,第一类是用户的注册和登记数据。首次使用有线K机顶盒,会对用户的姓名、身份证信息、住址、电话、银行账号做详细登记。天威目前登记在册的近300万用户,是深圳广电集团最基础的用户数据。对于那些已流失用户的数据,因为登记了姓名住址等真实信息,也仍然具有一定价值,未来或可作为潜在用户进行开发。第二类是来源于机顶盒所采集到的关于用户观看电视、上网行为的数据。在双向互动网改造之前,用户观看电视的行为无法采集到,双向互动网改为用户提供了更清晰的图像、更多样的观看选择,同时也将用户的观看行为回传给电视台,用户直播、点播的行为都可以采集到,连快进、回看的动作都能捕捉,用户的喜好可以跃然纸上,画像也就逐渐清晰。4K机顶盒不仅提供了高清互动的电视体验,还能满足用户对宽带的需求。天威宽带的30多万用户,其上网行为、冲浪习惯均被记录。

  目前IPTV的用户实际是宽带运营商的用户,这部分用户的数据是广电媒体无法获得的,但是,用户在IPTV的观看行为、收视习惯是广电媒体可获取的数据。对于大部分广电媒体而言,它们像深圳广电集团一样,不具有OTT运营牌照,出于对下属企业的保护(OTT传输方式会形成对传统有线电视用户的争夺),再加上OTT不具有直播功能,广电媒体一般较少主动选择OTT传输方式,这部分的数据较少。

  广电媒体大多建有自己的网站、微信、微博、客户端,一些知名度较高的栏目也建有微博、微信与用户互动;今日头条发展迅猛之际,很多广电栏目和内容又成为其注册号。这些平台中,只有网站和客户端的数据是齐全、精细化的,而从微信、微博、今日头条所获得的只是大模样数据,无法开展精细化分析和运营。深圳广电集团的手机客户端产品“壹深圳”,至2017年底已有下载用户数213万,每天开机用户35万,与电视频道互动用户8万。“壹深圳”不仅拥有用户