利用收视大数据开展节目综合评价研究

(整期优先)网络出版时间:2022-08-24
/ 3

利用收视大数据开展节目综合评价研究

肖民,李博男,张治龙

中国广电山东网络有限公司 山东 济南 250001

摘要:2018年12月26日,广播电视节目收视综合评价大数据系统正式开通试运,由国家广电总局委托广电规划院对其进行负责建设。但是多年来从何种收视角度采集收视数据、采用什么数据模型、如何创建更公平公正的符合各方要求的节目综合评价体系,一直都有争议。本文以中国广电山东网络有限公司数据及信息化中心大数据平台为依托,以媒资中心与市场部们的数据采集、分析和处理为切入点,利用收视大数据开展节目综合评价进行了深入研究。

关键字:大数据 节目综合评价 收视数据

1.研究现状及研究意义

研究现状:利用收视大数据开展电视节目评价体系研究自上世纪末初见雏形,迄今为止国内相关学界与业界分别从以下几个方面分析了大数据对节目综合评价体系的影响,以及大数据对节目综合评价体系的应用趋势:首先,从实践和概念两个层面对大数据在国内电视节目综合评价中的应用进行案例研究,建设性地阐释和拓展了大数据在电视节目综合评价领域的应用模式。二是对电视节目综合评价体系中的大数据各项指标进行了针对性的详细研究。三是阐述了大数据在电视节目综合评价体系中的定位和价值。四是对电视节目综合评价如何应对大数据时代提出建设性方案及意见。从业内人士和学术界等各方的研究来看,都是在力求通过科学合理的综合评价,提升宣传效益,并增强宣传策略与运营管理的实效性。国外对大数据的研究起步很早,尤其是大数据技术对视听行业影响的研究特别突出,相关研究成果主要是对大数据技术进行了分析,并对其今后的发展趋势进行了预测和分析。有学者探讨了大数据对现代视听行业节目综合评价体系带来的影响,并分析国外视听机构推出的大数据产品,还有人分析了传统视听行业利用大数据开展新媒体融合与转型,利用节目综合评价大数据向节目广告商展示节目产品的受众程度,提高广告议价收益。

研究意义:除以上评述外,不管是国内还是国外,随着网络媒体冲击以及与传统广播电视行业争夺的日益白热化,在巨额市场经济压迫下,各类漠视社会经济效益、盲目要求高收视率的现状经常出现。还出现过污染样本户事件,使节目的同质化和低俗化趋向抬头。所以,利用大数据,研究科学、真实、有效的样本全、覆盖广的国家广播电视综合评价系统,可加强业界对广播电视节目的管理与决策,促进广播电视等视听行业的高质量发展。还能够通过系统分析与探究大数据分析对视听节目整体评价的影响,为视听行业运用大数据分析及其技术开发指明方向,为未来的学术研究进行一定积累和参考,有着很大的理论价值。

2、收视大数据系统平台介绍

收视大数据系统平台的技术架构包括数据获取、数据存储、数据查询、数据计算、数据建模和数据分析。如图可知大数据平台工作原理及组织架构。

4dfb4a9babad659d0c220f668f2fa11

图1 大数据平台工作原理及组织架构

2.1 数据获取

数据采集层负责从广电有线电视盒子终端集中采集数据,并实现数据实时同步、数据清洗和安全可控。采集数据包括线上行为数据信息(网页数据、互动数据、表单数据、会话数据等)和内容数据信息(应用日志、电子商务档案、机器数据分析、声音数据、社会化媒介数据等),此外还有其他的感知数据分析需要完成对结构性、半结构化、非结构化的海量信息内容的智能辨识、追踪、、传播、信号转换、监测、接入与管理等。其核心技术主要涉及针对大数据源信息内容的智能辨识、适配、传播、连接等。在数据层,一般采取流处理和批处理二种方法,流处理主要通过Spark流处理技术进行,支持事件营销等在线即时使用;批处理使用如Hive/Spark等大数据技术实现,为构件化、非结构化数据提供清洗、索引、数据结构化处理、解析、汇总等功能。

2.2 数据存储

大数据所用的数据储存容器与传统的关系数据库有很大的差别,因为需要存储的是海量的、异构的数据,所以容器必须提供高性能的、高可靠的存储和读取能力。大数据通常采用分布式存储文件系统HDFS和海量数据列式存储HBASE,还使用NoSQL来存储某些非结构性的数据。最常见的是采用HBASE进行存储,并将这些数据放入REDIS以备读取,最后由BUS将数据封装成不类型的接口服务。

2.3 数据查询

在大数据处理的时代中,数据查询分析计算系统是最常用的软件系统。信息检索体系需要具有对大量信息进行即时或准实时检索的能力,信息需求的扩大早已超过了传统关系式数据库的承载与管理能力。从目前来看,主流的信息检索体系包含很多方面,大致包括Hive、Cassandra、Hana、HBase、Dremel、Shark等。Hive是采用Hadoop技术的大数据分析存储开发工具,可以用来搜索、管理分布式数据库中的大数据分析集,并提供了全面的SQL查询能力,可将构件化的数据文件反映为一个数据表。由于Cassandra是开放的NoSQL数据库,而且具有非常好的可扩展性,其资料模型也是一个很流行的分布式结构化数据储存方法。而Hana则是与数据信息源无关、软硬件整合、采用存储器运算的平台。HBase是开放、分布式、面对整个系统的非关系式数据库模式,并采用了其中的压缩算法、内存操作和布隆过滤器。Impala,一个运行于Hadoop平台上的开放的大型并行式数据库检索引擎。用户能够通过标准的SQL接口的工具检索存放于Hadoop的HDFS和HBase中的PB等大数据。Shark上的数据仓库实现,即SQL on Spark,虽然这种技术只能和Hive相兼容性,但处理Hive QL的特性比Hive快了100倍。

2.4 数据计算

数据计算一般包括批数据处理架构、流数据处理架构、交互式数据分析架构等三类。批数据处理架构中以Hadoop为重要代表,而MapReduce、Spark-RDD则是重要设计工具;流数据处理架构一般以Flink、Storm为典型代表;而交互式流分析架构的选择也相当多,目前主流有Google研发的Dremel和PowerDrill,Facebook研发的Presto,Cloudera研发的Impala,此外还有Apache项目Hive、Drill、Tajo、Kylin、MRQL等。

2.5 数据建模

数据建模即数据组织与存储档案,强调从业务、数据的存取与应用角度存储大数据,与传统数据收集、保存、运算等所采用的工具方法论不尽相同。虽然大数据管理技术具备特性好、成本低、效率高、质量可控等四大优点,但同时又面临行业相关性较广、运算过程繁琐、大数据管理复杂度大等问题。所以,使用建模方法良好地组织和保存有关数据是十分必要的。目前常见的数据建模方法主要有E-R建模、维数建模和数据vault建模。对于阐明建模,人们往往采用UML作为统一的建模语言,它只是建模方法的工具,而并非建模方法本身。

2.6 数据分析

数据分析是大数据的最后一步也是一个最主要的环节。通过大数据的分析,洞察产品应用场景、挖掘客户痛点、设计产品价值;通过用户行为偏好、购买习惯,来源渠道/媒体,构造用户画像,挖掘潜在客户。要想达到数据分析的价值,就要收集终端各种类型的数据,将数据接入到大数据的数据仓库中,以备分析。

3、节目综合评价体系新标准

本世纪初,为了适应中国传统电视广播业市场转型的要求,各级视听节目管理单位纷纷推出了多种管理方式,试图适应包括收视率因素在内的新的市场规则,其中最具代表性的是视听节目综合评价体系。构建这一综合评价体系必须适应新环境下的时代要求,视听主体不单单是商业制度下的,更是社会主义制度下的。既要兼顾经济利益,又要兼顾社会效益。因此,除了与经济效益密切相关的评级指标外,在评价体系中还应有几项指标可以体现社会效益。

节目综合评价一直广受广电管理高层、电视行业和社会舆论的关注,也受到了社会各界的广泛关注。国内学者主要探讨了我国电视节目综合评价数据支持,比较各节目管理主体评价体系的异同,分析中央电视台改进其综合评价体系的新趋势,并就评价体系中社会效益因素的作用如何强化等若干问题展开讨论。

在新媒体环境下,对广播电视节目进行科学的综合评价,建立健全综合评价体系,建立健全节目的方向和指导,是众多优秀节目的重要举措。坚持正确维护必要的思想安全,促进节目质量的提高。这也是克服评级倾向的有效方法。

节目综合评价体系的构建,包括确定评价指标、评价指标的当量化、选择适当的数据合成方法等,能够体现媒体管理者的意图,对节目创新和媒体融合具有引导性和推动力。随着媒介融合的不断深入发展,引入节目综合评价系统的指标也将日益丰富。原始评价指标在要求和数量级上都存在特殊性,因而需要对原始评价指标作出相应度量,这也是综合评估的前提条件;同时,在统计学上常见的多指标综合方法也要求人们针对节目综合评价的实际需求,选取针对性、操作性较强的综合指标体系开展统计建模。

4 基于收视大数据的节目综合评价体系指标

节目综合评价指标既是效果评价机制,又是导向机制,更是激励机制。节目综合评价体系是一个开放、发展的体系,一个科学的节目综合评价体系能够极大地推动整个视听行业的科学、快速发展。在节目综合评价时充分考虑新环境下指标是大势所趋,但这个过程中还需学界、业界一起努力去克服一些技术和体制的障碍。当前,通过收视大数据系统的多维度数据分析,我们可以发现节目综合评价指标,有三大绕不开的指标:社会效益、收视率、经济效益。而其他评价指标无非就是这三大指标范围内的或者相关联的指标,至于如何进行量化,需要运营方或者管理方根据自己的需要进行细化。

4.1 社会效益指标

该指标需要从用户收视行为指数入手,从用户层面上将我国广播电视及网络电视的收视用户数等海量数据,加以采集、梳理、清洗和大数据分析。通过收集的样本用户的收视数量,从用户直播、回看、点播等各类收视节目数据中,获取节目的社会影响力数据,根据大数据分析结果和反馈的信息,及时更改、调整试听内容,对社会导向有积极的指导意义。

4.2 收视率指标

该指标以收视率数据的核心指标为基准,并在数据采集过程中实时处理并精确传送给所有住户。它不但能反映热点栏目和黄金时段的收视率,还能精准捕捉少数民族栏目和边缘时段的高收视率特征。因此,假设在某个城市的一百万个用户中选择了二百个样本用户,则在这二百个样本用户中尚未收看的所有电视节目都将被视作"零观看"。然而,在大数据系统的样本数据统计中,即使是非常低的数据也会被记录下来。

4.3 经济效益指标

本指标是依据市场效益下的指标,不但能够给出客观实际的投入产出比数据,同时也在此基础上,根据思想性、创新性、专业性以及节目内容等因素,建立了新环境下的指标考核模式。在市场需求的基础上,需要通过大数据分析发现节目观众的新变化。经过对节目观众的大数据挖掘,人们已经能够按照自身的个性化要求使用新媒体,观看所需视听节目。将具有相同价值观、生活方式和文化水平的节目受众进行重聚,视听节目生产机构也会根据不同的受众,打造个性化的视听栏目。各大视听播出平台,也都通过对这些个性突出、内容较小的栏目,进行最小的宣传,以达到最多元化的宣传效应,为企业差异化发展提供了机遇与条件。

5、结语

在社会效益、收视率、经济效益三大不可或缺的节目综合评价指标下,利用收视大数据可以高效及时地统计超大规模收视数据,分析的颗粒度精准,既能够体现热点栏目、黄金时段的收视情况,也能够精确抓住小众栏目、边缘时段的收视特点,全方位还原并展示多样化情况的节目综合评价特点;高效的为广播电视系统决策层提供决策依据,促进广播电视的高质量发展。

6、主要参考文献

(1)喻国明等.新闻传播的大数据时代[M]. 北京:中国人民大学出版社,2014:3.

(2)汪红春.大数据对国内电视节目生产的影响研究[J].重庆大学硕士学位论文.2016

(3)唐崇彦.基于大数据的收视节目综合评价系统的设计[J]

(4)宋凯.庞雪芮.基于大数据的电视节目评价体系构建研究.湖南工业大学学报(社会科学版).2021

(5)潘可武. 大数据时代网络电视内容的重构[J]. 电视研究, 2014.

(6)杨海.电视节目综合评价体系研究[J].新闻世界.2013

(7)王燕. 大数据下的电视节目创新创作[J]. 中国广播电视学刊, 2015(10).