江苏有线互动电视智能推荐系统技术演进

(整期优先)网络出版时间:2023-02-24
/ 3

江苏有线互动电视智能推荐系统技术演进

苗峰, ,张少欣, ,王毅

江苏省广电有线信息网络股份有限公司 江苏南京 210008

摘要:自2011年以来,江苏有线为了提升用户体验,提高广电业务主流舆论传播力及引导力,在互动点播业务中引入精准智能推荐技术。经过十余年持续不断的功能迭代及系统升级,互动电视已经可以根据不同的业务场景,采用差异化推荐算法,通过对内容及用户的精准画像,为用户提供精准内容推荐。此外,为提升业务运营的效果,以用户行为大数据为基础,以智能推荐算法为手段,以推荐结果为导向,持续优化推荐系统。经过多年系统建设与业务运营相结合,江苏有线互动电视已经逐步建立了以数智融合为基础的智能推荐体系,有力的支撑公司业务发展。

关键词:互动电视智能推荐智能运营   大数据   数智融合

1  引言

随着视频点播业务的进入海量时代,人工推荐运营无法满足用户的差异化需求。如何帮助用户能够从海量内容中快速定位自己需要和感兴趣的内容,是关系到用户体验和运营收益的关键[1]。江苏有线自2011年引入精准智能推荐技术以来,结合业务运营需要,持续优化推荐算法,建立完整的“场景分析-数据采集-算法选择-结果反馈-算法优化”的智能推荐体系,支撑业务智能化运营。

为了提升推荐效果,需要深入分析业务形态,在合适的场景为用户提供内容推荐。在此基础上,通过充分细化用户画像及内容属性,为后续的智能分析提供基础。在大数据的有力支撑下,丰富的推荐算法是智能推荐系统中最核心、最关键的技术,很大程度上决定了推荐系统性能的优劣。而为了更好的适应实际业务运营需求,推荐算法需要结合业务的应用场景灵活调整。此外,在算法投入使用的过程中,可以通过A/B Test等手段,及时分析各业务场景中,智能推荐算法的到达率、转化率等关键指标,不断优化推荐算法,持续提升推荐效率。江苏有线经过十余年的发展,逐步建立了符合业务运营需要的推荐体系,为提升用户体验、提高业务收益提供了条件。

2  业务场景

互动电视业务是建立在数字电视和网络双向化基础之上,融合了电视、计算机、数字通信、互联网等信息技术的集合体。从节目单一到内容极大丰富,从被动接收到主动选择,改变了人们以往的电视收视体验,满足了人们在新媒体环境下自主选择电视节目和信息资讯的要求。随着“5G+固移融合”的发展,为用户提供“大屏观看、小屏互动”的娱乐体验,让电视变得“更好看、更好玩、更好用”,进一步拓展的业务使用场景。

综合分析业务形态,经过多年业务运营,目前江苏有线互动电视为用户提供推荐内容的场景主要有四处:

1)业务首页:首页是用户的业务入口,推荐内容适合根据以当前热点与用户行为相结合的推荐算法,在满足业务运营需要的同时,结合用户习惯,保证推荐的内容对当前用户更有价值,进而提高业务的点击率和收入。

2)内容详情及视频播放:以内容关联为主,用户行为为辅,推荐与当前内容相关,且用户感兴趣的内容。

3)搜索、历史记录等相关功能:提供“热搜榜”、“您可能想搜”等功能,根据当前热点,以及用户行为,推荐用户感兴趣的影片;在用户搜索结果页中,以影片类型、导演、演员等关键字,推荐类似的内容;在历史记录中,根据用户的收视行为,推荐关联影片。

4)大小屏联动推荐:由于内容版权等因素,在小屏端,多以片花等短视频为载体,为用户提供影片预告、分项等功能。通过采集用户行为,实现用户画像,结合用户兴趣,为用户在小屏端主动推荐;用户通过大小屏联动的形式,在大屏播放正片,实现小屏向大屏的引流,创造点播收益。

3  系统构架

自2012年系统建设起,随着业务需求的不断深入,技术路线及系统构架也在不断演进:从为单一业务提供推荐功能的业务系统,向面向多网络、多终端、多业务的能力系统转变;系统构架从紧耦合的单一系统,向模块化,分层结构的系统转变。

图1 智能推荐系统整体构架图

目前,系统总体分成应用层、运营层以及智能推荐层。

在应用层,系统可以支持移动终端、PC、机顶盒等多种不同类型终端;

在运营层,根据业务运营的实际需求,定制调整运营策略,并作用于最终的内容呈现;

在智能推荐层,采用微服务的系统构架,主要包括:

接口引擎:面向业务的能力支持,以及数据采集及导入接口;

接口引擎管理中心:按需定制及管理对外接口,满足业务需求;

核心服务:基于分布式的数据构架,实现智能推荐所需的核心功能;

核心服务管理中心:用于定制及管理核心算法,实现用户及业务模型的开发管理等功能;

报表服务:结合智能推荐的实际效果,对外输出相关数据。

在此系统构架之上,江苏有线智能推荐业务可以根据实际运营需要,灵活调整推荐场景及推荐算法,并通过实时反馈及对比机制,了解推荐效果。

4  数据采集

为了提升智能推荐的效果,建立标准化的数据采集体系是基础[2]

由于不同内容提供商节目元数据格式存在较大差异,因此在内容数据采集方面,为了保证输出的一致性,建设了内容数据转换网关,通过人工智能语义分析,将不同格式的节目元数据转换成统一输出标准,兼容国标GY/T 360-2022 《广播电视和网络视听节目内容标识标签规范》,保证数据可扩展性。

在用户行为采集方面,通过统一数据采集中心,同时兼容应用数据探针(业务浏览、点播行为等)、离线数据(用户订购、退订等行为记录)、终端行为采集等多维度用户行为,保证采集数据的完整性。通过采集平台的数据清洗,按照统一标准对外提供输出。

5  推荐算法

推荐算法是构建智能推荐体系最关键的技术,直接影响最终的推荐效果。互动电视精准推荐系统经过多年的不断优化升级,累积了大量核心算法,目前主要采用的算法如下:

5.1. 基于内容推荐算法

1)最新推荐算法

基于服务内容的元数据,由服务内容的发布时间决定。它独立于用户属性和历史数据,因此,在终端用户没有登录的情况下,该推荐尤其适用。同时该算法能够通过手动的方式设置内容相关的运营参数(例如:优先级参数),从而影响内容推送结果的排序或优先级。

2)热门推荐算法

热门推荐基于服务内容的元数据。“热门”内容由特定时期内用户点击率来决定,计算周期可根据业务运营需要动态调整。它依赖于用户的历史数据(包括浏览历史、点击历史、购买历史等等),结合内容的实时热度,为用户提供推荐。

5.2. 评分推荐算法

评分推荐算法是基于效用的一种推荐算法。“评分”是指用户评分和结合运营需要的系统评分之和。算法的主旨更倾向于发掘用户原始诉求以及更合理的推测,通过全面的参考及分析所有用户对所有内容的评分后,推算内容的基础综合评分。

5.3. 内容关联(关键字)推荐算法

内容关联(关键字)推荐算法基于全文搜索技术,该技术旨在通过将文本内容分解为关键字来寻找最为相关的服务内容,并根据反向索引进行搜索。该推荐于终端用户搜索特定类别或关键字时适用。

5.4. 内容关联(相似)推荐算法

关联(相似)算法是一种基于服务内容属性的推荐算法。服务项将在余弦相似度基础上进行比较,并将根据特定项目的相似度进行分类。算法特征:由于事先计算了项目相似度,因此可以实现实时计算。该推荐于终端用户搜索特定类别或关键字时适用。推荐引擎将通过数据库中的预处理矩阵获取关联程序最高的项(由分数决定:1-相同,0-完全无关)。因此,它与终端用户的登录状态不相关。

5.5. 基于知识推荐-个性化推荐

推荐系统中基于知识自动学习的个性化推荐受到多种复杂算法的协同支持[3]。多种算法均是扩展多种服务类型的业务概率、提高用户体验的重要方式。它依赖于用户数据和历史数据,对用户喜好进行预测。

5.6. 组合推荐算法

系统允许创建新的推荐算法,这些新的推荐算法可以是由已有的几种推荐算法的组合而成,可配置一种或多种单一算法,组合而成新算法;以及为每个单一算法设置权重。

当一个新的推荐请求发起后,采用组合推荐算法时,系统将先按照组合中的每个单一算法进行推荐内容的整合,然后再根据权重进行筛选,所形成的新的推荐内容,将是组合推荐算法中所推荐的内容集合。

推荐系统可以定制组合推荐算法插件,在系统后台配置各组合所用到的推荐算法及返回推荐结果比例,portal调用组合推荐接口时将组合名称参数传给后台,后台可以按预先定义好的组合推荐来返回推荐结果。

5.7. 融合推荐算法

智能推荐系统可以实现各业务之间的关联融合推荐,在系统后台配置各业务夸服务的关键规则及推荐比例,portal在获取融合推荐数据时,系统能够根据配置要求返回推荐数据,流程如下:

图2 融合推荐算法流程图

6  反馈机制

推荐算法在实际运营的过程中,需要不断的调整及完善,在不同的时间段,不同的场景,采用的推荐算法或算法中的关键参数、权重都需要不断调整。目前精准推荐系统具备的反馈机制主要包含以下三个方面:

(1)在业务侧增加大量的数据探针,采集用户点播、预览、购买等行为数据,分析用户习惯及推荐转化率;

(2)组合算法、内容关联算法等均具备自我修正机制,根据结果反馈优化算法中的权重及参数;

(3)通过A/B test等对比方法,分区域、分时间对比不同算法的实际效果。

通过上述多种反馈机制,持续优化推荐方法,提升推荐效果。

7  创新点

江苏有线智能推荐经过多年演进,主要在技术、算法、集成、应用四个方面有所创新:

7.1. 技术创新

(1)采用微服务的系统构架, 结合运营需求,在实现系统的快速迭代的同时,提升系统稳定性。

(2)以开放平台的形式对外提供服务,同时可支撑多业务、多终端、多网络。

(3)利用协同过滤算法分类人群,并于主动运营相结合,可以更有针对性的宣传主流价值观,提升业务平台整体的宣传能力。

7.2. 算法创新

(1)采用多维度组合算法,相互补充及融合,弥补单一算法存在的短板。

(2)算法可以根据结果反馈自动调整,提升算法的有效性。

(3)基于广电视频内容的特点,有针对性的调整核心算法,贴近广电业务的推荐要求。

7.3. 集成创新

(1)在媒资的生产及分发环节,通过AI赋能等手段,丰富媒资元数据,提升标签的准确性,为内容关联等核心算法的使用提供良好基础。

(2)在数据采集环节,建议一整套数据采集标准体系,提高数据采集的准确性,为采用协同过滤算法,或评价推荐效果提供了条件。

7.4. 应用创新

(1)为了更好的服务运营,结合不同的业务场景及需求,实时采集、对比推荐效果,并不断动态调整。

(2)根据运营策略、指定区域或目标用户群,采用特定的推荐策略,达到针对性主动营销的目的。

(3)与搜索等功能相结合,为用户提供更好的用户体验。

8  结论

江苏有线智能推荐系统以人工智能技术为手段,围绕公司业务运营,为用户提供个性化的内容推荐。在提升广电企业业务运营水平的同时,提高内容运营能力,促进内容服务高质量发展,更好满足了用户消费升级与高增长的精神文化生活需求,为巩固广电网络主流舆论阵地,引导社会主流价值导向提供了有力支撑。

据统计,用户通过精准推荐系统的点播量占总点播量的25%,为点播带来的直接收益超过20%,点播收益每年以10%-20%的增幅持续增长,单年点播收益超过1.2亿。除此之外,项目还取得了“互动电视系统前端”、“智能联想网络人机交互操作平台”等多项发明专利;荣获“全国人工智能应用创新大赛”等各类奖项。

通过创新业务形态、改善人机交互、引导用户从“找节目”向“看节目”转变,提升用户黏着度,以互联网的方式吸引流失用户群体的业务回归。

参考文献:

[1]刘珊.大数据与新媒体运营[M].北京:中国传媒大学出版社,2017.

[2]王婵娟.抖音推荐算法初探[J].科技与创新,2019(24):110-111.

[3]基于协同过滤算法的大数据信息推荐模型[J]. 陈明.  信息与电脑(理论版). 2021(08)

[4]刘海鸥,孙晶晶,苏妍嫄等.国内外用户画像研究综述[J].情报理论与实践,2018(11).

[5]姜信景,齐小刚,刘立芳.个性化信息推荐方法研究[J].智能系统学报,2018,13(2):189-195.

[6]毛勇.基于协同过滤的推荐算法研究[J].计算机代,2018,313(7):32-35

[7]符晓.云计算中基于共享机制和群体智能优化算法的任务调度方案[J].计算机科学,2018,45(S1):290-294.