智能生活

您现在的位置: 首页 > 智能生活

齐鲁论道丨CSM丁迈:AI+观众属性赋值TA 准确还原多人收视场景

作者:流媒体网    来源:流媒体网   发布时间:2019-05-09 20:47:22

       【流媒体网】消息: 智能大屏作为家庭娱乐的重要入口,当下迎来了全面化的发展和普及。海量终端规模、高度活跃用户行为背后,蕴藏巨大的商业价值。而在人工智能、大数据和营销技术等赋能下,不断创新大屏营销模式,为用户流量变现带来更多可能性。

  5月8-9日,以“启智 • 视听”为主题的流媒体网第十七届论道暨中国IPTV/OTT视听产业高峰论坛在山东济南举行。9日下午,在主题为“大屏广告运营和智能营销”的论坛上,中国广视索福瑞媒介研究(CSM)董事、总经理丁迈女士进行了主题为《AI+观众属性赋值TA 准确还原多人收视场景》的演讲。

  以下为演讲全文:

  各位同仁大家下午好,今天非常开心能有这样一个机会,代表CSM跟在座的各位做一个分享,刚才CTR的赵梅总一直在强调,我们对于广告的评估要还原到TA,从TA的视角去做一些评估,今天我代表CSM跟大家分享的就是我们通过AI机器学习,融合CSM样本中的观众属性,来复制TA,所做的一些努力和成果。主要的方法论与研究过程一会儿由中国传媒大学的沈浩教授分享,我替他先开个场。

  行业为什么迫切需要准确的TA数据?

  首先我们需要了解,为什么行业那么迫切需要TA,刚才梅总也分享了CTR的关于电视设备智能化、数字化的数据,我也在这里分享CSM 2018年最新的基础研究数据。根据CSM 2018年最新基础研究数据,52个大中型城市中拥有智能电视及盒子的家庭占比已达到44.9%;IPTV家庭也超过三成;DVB数字有线的家庭用户略有降低,目前为56.5%。我们由此可以看到,实际上电视设备数字化发展增速是非常快的,但是对于电视大屏广告的评估,仍然是沿用数字媒体的广告评估模式。

  CTR 2018年行业调查结果显示,超过73%的观众并非独自收看电视,而是与家人共同分享。电视屏前更多仍然是多人共享的大屏收视场景,同一台终端反映的是不同家庭结构与人口属性的观众收视偏好的集合。这一点与作为数字媒体代表的PC、Mobile完全相反,后者反映的行为基本代表的是单一个体的收视。

  另一方面,电视大屏端的广告形式也随着技术发展更加丰富。相比传统直播广告,现在的电视机在开机时会出现开机广告,点播视频时会有贴片广告,暂停时会有暂停广告,还有在用户操作系统中设置的各类品牌专区等。CTR研究数据表明,接近7成的大屏观众对开机广告会有明显关注,前贴片和中插广告位居其后。

  面对丰富多样的大屏广告形式,广告主在投放决策时最为关注BIVT四大问题。其中就有对TA目标受众的精准需求。准确的TA可以帮助广告主在电视大屏媒体上进行高性价比的投放,获得最佳的投放效果及ROI。

  为什么要做这件事情?刚才我们也讲到了,终端收视并不是个人收视,它带来的问题是我用终端数据,没有办法完全去反馈到,或者反映到屏幕背后的不同的家庭结构和观众的人口属性。现在行业比较通行的做法,是基于终端的收视行为,利用用户画像把电视机屏幕后面的个人“画”出来。这种方式做不到千人千面,只能叫“千机千面”。为什么这么说?因为一台终端,可能会对应多个人口的标签,没有办法确定这条广告真实触达的TA。不断变化的收视行为将导致不断变化的TA,缺乏准确、科学与稳定性。传统的电视广告的评估,是一个基于个人收视的评估,所以我们认为基于互联网,或者新一代数字电视的收视测量评估目标,也应该是个人收视的评估,在这点上,刚才赵梅总已经做了很详细的阐释。

  CSM为什么要做精准TA?

  CSM希望能够通过多年积累的第三方大屏收视数据研究的经验,为行业提供科学、准确、稳定的TA数据解决方案,也就是从终端到个人的收视评估的解决方案。为什么CSM来做这件事情呢,实际CSM是现在市场中唯一拥有准确的家庭人口结构、个人人口属性,以及个人收视与终端收视对应的第三方数据公司,我们在样本维护、数据质控方面的积累的经验已经超过20年的时间。

  从2017年起,CSM就联合了中国传媒大学的大数据挖掘与社会计算实验室合作并共同建立媒介研究大数据实验室,对数字化时代下的电视观众的家庭结构和收视习惯进行了深入的研究,通过AI机器学习的科学方法,建立具有理论化的TA的计算模型,目的是为行业提供精准的TA的支持,以保证在OTT/IPTV、DVB等各类大屏的终端,帮助广告主解决广告效果评估的痛点的问题。

  今天我主要讲到的两点:第一就是为什么行业需要。第二就是为什么CSM来做。接下来就有请中国传媒大学新闻学院教授、中国市场研究协会会长沈浩教授上台。一方面是我们双方宣布媒介研究大数据实验室正式成立,就是CSM和中国传媒大学大数据挖掘与社会计算实验室,我们共同成立一个媒介研究大数据实验室正式成立。另外一方面,请沈教授就我们在Smart TA研究成果做一个阶段性发布。

  以下是沈浩演讲全文:

  谢谢大家,非常高兴能够来到这儿,跟CSM一起发布Smart TA目标受众的模型。首先我真的特别喜欢大屏,我的实验室55寸以上的大屏有15块,既有投影大屏,也有电视大屏,也有拼接大屏。我们主要是把这些大屏用在科研上,用在展示大数据可视化的一些研究上。我们今天关注在Smart TA这个逻辑上,我记得两年多前,CSM的肖总就找到我,希望我们共同去做一些相关的研究。

  Smart TA研究成果

  如何建立个人收视特征? CSM拥有20多年的积累,拥有所有收视行为的标签,也就是说它进行入户调查,获得了家庭,或者个人收视行为的标签。这个标签实际上非常重要,因为我们知道这几年大数据,特别是大数据赋能AI兴起。人工智能一个很重要的特征在于计算机视觉,能做到对视觉图片的分类,拥有上千类的识别能力,而且这个准确性很高,甚至在监督类的深度学习上,基本达到了人类,甚至超过人类的水准。

  在这两年多的研究过程中,在CSM大力的数据支撑下,我们去思考这样一个问题,我们把一个受众,或者一个样本户,它在24小时,在一个礼拜,或者一个月内收集到一起,就形成了一个收视的进程模式的图形。如果我们假设一个样本户,特定的家庭结构应该是有模式的。所以在这样的假设情况下,我们就思考如何把一个收视的行为,以图像的模式去识别它。在这个识别的过程中,我们拿到一张图片,是由它的形态加上它的通道,我们叫RGB。RGB对我们日常的收视行为来讲,我们当成单色的,一个黑白的照片,所以我们在做训练模型的时候,通过大量的数据训练,最初的目的是希望基于CSM的自身的数据,能够更好的去建立一个模型来分类,或者是预测CSM本身它的TA数据的分类比较准确。

  在这个过程中,会发现我们的模型大概会达到40-60%之间的准确性,这个效果不是太好,主要是因为我们把所有的受众变成单色的,后来根据CSM和我们的实验室,双方一起研究这个过程,提出了把RGB当成了一种通道的概念。

  这种通道可能是少儿节目、青年节目、少年节目、时政类节目、娱乐节目、综艺节目,也就是一个类型的都变成一个像RGB通道,我们的一个样本户的收视行为就不是黑白了,而是有色彩的了。

  当我们这种色彩纳入到我们的深度学习的模型中,就知道,其实一张图片的背后是像素,而每个像素的取值的是0-255,我们把这个深度学习的像素当成收视率,通过标准化或者规则化,就形成特定的窗口期和特定的通道。

  这种窗口期实际上指的是在分析的过程中,拥有的消费者的收视率的时间,一个途径。通道指的是我们消费者在特定的基于CSM的用户类型上所形成的一个叫做多通道的概念。我们分成12类以上,在不同的类别,或者全通道上,进行了类似于数据整合,也就是真正看到一张相片,实际背后是图片。这张图片是什么呢?其实我们知道,人类是看得懂数字,但是人们的收视行为,其实并不想我们数字这样,能分出0、1、2、3、4、5,所以我们需要用深度学习的方式,通过一定的高性能计算,最终我把这样的通道去送入深度学习,构建卷积神经网络。

  最开始的思考是我们能不能推断出CSM已有的家庭结构的类别,同时我们也希望,要不直接就推断它的标签,比如性别、年龄、家庭特性。在这过程中,不断尝试两种方法,最终在特定窗口期内,会达到一个比较好的效果。在这个效果里,最终我们走入了直接面向个人收视特征的性别、年龄的推荐模型,这种模型需要去验证。

  好在CSM最大的价值在于它拥有长期的积累和非常强大的数据重构能力,他可以给到我们,他们基于已有的收视率多年分析的模式,给到我们可以适合深度学习的数据结构。我们在做这个的过程中,也想到了,如果我们的运行,或者推断能力,通过AI这种技术,就能达到很好的效果。

  实际上我们对那些基于OTT,包括像欢网这样的数据公司,他们拥有上千万以上的数据收视行为,我们是否能达到推荐每个个体,每个收视集或者收视户都是一张图片,都是在特定窗口期中不断追加图片的分类。所以在这个过程中,可以平滑去移动、推荐,或者去预测类似于像欢网这样的数据的个人收视行为。所以通过不断的调试,在一些特定的窗口期内达到了60%,在特别好的窗口期上,我们已经达到了80%这样的一种预测的精度。

  当然了,加上我们希望能够有更好的训练模型,在特定的窗口期和特定的通道上,我们会进一步提升这样的预测准确性。当然这里边有两个很重要的条件需要保证,就是未来我们需要有更充足的训练,更充足的数据喂养给我们这样一个Smart TA的模型,才能让它更加完善。第二,我们希望索福瑞,包括欢网,或者其他之间的数据重构能够更加平滑,在这样重构平滑的情况下,使得我们能够对千万级以上的数据进行实时的预测。

  同时这种预测能力,在能够在云平台上,让CSM不一定在实验室,可以在一些客户终端上去使用我们已经构建好的模型,来实时进行推荐。当然我们后续最重要的工作,还是进一步在不同的地区,和CSM和欢网,或者其他数据类型公司,我们进行再进一步的测试,以期能够提升我们的预测准确性。

  目前来看,从户规模以及户结构,基本从数据的角度来讲,还是可以被接受的,至少从CSM的角度看,这种模型是一种趋势,是可以去推及个人样本,并且在算力上,在模型重构建好之后,是可以重复的、自动化地去运营的。这就为后续工程上的部署和推荐,提供了有效的保证。当然最终Smart TA这个模型,还是需要在CSM,包括欢网这样的数据公司的大力支撑。我也在不断地学习,能够在模型的参数上,以及模型的深度上,再次进行深入的探究,我们曾经尝试了LSTM,这种叫做长短记忆模型,把消费者变成长流的收视行为,但是不如现在的模型更有价值,所以我们对这个模型会做更深入的研究,也会在其他方面做更多的探索。我也希望得到CSM和欢网的大力支持。谢谢大家。

  (丁迈)其实最后要说一下,正如沈教授所说,这个模型可能还要基于目前不同的收视市场和收视场景去做一些自适应,在这个过程当中,下一步我们一方面也要提高模型的稳定性和可靠性,另外一方面也会实现这个模型从终端到人的最终的收视的分配,为行业提供准确、可靠的,从终端到人的大数据评估的解决方案。谢谢大家。

责任编辑:孙嘉
版权声明:凡来源标注有“流媒体网”字样的文章,版权均属流媒体网站,如需转载,请注明出处“流媒体网”。非本站出处的文章为本站转载,观点供业内参考,不代表本站观点。

相关新闻

{$Hits}