齐鲁论道|山东海看隆龙:浅谈AI人工智能

流媒体网| 2019-05-13

　　【流媒体网】消息：2019年5月8日-9日，由流媒体网携手山东海看网络科技有限公司、中国联合网络通信有限公司山东省分公司联合举办的第十七届论道——“齐鲁论道-启智·视听”暨“中国IPTV/OTT视听产业高峰论坛”在济南喜来登酒店隆重举行。

　　当前，各地广电新媒体正在成为推动IPTV发展的新兴驱动力，从视频业务到增值服务，各地新媒体在不断完善自我之余，也带动了整个IPTV产业的成长。在9日下午“电视新媒体的破局与创新”分论坛上，与会嘉宾对新媒体的前行发展进行了探讨。山东海看网络科技有限公司研发中心副总经理隆龙做了主题为《浅谈AI人工智能》的演讲。

　　以下为演讲全文：

　　尊敬的各位嘉宾、领导，还有我们山东本地的同事，大家下午好。非常荣幸能有机会在这里跟大家一起分享技术以及探讨新媒体下一步的发展。本次论道的主题是IPTV的发展，这两天在论坛听了各省大佬以及专家们的发言，我学习到了很多，也希望能借助今天论坛尾声，稍微换一个轻松点的话题，来聊一聊目前互联网大热，而且听起来非常时髦的名词——人工智能。

　　当然这个话题也不是随意发散，现在IPTV已经发展到第三个阶段，到了要深挖用户、深度运营的阶段。大数据、人工智能将会对深度运营能力带来巨大的推力。现在我们经常听到智能推荐，智能审核，智能搜索，智能分类，智能标签，千人千面等等这一系列，我认为严格来说都属于人工智能的范畴。但是目前大多人对这一块还比较陌生，无法去辨别市面上提到的人工智能到底哪些是真的，哪些是伪人工智能，所以我觉得今天有必要把这个作为一个课题，和大家一起分享一下。

　　人工智能看似简单，但实际又很难回答究竟是什么是人工智能。可能你脑中会出现智能机器人这一类的场景，又或者我们市面上经常能听到智能音箱，智能语音对话等等，又或者以上都不是。实际上每个人自己心里都有个模糊概念，但客观又说不清楚，所以我们先来看一下关于AI的官方解释。

　　这段话有两个毛病，一是很让你读不下去，二是即便读了也跟没读差不多。那我们怎么才能去简单的理解这个概念？简单来理解，其实AI是一种思维能力，并不需要把AI非得赋予一个具体的形象。技术上，你可以把他理解成一个Function，或者功能、能力，他不是写出来的，而是通过大量的数据训练出来的。

　　既然是一个Function，为什么现有的程序不能叫人工智能？大多数程序都是通过代码人员不断写if、then、else，通过“预置”来让程序判断。一个非常简单的例子，当我们告知计算机遇到图片猫，它就会输出一只猫，遇到图片狗，就会输出一只狗，但出现一个未知图片程序就搞不定了。如果非要拿传统的程序去识别，就必须无限往程序中去堆叠图片素材，但总会遇到未知，这是它无法识别的。

　　问题来了，AI是怎么认识之前没有见到的物体？就像我们经常提到一个化繁为简的话题，把一只大象装到冰箱需要三步，而人工智呢的工作过程，也可以归结为三步。第一步，我们要根据现有的问题和条件，设定一系列可能的Functionn。第二步，将大量的训练数据录入到AIFunction中，进行数据训练，也就是我们经常提到的模型训练。第三部分，要不断的拿结果进行校对，从而最后筛选出一个最优方案。经过算法和训练得出来的Function，装入一个实际的场景中时，但凡里面带着这只猫的特征，它都可以识别。

　　从这个简单的AI场景来看，AI的思维方式实际上跟人是非常相似的。我们人类思考，是根据经历的过往，经过反思，从而得出人生的一个道理，当遇到新的问题的时候，用以往的经验和道理得出新的解决办法。对于AI来说，人类的反思过程就是机器的训练过程，而最终得到最优解。所以区别于普通程序，AI是有学习能力的。

　　区别于普通程序，AI是有学习能力的，那么AI的学习方式有哪些？可以归结为五类。监督式学习，非监督式学习、半监督式学习、迁移学习，以及增强学习。机器学习方式是AI算法的一种分类形式，世界上每一类的分类下面都有许多的AI算法。如果你现在要做一个AI，要先考虑拿来干什么，要让它有一个什么样的功能。很大程度取决于AI的输出形式。

　　下面讲讲回归任务，它的特点是输出的结果是一个数值，比如要预测一下明天的PM2.5，预测出来的一定是一个数据，而不是一段语音。它的训练数据可能是来自于过往的数值。分类任务的输出结果实际上是一个多选项类型，比如垃圾邮件的AI处理，在经过AI训练之后的Function，就能识别出两个结果，一个Yes，一个No，它是一个双结果，它只需要判断你的邮件是不是垃圾邮件。再下面是另外一个分支，就是多选项的结果。比如文档归类，AI在获取各种文字信息之后，能当文档进行各种分类，这在分类中是比较常用的学习方式。

　　而实际我们在AI的运营过程中，需要输出的不仅仅是上面提到的单数据，或者是判断分类之类的一些结果，还用到其他的输出形式，这里就提到了结构化任务，输出的是一个无穷选项的结果，比如事例一是语音转换，事例二是语音翻译，事例三是人脸识别。另外要特别强调的一点就是，这一类学习方式最好要搭配增强学习的方式，有一个很出名的人工智能，就是谷歌的alphago，它就是增强学习方式。

　　各种学习方式的显著的区别，比如数据标签。监督式学习的训练数据是百分之百带有标签的，因为你的数据没有标签，等于就是一个废数据，没有实用价值。在训练数据的过程中，我们要为每一项数据打上标签。半监督学习方式，如果你手头上有一部分数据是有标签的，另一部分没有标签，那这种学习方式，它可以利用未做标记的数据进行这个方式的优化，也常用于数据的学习。最后再来看一下我们提到最多的增强学习方式。增强性学习就跟你跟一个陌生人去对话，你们聊了很久，对方只给你一个回馈，好还是不好，他最后可能就敷衍离去了，剩下来就需要你的机器自己去判断，去揣测我哪里做的不对。另外一个例子就是下围棋，给机器一堆棋谱。在增强学习方式下，要让机器自己去下棋，它需要下几百手棋，至于下的好还是不好，它需要自己去判断，自己去提高。

　　五种常见的计算机学习的方式一个显著的区别其实就是标签化的区别。

　　AI最关键的三要素，三驾马车。分别是算法、算力和数据。

　　如果有了算法，没有计算能力是徒劳，有了算法和计算能力，没有数据的支撑就像锅碗瓢盆都准备好了，就是缺菜没炒，所以导致数据训练无法采取，导致算法不能去使用。三驾马车中，算法是核心，一旦算法出错了，后面所有工作都是白费。

　　主流算法

　　第一类，回归算法，回归算法又分成线性回归和逻辑回归。线性回归适合解决最值的问题，比如广告点击率。逻辑回归适合线性的分类问题，比如你是否应该去贷款。

　　第二类，人工神经网络ANN，是模拟人脑的神经网络，有输出层，中间也有多个隐藏层，可以完成非线性的分类。我们距离的图片识猫，就是使用了这类算法。

　　第三类，SVM支持向量机，它是将低维空间映射到高维空间，实现更好的分类。

　　第四类，聚类算法，这个很多公司都在使用，它划分的原则是组内聚力的最小化，以及组与组之间间距的最大化，以及我们搜的热词，关键词，都用的这个方法。

　　第五类，降维算法，将高维转化为低维，去除冗余的信息和噪音信息，提升计算速度，同时尽量将信息的损失控制在最小。比如举个例子，计算房屋的面积，和它价格之间的关系。

　　第六了，推荐算法，有基于用户的兴趣去做的推荐，也有基于物品的特性去进行推荐，有的还要基于用户的相似度进行推荐，比如说淘宝商品的推荐，今日头条的文章，还有云音乐的音乐推荐，实际上还包括我们IPTV的千人千面。不一定非得基于产品去推荐，也可以基于某一个用户喜欢一类产品。而与这个用户相似的还有一类用户，你也可以把这个产品推荐给他，这是两种维度。

　　在讲算力和算法之前，我觉得有必要回顾一下AI的发展史。第一个阶段在上个世纪五十年代、六十年代就开始了，有一个阿兰图灵创立了图灵测试这么一个里程碑事件。第二个阶段是进入了AI的寒冬时期，上世纪七十年代到八十年代，因为纯有算法而没有计算机的计算能力，以及没有能够你去训练模型和得出你这个Function的训练数据。第三阶段就是二十世纪九十年代一直到本世纪初，这个阶段有大量新的算法提出。第四阶段，也就是目前深度学习的理论提出，并且大数据和云计算的技术，它的迅速发展，给了人工智能蓬勃发展强大的助推力。

　　人工智能有五六十年的历史，为什么到近两年才爆发，过去是由于算力跟数据的一个瓶颈导致的。诸多的学习方式都需要标注数据，也就催生了数据标注行业的出现。实际上刚刚也提到了，人工智能其中有一部分，在创造的过程中并不是完全智能的，需要伴随大量的人工去储备，去训练，所以用一句话可以概括，我的人工，你的智能，智能离不开人工。

　　AI目前都有哪些使用场景

　　从广义上来讲它分成四大块，有AI机器人，计算机视觉，智能语音以及自然语言的处理。它的应用场景如果放到行业之中，基本上各行各业都用得到，有大量数据的，都可以让AI辅助去处理，比如汽车、交通、医疗、法律等等。

　　在电商行业，淘宝店铺的千人千面。汽车行业，有谷歌的无人车，百度的无人车，特斯拉的无人车。客服行业，经历了四个阶段，很多之前叫AI客服实际不是，是计算机客服。2016年、2017年，淘宝的智能客服接单量，占了总量的96%，可以看到AI客服现在扮演的角色是越来越重要了，它能极大的降低人力成本，有效提高沟通效率。

　　设计行业，不得不提到阿里巴巴的鲁班，鲁班的能力是每秒可以完成8000张banner设计。2017年，双十一期间，鲁班设计了四亿张单子，没有一张是相同的。

　　城市交通，现在济南已经使用了AI交通灯了，包括AI可以由路口车辆感知，还有识别车牌号，很多停车场都在使用这个技术，包括警用的AI监控。

　　医疗行业，医疗行业比较出名的有谷歌的DeepMing，还有IB的Wat…。

　　IT行业，BBC记者选了一个挑战，挑战天网AI系统，当时把自己的照片拿手机拍了下来，然后录入到天网系统中，他花了七分钟的时间，进了一个车站售票厅，然后直到警方通过他的照片抓获他，前前后后一共用了十几分钟。

　　做一下简单的总结。第一点，从技术角度来看，AI是一个能力，它是由算法、算力、数据这三驾马车驱动的。第二点，AI起源于六十年前，并非近期才出现的新事物，但之所以爆发于近两年，这归功于算力的提升和大量数据的积累。第三个，AI在短期内绝对无法取代人类，至少在弱人工智能上，它只是我们人类在各行各业的辅助工具。但是，AI确实会消灭一部分的就业岗位，但是它同时也会创造出新型的岗位。第四点，AI未来的发展前景非常好，2019年的AI可能会和2012年的移动互联网一样，是一个迅猛发展的行业。未来的三十年，随着AI技术的不断发展，数据红利将得到释放，能给社会带来更多的生产力，以及更多的生产效率，产生巨大的经济效益和社会效益，人工智能带来的利会远远大于弊。

　　以上是我的演讲内容，感谢各位聆听。

责任编辑：王楠

分享到：