云计算在数据通信的运用——云计算助力电信企业推进机器智能

(整期优先)网络出版时间:2012-05-15
/ 3

云计算在数据通信的运用——云计算助力电信企业推进机器智能

汪飞

汪飞(重庆移动业务支撑中心研发部,重庆渝北区401420)

中图分类号:F623;TP3文献标识码:A文章编号:1003-2738(2012)05-0332-02

摘要:云计算是一个新鲜的词汇,机器智能则是一个很老的词汇,而当传统电信企业介入以后,事情开始像更广阔的方向发展,特别是云计算的提出,一个看似在某个地方发起的机器智能项目开始逐步脱离地域的关联,上升到空中,漂浮于云端,让千千万万人能实际的从云中受益。

文中介绍了许多技术,这些前台和后台的的技术组织起来,形成了我们能切身感受到的机器智能,当我们讲出一句话,前台和后台的技术会配合把我们这句话中想要的关键内容分析抓取出来,把从后台找到的结果反馈到前台呈现在我们的眼前,这个过程是云的过程,也是电信企业运营的过程,更是一次令人愉快的机器智能体验。

关键词:云计算;机器智能;电信;运营;技术

Cloudcomputingisafreshvocabulary,machineintelligenceisaveryoldwords,andaftertheinterventionofthetraditionaltelecomcompanies,thingsbegantolikethebroaderdirectionoforiginalgeographical.especiallycloudcomputinginitiated,amachineintelligenceprojectseeminglyinoneplacebegantomoveoutofthegeographicalassociation,androseintotheair,floatingintheclouds,thousandsofpeopletotheactualbenefitfromthecloud.

Thispaperintroducesalotoftechnology,theseforegroundandbackgroundofthetechnologytoorganize,wecanfeelthemachineintelligent,whenwespeakaword,frontandbackofficetechnologyinconjunctionwiththissentencethatyouwantthekeyelementsofcrawlingoutfromthebackgroundtofindtheresultsbacktothefrontispresentedinfrontofus,thisprocessistheprocessofcloud,theprocessofthetelecommunicationsbusinessoperations,isapleasantmachineintelligenceexperience

一、源起

1950年,图灵来到曼彻斯特大学任教,同时担任该大学自动计算机项目的负责人。就在这一年的十月,他发表了一篇题为《机器能思考吗?》的论文。正是这篇文章,为图灵赢得了一顶桂冠——“人工智能之父”。在这篇论文里,图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调,做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义,由此提出一假想:即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(TuringTesting)。当时全世界只有几台电脑,其他几乎所有计算机根本无法通过这一测试。但图灵预言,在20世纪末,一定会有电脑通过“图灵测试”。那么什么是图林测试呢?一种测试机器是不是具备人类智能的方法。如果说现在有一台电脑,其运算速度非常快、记忆容量和逻辑单元的数目也超过了人脑,而且还为这台电脑编写了许多智能化的程序,并提供了合适种类的大量数据,使这台电脑能够做一些人性化的事情,如简单地听或说。回答某些问题等。那么,我们是否就能说这台机器具有思维能力了呢?或者说,我们怎样才能判断一台机器是否具存了思维能力呢?为了检验一台机器是否能合情理地被说成在思想,人工智能的始祖阿兰•图灵提出了一种称作图灵试验的方法。此原则说:被测试的有一个人,另一个是声称自己有人类智力的机器。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都可以。问过一些问题后,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。目前还没有一台机器能够通过图灵测试,也就是说,计算机的智力与人类相比还差得远呢。曾经红极一时的自动聊天机器人小I就是这方面探索的结果。

2003年,美国国防部高级研究机构(DARPA)发起了一个相关项目“enduringpersonalizedcognitiveassistant”,该项目在当时被称为CALO(“CognitiveAssistantthatLearnsandOrganizes”的缩写,意即“具备学习和组织能力的认知助理”)。这个项目提出的时候还没有真正的云概念,但照今天的观点来看也具备一些很萌的云的概念,使用的设备是位于斯坦福的多台服务器,或者说应该属于一种云应用,一种很萌的关于机器智能的云应用。负责这个项目的,是斯坦福研究院(SRI),而当今最火的云计算领航者——谷歌(Google),它的两位创始人正是来自SRI的博士研究生。

上面的故事看来这是一个机器智能项目的开端,而当传统电信企业介入以后,事情开始像更广阔的方向发展,特别是云计算的提出,一个看似在某个地方发起的机器智能项目开始逐步脱离地域的关联,上升到空中,漂浮于云端,让千千万万人能实际的从云中受益。如此这样说是为了符合云的虚无飘渺的特性,下面我想是时候引入一些实际的例证了。当然,这些实际的例证会涉及到许许多多的传统技术,让我们看看他们是如何有机的组织起来构成一个庞大的云计算帝国中的一员的。

二、电信企业中的应用

电话终端通过基站(BST)连接到后台的交换节点,通过交换节点之间的光纤一直联通到各地的云计算基地,基地与基地之间各不相同,有的负责语音识别,有的负责知识存储,有的负责数据分析匹配推荐等等。

当用户的需求呈现在他的脑海中的时候,他就可以拿起身边的电话,对着电话说出自己的想法,比如他说我肚子饿了,模拟的音频信号被电话终端转换为数字信号,透过基站与手机之间的无线链路传送,首先被送到负责语音识别的基地,该基地通过比对将用户语音识别为ASCII码文字,再把这段文字送到负责分析的基地把用户可能想得到的信息翻译出来,比如自己做饭会想查询附近的超市有哪些食材,购买人最多的是什么,性价比最高的今日推荐是什么,又或者出去吃附近餐馆名称有那些,那家口碑比较好,那家环境比较优雅,那家价格便宜味道也不错。在把这一系列问题传送到负责知识存储的基地分门别类找出答案,回传到用户的电话终端。用户可以根据这些答案很方便的把肚子问题解决掉。又或者一句我感冒了,会得到非处方感冒药信息,民间偏方,各大医院的位置,乘车路线等。

在后台方面,这是真正的技术核心。当然,普通用户是不会在意的,这些技术的目的就是处理用户的请求,并返回最匹配的结果,这些请求类型很多,千奇百怪,要处理好并不简单。基本的结构猜测可能是分析用户的输入(已经通过语音转化),根据输入类型,分别采用合适的技术进行处理。这些合适的后台技术包括,①以Google为代表的网页搜索技术;②以WolframAlpha为代表的知识搜索技术(或者叫知识计算技术);③以Wikipedia为代表的知识库(WolframAlpha不同的是知识来自非手工编辑)技术(包括其他百科,如电影百科等);④以Yelp为代表的问答以及推荐匹配技术。这些技术在当今的运营商角度看来,会变成IDC的服务器租用、互联网出口租用、安全及运营维护的委托管理等。主要有以下几项:

(一)语音识别以及语音合成技术。

电信企业利用语音合成与识别为用户提供出各种基于internet和传统电信七号信令网的模糊搜索,指令控制、监控扫描功能。语音识别技术,这是一个需要云端支持的技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

(二)网页搜索技术。

电信企业通过gprs、3g以及LTE技术为用户展现,如Google、百度。进一步则是知识计算(搜索)技术(ComputationalKnowledge)这个技术的代表是Wolfram|Alpha。不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。

和网页搜索技术不同的是,在这个系统中,得到的答案结构化程度很高,比如搜索China,能得到和中国相关的各种参数以及资料,并以接近表格的方式呈现。Wolfram|Alpha也能理解部分自然语言,比如输出Howoldareyou,其会回答Wolfram|Alpha的年龄。想测试这项技术的请移步Wolfram|Alpha。这个技术国内做的不是很多,百度的框计算是这个方向但还不够成熟。

(三)知识门户技术。

同样以电信数据网络作为支撑的是知识门户(knowledgeportal),这个技术的代表是维基百科,以及各种专门的百科网站。相比于网页搜索技术,基本以一个词条或者主题为单位,因此得到的数据价值高,知识量大,并且结构化程度好。相比于知识计算技术,这些技术需要人的参与,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来的知识更丰富,准确;弊就是,人力有限,即使像维基那样,发动社区的力量,也不能产生足够的知识,而知识计算,理论上,只需要算法够强劲,是可以产生“无限”的知识的。

三、总结

云计算的到来为传统电信运营商提供了一条崭新的金光大道,虽然很多人说当前的云计算概念有炒作的成分,其本身并没有比过去更多的实质的新内容,跟以往提到的网格计算、并行计算并没有本质的区别,内涵是一致的。其核心强调的都是将存储和计算更多的通过网络进行,通过共享达到提高资源的利用率降低成本的最终目的。但很明显这是一个视角的问题,同样一个事物你从不同的角度去观察就会得到不同的结论,云计算铺就的电信应用运营之路是全新的,它不仅仅是传统意义上的新瓶装旧酒,作证的关键点是它带来的新的利润增长点,它为新时代背景下的电信运营指明了思考的方向。