<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head> 
<meta http-equiv="Expires" content="0"/> 
<meta http-equiv="Cache-Control" content="no-cache"/> 
<meta http-equiv="Pragma" content="no-cache"/> 
</head>
<card title="腾讯AI同传闹乌龙，质疑“AI取代论”的理由有哪些？ _砍柴网">
	<p><a href="https://wap.ikanchai.com/">首页</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=5">科技快报</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=16">业界</a> &gt; </p>
	<p align="center"><big>腾讯AI同传闹乌龙，质疑“AI取代论”的理由有哪些？ </big></p>
	<p align="right">2018-04-14 19:59</p>
	<p><p align="center"><img src="http://upload.ikanchai.com/2018/0414/1523707196812.jpeg" /></p><br />
人工智能又又又摔了个跟头。<br />
今年的博鳌亚洲论坛上，第一次出现了AI同传。值得注意的是，这是博鳌论坛创办17年首次采用人工智能同传技术。然而，在如此重要的场合，现场配备的腾讯AI同传却掉了链子。词汇翻译不准确、重复、短语误用等&ldquo;乌龙&rdquo;引来各方&ldquo;嘲笑&rdquo;。<br />
人们总是把AI跟人类职位对立起来，各种&ldquo;取代论&rdquo;层出不穷。博鳌论坛会议前，就出现了许许多多的&ldquo;取代论新闻&rdquo;引起了各界关注。最终，AI同传&ldquo;翻车&rdquo;，引来外界一片唏嘘。<br />
然而，就目前来看，AI同传前路未明，太早将其与人类同传对立起来实在是&ldquo;杞人忧天&rdquo;。除了取代，AI同传其实有更好的路。<br />
<p align="center"><img src="http://upload.ikanchai.com/2018/0414/1523707196775.jpg" /></p><br />
图为AI同传内容<br />
AI同传进阶之路：变智能问题为数据问题<br />
很多人都觉得人工智能如果要处理自然语言，就必须理解自然语言。实质上，AI翻译靠的是数字，更准确地来说，是统计。AI同传出错，并不是&ldquo;智能&rdquo;不够，实质上，是数据和模型出了问题。<br />
AI同传还需要理解力<br />
首先，AI同传要去理解场景。在博鳌论坛上，会议现场专业度高、覆盖度广，AI对特殊场景的理解还不够。场景对于语义具有至关重要的影响，相同的一句话在不同的场景里有不同的意思。举个例子，&ldquo;好 &rdquo;这个字在百度汉语显示有多种语义，既可以表示称赞，也可以表示状态，还可以表达问好&hellip;&hellip;诸如此类，语义的表达和理解都要结合具体的场景。在具体的句子中，这种语义与情景的结合就更为紧密，更需要机器理解学习。<br />
其次，AI要理解口语的模糊逻辑。口语翻译是不会百分百传译的，根据 AIIC（国际会议口译员协会）的规定，同传译员只要翻译出演讲者内容的80%就已经算是合格了（90 %~100 %的&ldquo;同传&rdquo;几乎是不可能的）。<br />
这意味着AI工作量减少吗？当然不，正是这种模糊的东西使得AI同传更加困难，除此之外，口语没有标点符号来标志句子，缺少了必要的声调和停顿，就很容易造成句子的歧义。而模糊的指令极有可能出现的是满屏的错码。<br />
隐马尔可夫模型（HMM）解决统计数据之外的语言问题<br />
然而，在参考腾讯AI同传的失误后，我们发现，仅仅增加数据量还是不够的，在现实生活中，我们也会遇到零概率或者统计量不足的问题。<br />
比如一个汉语的语言模型，就足足达到20万这个量级。曾有人做过这样一个假设，如果刨掉互联网上的垃圾数据，互联网中将会有100亿个有意义的中文网页，这还是相当高估的一个数据，每个网页平均1000词，那么，即使将互联网上上所有中文内容用作训练，依然只有1013。<br />
为了解决数据量的问题，我们提出了隐马尔可夫模型（HMM）。实际应用中，我们可以把HMM看作一个黑箱子，这个黑箱子可以利用比较简洁的数据，处理后得出：<br />
每个时刻对应的状态序列；<br />
混合分布的均值和方差矩阵；<br />
混合分布的权重矩阵；<br />
状态间转移概率矩阵。<br />
看起来可能比较复杂，简单点说，这个模型可以通过可观察的数据而发现这个数据域外的状态，即隐含状态。也就是说，我们可以凭借一句话，来探索出这句话后的隐含的意思，从而解决一些微妙的语义问题。<br />
<p align="center"><img src="http://upload.ikanchai.com/2018/0414/1523707196154.jpeg" /></p><br />
如上图所示，这个模型能够通过你提供的可以明显观察的句子，推断出一个人隐含的心情状态（开心OR难过），并得到最后的行为判断（宅、购物、社交），即通过已知推断出未知。<br />
而如何优化这个模型，得到最优隐含状态？人们提出了许多解决问题的算法，&nbsp;包括前向算法、Viterbi算法和Baum-Welch算法。此中奥妙，难以尽述。<br />
但不能否认的是，在深度学习的基础上，数据+模型就能很好地打造出一款AI同传翻译，数据越大，神经网络更好。即使翻译结果不尽如人意，但只要建设足够大的数据库，建立更好的模型，打磨算法，AI同传很快就会有更大的提升。<br />
NLP金字塔顶端反哺底端：打造高质量AI同传<br />
除了增加数据库和打磨数据模型，AI同传还可以从哪些方面提升呢？我们不妨借鉴一下其它的技术。下图中，这四个方面代表了人们在 NLP 领域的一些进步。用金字塔形来表示这四个技术之间的关系，难度是逐级上升的。<br />
<p align="center"><img src="http://upload.ikanchai.com/2018/0414/1523707196760.jpeg" /></p><br />
目前，聊天机器人和阅读理解这一块儿已经取得了很大的突破。而AI阅读理解技术的进步不止是NLP的高阶进化，还有一层意义是，科学之间是相通的，技术之间可以互相借鉴，金字塔顶端技术可以反哺底端。<br />
在自然语言处理上，人区别于AI的点在于人有先验知识。即人们在听到某个字时，会自然地联想到后一个字，或者会被一个词触发了一句话的联想。比如，我们听到&ldquo;中&rdquo;，既有可能想到&ldquo;国&rdquo;，也可能想到&ldquo;间&rdquo;。但是AI&ldquo;联想&rdquo;的词却依靠数据。它说&ldquo;北&rdquo;，如果输入的数据不变，那后面跟的就是&rdquo;京&ldquo;。<br />
<p align="center"><img src="http://upload.ikanchai.com/2018/0414/1523707196551.jpeg" /></p><br />
智能相对论行业分析师颜璇曾经在《AI在阅读理解领域开始&ldquo;跑分&rdquo;，这个&ldquo;人类好帮手&rdquo;还能去哪炫技》一文中总结了AI阅读理解的技术层面，我们或许可以从中得到阅读理解技术反哺AI同传的方法。<br />
AI阅读理解技术的流程如下：Embedding Layer（相当于是人的词汇级的阅读知识）&rarr;Encoding Layer（相当于人通览全文）&rarr;Matching Layer（相当于带着问题读段落）&rarr;Self-Matching Layer（相当于人再读一遍进行验证）&rarr;AnswerPointerLayer（相当于人综合线索定位答题）。<br />
综合来看，阅读更偏向的是 Multi-turn，即做完一次输入输出后，要把结果作为下轮输入的一部分继续输出，系统在运作时需要考虑上下文。而翻译，则是 Single-turn，一句话进一句话出。<br />
合理利用后，机器翻译即使现在是 Single-turn，将来也有可能是 Multi-turn；AI同传现在没用到上下文背景，将来也有可能结合上下文做到翻译质量更佳。<br />
如今，创作还是人工智能正在摸索的领域，而一旦这个领域有了突破，将一些技术应用到AI同传里，我们或许可以达到翻译的最高境界&mdash;&mdash;&rdquo;信、达、雅&rdquo;。<br />
在未来，AI不会挤占人类同声传译员的空间<br />
AI同传会取代人类翻译吗？当然不会。先不说语言本身的复杂，我们可以来看看同传的实际应用场景。<br />
在实际工作中，不论是口译还是直接对话都需要同传来完成，不会有被服务方只聘用其中的一个职能。也就是说，AI同传不仅要学会翻译，还要学会聊天。而在这一块儿，机器还有很大的进步空间。那么,AI同传的用处在哪里呢？<br />
AI共享同传，仅针对普通人的市场<br />
人们出国旅游，常常会遇到语言沟通问题，然而，并不是每个人都配得起一个专业的口语翻译。这时候，如果一个可穿戴设备亦或者一部手机就能为你同声传译，想必会减少很多人的出国成本。随身携带一位专属的同声传译，是不是觉得很酷呢？<br />
智能硬件一直是AI的狂热地带。就在去年，微软和华为合作，在 Mate 10 手机中嵌入了微软的神经网络机器翻译，可以算得上是在终端运行神经网络机器翻译的第一例。<br />
如果AI同传的硬件设备出世，更可能的商业模式是出租或者共享。即按需求进行租用，有一个专门的技术公司负责租赁，正如共享单车一样，我们的使用费会降到极低。而这类AI的应用场景并不在复杂的会议现场，而是日常生活，出外旅游等，语料库的建设也会更加简单。<br />
如此，AI同传只是更加惠民而已，却不会取代在某个特殊场景比如金融会议、医疗会议等更加专业的人类同传。<br />
将AI同传与硬件设备相结合，创造切实可用的语音接口，还可以在很大程度上提高用户在移动终端、可穿戴、智能家居、智能汽车等智能设备的体验，真正在交互层面实现智能时代的人机结合。<br />
AI同传成为同声翻译的考官<br />
同声传译需求量成倍增加，但是合格的同声传译的数量却增长非常缓慢，据了解，现实市场上能够十句话翻译出十句的同传译员寥寥无几。同时，拥有高级口译资格证书的人并不一定能胜任同声翻译，同声翻译还需要进行专业的技能训练，而有些合格的同声翻译人员也并不一定有口译证书。<br />
目前，我国还没有一个固定的机构来负责同声翻译的相关事宜，也没有一套统一的标准对同声翻译的工作进行考评。<br />
面对这样的困境，我们或许可以在AI同传上开个脑洞。<br />
人们可以利用AI数字化、标准化等特点，以数据库为依托，将AI训练成单一功能性的考核机器，针对不同的应用场景，对同声传译员进行考核和评级，从而规范人才市场。<br />
这里或许可以参考驾驶培训机器人。驾培机器人包含了高精度GPS导航技术、惯性技术和虚拟传感技术、视频检测、数据处理、无线传输、指纹身份识别等高新技术，能够精确记录、判断驾驶人操纵驾驶机动车的真实能力。<br />
同理，AI同传也可以在各种场景里，去观察、判断考生的翻译能力，以及考生对翻译规则的熟悉、理解程度。这个系统可以减少考试员的劳动强度和人为因素，确保考试公平、公正，考核方法科学准确。<br />
简单来讲，我们的目标是通过智能机器，使考核自动化，选拨或者是训练真正的人才，而并非取代人类的翻译能力。<br />
更有意思的是，在考核过程中，AI又能不断吸收新养分，增加口语类文本语料库，何乐而不为呢？（本文首发钛媒体）<br />
【钛媒体作者：智能相对论（微信id:aixdlun），文/颜璇】<br /></p>
		<p><a href="https://wap.ikanchai.com/?action=comment&amp;contentid=207517">共有评论0条</a></p>
	<p>
	<p>相关推荐</p>
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=558376">腾讯AI聊天机器人9月7日公布：官方展示写文案能力，有望命名“混元大模型”</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=242523">腾讯AI Lab正式开源业内最大规模多标签图像数据集</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=220057">腾讯发布首个AI辅诊开放平台</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=207183">首期腾讯AI加速器毕业 9个月项目总估值翻3倍</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=200915">腾讯AI Lab宣布与自然科研合作，成立机器人实验室</a><br />
		</p>
<p><anchor title="返回"><prev/>&lt;返回</anchor><br /><br /><a href="https://wap.ikanchai.com/" title="返回首页">&lt;返回首页</a></p>
<p align="center">Copyright CmsTop.com<br />2026年04月18日 02:57:33</p></card>
</wml>