lol竞猜平台

陷入困境的AI:打通人类思维,“人机耦合”是大趋所向?

浏览:158 发表时间:2021-09-17 14:47:16

什么是人机耦合?我们可以简单理解为是一种“耦合关系”,是指两个事物之间如果存在一种相互作用、相互影响的关系。在学术界中,人机耦合指的就是一种“控制方法”,而在机械应用领域指的是人与机械的耦合,也因为其阻尼和刚度特性所带来的高鲁棒性,常被用来作为人体外骨骼对应的控制系统,而这个词也成为了这几年科技圈火爆的词汇。

那么“人机耦合”一词是怎么出现的呢?主要原因当然是因为此前某著名翻译公司人工同传“假扮”AI同传,而翻译公司将这种人工写出译文、机器发音的方式称为“人机耦合”,这个词一出现在科技圈,便被各大用户们进行调侃。

AI同传目前暂时出现了解决好AI同传问题,也就标志着这家企业在机器翻译技术已经达到一定高度,解决其他问题也不在话下。如果说这项技术是圣杯,自然少不了挑战者。除了孜孜不倦的独角兽,微软、百度、谷歌等海内外的AI大厂也都在不断攻克这项难题。但今天我们想来谈谈的是,AI同传真正的“人机耦合”到底应该是什么样?它的路在哪?

陷入困境的AI

两年前,某翻译公司被指责在 2018 创新与新兴产业发展国际会议上所使用的“智能翻译”系统造假,其显示的中文翻译,并不是根据其传感器采集的声音文件所呼应的,而是后台两位同传译员临场实时翻译后,再由机器读出来的。

微博上一位 ID 叫做 @ 同声翻译靳萌 的用户发微博称,“之前有翻译公司找过我翻译会议,说甲方给的条件是不能说出是真人在翻译,否则就不要接。”

对于会议在进行过程中,翻译公司提供了何种技术完成工作,外界其实并无法进一步确定,但不可否认的是,翻译公司若是在会议当时未说明是使用了其公司版本的“人机耦合”完成工作,从而让人产生一种“翻译和转写都是由其软件独自完成”的认知,这就确实产生了很大的争议。

当前AI是陷入了一定困境的,目前大多数AI同传,要么是等待一个完整的句子说完后,再进行翻译,要么是根据当前识别结果进行翻译,然后随着识别字数的增加,不断修正结果。

可我们语言同传,不就是为了和整场对话同步获得信息吗?想象一下,在重要商务场合中你和合作伙伴谈笑风生,然而合作伙伴说“前门楼子”AI同传却告诉你“胯骨轴子”……

总之由于应用场景相对苛刻,AI同传的技术迟迟都没能达到应用条件。

AI与人工翻译的区别

人类译员区分与AI的关键,就是在进行同传翻译时往往会先做大量的准备工作,了解应用领域的专业术语,本质上是对自己的词汇库进行一个“收敛”,又对该专业领域的用词进行学,减少同音近义、一词多义时发生翻译错误的可能。

建立在准备的基础上,译员在进行翻译时会有一定的预测性,例如“The flowers she gave me are beautiful”这句话的翻译中,看到“Theflowers”这个单词,译员就可以结合上下文和语境去判断花一定是别人赠送来的,所以可以同步翻译出“她送给我的花”。这样一来就可以赶在句子说完前就进行翻译,尽可能的保证即时性。

可即便如此,人工同声传译也并不是完美的。由于信息量巨大,译员只能在保证速度的前提下牺牲一部分质量。据了解,同传译员的译出率仅有60-70%左右,即讲话人讲了100个句子,仅有60-70个句子的信息被完整传递给听众。同时由于需要高度精神集中,译员往往需要每15-20分钟就需要换班休息。

所以AI在这方面可以为人类译员起到协助的作用。

人类在工作时体现的智慧和优势,往往会被人工智能学习和利用。我们可以发现,很多机器翻译技术已经开始学会利用“背景知识”和“预测”这两个关键逻辑了。从背景知识的层面来讲,人类之所以能够分辨同音近音字,是因为对于语境和背景知识有着充足的了解,把不符合当前词汇库的同音词“剔除”了。

所以现在有一些机器翻译技术开始应用上了这样的解决方案:提升容错率,忽略语音-文字转码阶段的错误,进而去提升文字翻译阶段的正确率。

那么AI该如何向人类学习?

像Facebook推出的无监督机器翻译,就是对语言模型进行局部编辑,圈定一个可嵌入的单词范围,再为不同的单词排序打分,流畅的句子得分要高于语法错误和不通顺的句子。如果应用在AI同传中,也可以在演讲者的句子完成前以更快的速度进行翻译。

百度也推出了一种名为“wait-k words”的技术,即等待讲话后的第k个词开始翻译,通过对讲话者的语言风格数据进行训练,实现预测能力。同时还可以根据不同语种之间的差异性和不同场景的需求程度来调整K值。

去年谷歌推出的Transformer则是一个基于自注意力机制的全新神经网络架构,也是忽略单词在句子中的先后位置,而句子中所有单词之间的关系直接进行建模。所以一个单词先出现还是后出现,对于自然语言处理来说影响开始没那么大了。

总之,这些模仿人类处理问题方式的技术突破才是真的“人机耦合”。

AI同传如何破局?

AI若想破局,最简单的方法便是将机器思维与人类思维的打通,这才是AI应用的黄金大门。

其实我们能够发现,现在机器同传解决方案的发展方向,体现出了一种AI技术应用的有趣逻辑,即把机器思维和人类思维一起融入技术应用。

像在提升语音容错率上,就是一种典型的机器思维。如果把解决问题分两步,第一步是语音-文字,第二步是文字-翻译。数学老师一定会告诉你“一步错、步步错”,可在机器思维中却能实现“一步错、结果对”,即使语音识别中错了,机器翻译的结果仍然是正确的。

而在预测方面,就是典型的人类思维了,结合对于事物的整体理解甚至整个世界观,对于缺失的信息进行预测——用我们人类的话说,就是“直觉”。而当机器也逐渐找到利用直觉的方式,它们所能解决的问题才更迈上了一个台阶。

有了预测能力,才能在不同语序的语种中自我生成正确的句子。毕竟我们所处的世界不是棋盘也不是电子游戏,缺乏明确的规则,更多时候我们是在信息和规则双双不透明的前提下去解决问题。

其实在今天的AI应用上,最重要的就是人与AI的协作性,不仅仅是日常应用方面的协作,更多的是研发思维上的协作。有时能理解机器思维的差异性,才能真正找到适合机器的问题解决方案,而让机器能够学会人类思维,才能让机器解决问题的方式更加配适现实世界。

就像自动驾驶的安全问题一样,有时在交通标识上贴一张小小的贴纸,就能彻底扰乱机器的视觉系统。所以对于自动驾驶来说,更高效和安全的方法并不是像人类一样“看到”交通标识,而是在高精地图上提前标注好交通标识的位置。对人类与机器的感知方式进行互通和融合,帮助我们打开了很多AI产业应用的黄金大门。

有趣的是,这两种思维之间的差异和融合,其实和语言之间的翻译还有点接近。语法有再多差异,彼此理解了,总能一起解决问题。

人机耦合,指的绝不仅仅是人类与AI有着多么明确的分工,AI生产、人类包装这种行为在几十年前就已经出现并且沿用至今了,绝不是什么值得宣扬的事。

两种思维的交互,才能称之为真正的“耦合”。


陷入困境的AI:打通人类思维,“人机耦合”是大趋所向?
什么是人机耦合?我们可以简单理解为是一种“耦合关系”,是指两个事物之间如果存在一种相互作用、相互影响的关系。在学术界中,人机耦合指的就是一种“控制方法”,而在机械应用领域指的是人与机械的耦合,也因为其阻尼和刚度特性所带来的高鲁棒性,常被用来作为人体外骨骼对应的控制系统,而这个词也成为了这几年科技圈火爆的词汇。
长按图片保存/分享

lol竞猜平台©珠海大横琴科技发展有限公司