传神语联何恩培:别着急唱衰机器翻译 未来将是人机共译时代-程序员宅基地

640?wx_fmt=gif&wxfrom=5&wx_lazy=1


机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神“人机共译”正在做的事情。


前几天,腾讯同传作为机器翻译产品的代表,成为了博鳌论坛开幕式及部分核心论坛的同声传译;原本想着这次有机会再国际级会议的舞台上一展风采,没想到却出了洋相,接连出现了多次低级失误,似乎也印证了腾讯CEO马化腾在朋友圈中说的那句:“新尝试,多包涵。”


于是,人工智能将很快取代翻译人员的呼声似乎弱了下去,取而代之的则是“机器翻译就是个花架子”、“这届机器翻译不行”之类的言论。人们对于机器翻译的膜拜,仿佛在一夜之间出现了反转,从追捧变成了唱衰。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


对此,传神语联网网络科技股份有限公司董事长、CEO何恩培有着自己的看法:“百度、腾讯、科大讯飞等正在做的机器翻译方面的努力,值得行业尊重和正确对待,这是值得肯定的努力,是一次具有划时代意义的尝试。‘腾讯们’的尝试更是一种对市场的有益教育:翻译距离人很近了,不再遥不可及,跨境游、国际商务等涉及大众息息相关的翻译需求近在眼前。”


同时,何恩培也强调:由于人工智能目前尚未成熟,跟人类智慧产物——语言的结合只是一个过程,而且永远并不能完全替代人类翻译,不要过度炒作过度消费。积极拥抱AI,更应该客观的对待。


640?wx_fmt=jpeg

传神语联网网络科技股份有限公司董事长、CEO何恩培


翻译将是人类智慧的高地



在采访何恩培之前,笔者一直认为,人工智能或许在很多领域都可以超越人类,但唯独无法在想象力方面超越人类。不过,何恩培给出了一个更加具象化的答案:翻译是人类真正的智慧的高地,语言文字因人的存在而存在,语言文字是人类“全息智慧”的“一维表达”,从长远看来,AI应该能够超越人类的智力,但人的智慧却是难以逾越的。


为什么这么说呢?何恩培认为,这还要从人类语言的特性说起。首先,语言具有种族性,不同的语言是在不同的文化背景下产生的,它是不同民族对待事情和看待事情的方法。以沙发为例,这是欧洲人对待坐卧用具的称呼,具有种族的独特性;在中国的字典里并没有相对应的词,所以音译,而不是翻译为某种椅子。


其次,语言的种族性是由文化背景支撑的,没有文化支撑语言是不可能生存下来的。世界上曾经有一种世界语,是人类渴望无障碍沟通人造的一种统一语言,一度推广达到3000万人,但现在使用者可能不到两千人,这种不是基于文化底蕴的语言是不可能生存下去的。


第三,语言是一群人的共识,具有不可论证性和不可推导性,也就是说,某个东西的称呼本质其实是大家的约定俗成,这一点在方言上表现尤为明显。比如,“知不道”、“去两天”等,它们的意思分别是“不知道”和“去几天”,对于人工智能而言,它会认为“知不道”的语序有误,也会认为“去两天”就是指两天,而不会认为这是一个约数。共识随着时间变化而偶然发生,机器短时间内不可能更精准表达出来。


第四,围棋之所以可以被AI迅速超越,是因为围棋本身是有固定的规则,有确定的输赢结果,所以AI可以自我对局不分昼夜的训练。但语言不同,不但具有种族性、不可论证性和不可推导性,而且语言表达不具有唯一性,几乎不能象ALPHA那样在自我生成棋局、自我对局训练中提升。我看到有些报道在探索翻译的“自我对局训练”,个人观点认为,那最多是产生一种“机器方言”,如同一个封闭部落自我使用的方言,不可能达到符合现代社会人类需要的翻译水平。


第五,也是最重要的一点,机器基于文字的“一维训练”无法取代人脑“全息信息”之间的映射。人脑的全息信息是来自眼耳鼻口舌身意的全部信息的综合,是基于共同文化经历体验和共识而形成的。语言文字只是人脑全息信息的一维表达,它依赖人脑全息信息映射才能真正被理解,两种文字的映射理解是以两种文字背后的全息信息为背景的。所以,依靠一维语言文字的大量数据训练出来的机器翻译机器人,基本只能机械的“映射”难以全面实现全息转换,自然无法将原文真正意义转换到另外一种语言。以某一个翻译现场为例,译者会根据演讲人的情绪、语气、神态,以及文化背景等进行全息场景的合成,再用语言表达出来,但机器却不能做到这一点。因此语言文字和翻译都将因人的存在而存在,是人类智慧的表达。从长远看来,人工智能能够超越人类的智力,但人的智慧却是难以逾越的。



640?wx_fmt=jpeg


慎言替代 人机共译时代将成为未来



近两年的人工智能热潮,让“人工智能威胁论”一时间甚嚣尘上,许多圈内人士因人工智能的出现显得恐慌和无所适从。在翻译领域,“人工智能代替人类译者”的呼声也很高。


在笔者看来,人工智能是建立在大数据分析的专业和能力上,是一个具有理解、推理和学习能力的系统;但它并不会取代人类的专业能力,只是对人类专业能力的增强。机器翻译也是如此,人工智能的应用同样也是对人类译者能力的增强。


何恩培也持有类似的观点:人工智能可以在短时间内处理数以亿计的语料数据,在算法、数据、记录等方面都能够超越人类译者,从长远来看,人工智能在智力上可以全面超越人类;但人类有顿悟的时候,机器则没有,人工智能在智慧上很难超越人类。因此,人工智能是相互协作关系而不是对立关系,机器翻译替代简单劳动,智慧劳动人来做,这也是由译者的特殊性决定的。


比如,传神公司给做网文翻译的译者做提升培训,开班时有一个学生的翻译水平是团队最差的,但经过一周的启发、培训和演练,成为团队第三名。可以想象一周时间内有限的素材培训,对AI来说,可能还不够“塞牙缝”,更谈不上质量进步。但因为人的一周培训是“全息训练”,而AI只是“一维训练”,这是至今人类独一无二的能力。


640?wx_fmt=jpeg


目前主流的机器翻译仍处在弱人工智能阶段,即便在智力水平上要想超越人类也需要一定的时间。在这种情况下,何恩培提醒,“AI威胁” 论虽然唤醒人类重视人工智能翻译,但也给翻译行业造成困扰,使得学翻译的人为自己前途担忧,这必将导致翻译人才缺失,而翻译其实不可能被人工智能完全替代,这就会为人类文明传播速度和传播效果带来不利影响。


希望译者应该明白一个道理,机器翻译出来了,不是人没事干了,而是“搬砖”的事情不用人干了,那些需要人才能翻译好的信息还在那里。只是如果人类译者只想去干搬砖的简单底端活儿赚钱,那就是要和机器抢工作,那就是找死。


在人工智能尚未完全智慧化并被人类自由支配的前提下,过度炒作人工智能,是极具破坏性的文明自毁行为。”何恩培强调。


相反,如果人类能够合理运用人工智能,就可以更加快速地完成低端翻译任务,解放翻译生产力。人类译者可以将更多的精力放在创造性的高端翻译上,把简单的翻译交给机器翻译去做。据了解,在过去1600年间,人类的翻译能力只提升了2~3倍,但仅仅过去20年,人类社会的信息量就增长了1000倍,如果不借助人工智能的帮助,翻译工作将变得越来越难以为继。


有统计显示,中国解放以来引进的国外图书大概17万种,而全世界畅销的英文图书大概324万种,大约95%的图书没有进入中国。不是中国读者不需要,而是很多外文书看不懂看不到。由此可见,信息量海量是可见的事实,这直接导致翻译需求更加多样化和复杂,翻译效率和质量需要同步提升。因此,行业更应合理运用AI,快速完成低端翻译任务,解放翻译生产力,把译者精力放在高级翻译领域中,创造更大价值。不仅如此,如果有机器翻译的帮助,不同语言、不同种族之间的信息交流效率就会大大提升,人类文明的进程甚至都会因此加速。


就像不久前谷歌AI产品负责人Apoorv Saxena所说:“我们的AI技术发展很快。很多时候,我们机器翻译翻对了,但是,更多时候,我们翻错了。”


因此,人工智能和人类译者之间是相互协作的关系而不是对立关系。“机器翻译替代简单劳动,复杂劳动、智慧劳动人来做,这就是传神‘人机共译’正在做的事情。”何恩培表示。


利用技术盘活翻译资源 传神要让人类没有语言障碍



对于人类译者来说,威胁并不仅来自机器翻译。一直以来,人类译者的劳动和回报都并不匹配,一方面很多译者所从事的都是简单、重复的翻译工作,翻译资源浪费严重且很容易被机器翻译替代;另一方面,译者收集资料的时间很长,但客户只按照翻译字数算钱。


据何恩培介绍,传统的翻译模式具有两大特点:


1、专家模式,这种模式的核心是专家的经验,专家的信息处理效率较低,每天只有2万字左右;不仅如此,专家在持续工作强度下派稿准确率只有70%左右,而人工智能的准确率很容易达到90%以上。因此人工智能不仅仅在翻译过程起作用,在整个翻译流程都会有很大价值。


2、来料加工模式,这种模式就是客户给什么资料,译者就翻译什么。没有资料来译者就没事干,这也是为什么翻译一直没有成为产业的原因,缺乏和技术、产品及场景化需求的结合。


为了推动传统翻译行业的变革,传神打造了语联网生态,从机器翻译和人工译者两个角度出发,通过搭建平台整合世界上所有的译者和机器翻译,输出标准产能给客户,真正激活传统翻译行业。


目前,累计申请和获得的专利近300项、软件著作权超百项。传神语联网已经形成大型企业嵌入式语言服务、中小企业按需语言服务、云服务接入、移动互联网应用等多种业务模式,满足不同场景不同类型用户的无障碍沟通需求,已经覆盖国际工程、装备制造、影视传媒、情报资讯、跨境电商、文化旅游、服务外包、会议会展等五十多个领域。比如,一个制造行业的翻译需求可以通过语联网的大数据分析等快速找到相匹配的译者,从而提升翻译的效率和质量。


据了解,基于语联网平台,传神已经架构建成了一个产业链,Transnbox、小尾巴、语翼、那啥,涉外政警务等多个示范运用正像水和电一样,更多地融入人们的工作与生活中,从客户的产能筛选、识别、应用场景,到最后的客户,形成一个基础生态,将来在上面可以产生一万个上万活跃的应用和接入,每一个都可以通过母语设施去解决沟通问题。


“传神者,必以形。形与心、手相凑而相忘,神之所托也。”明朝董其昌所说的这句话同样形象地表达出了语言的魅力所在。而何恩培的传神就是希望实现语言的“神之所托”,让所有的译者都能够享受技术进步带来的价值,做一个快乐的“传神者”;并让人类沟通没有语言障碍,让人们如同水电一样方便地使用语言服务,用母语沟通世界。


640?wx_fmt=gif
长按指纹  识别二维码   关注我



欢迎讨论与转载,转载请注明作者与出处。

“常言道”已入住今日头条、百度百家、一点资讯、搜狐新闻、网易新闻、凤凰新闻、腾讯新闻、新浪新闻、界面、UC、号外等多个媒体平台。有合作意向请发送邮件至[email protected]



版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/M59Ht9D0J/article/details/79988243

智能推荐

C# c++ Json序列化与反序列_c++json序列化与反序列化-程序员宅基地

文章浏览阅读231次。C# 序列化与反序列化, 读文件和写到文件_c++json序列化与反序列化

智能制造控制中的AI研究进展-程序员宅基地

文章浏览阅读446次,点赞14次,收藏14次。1.背景介绍智能制造控制是现代制造业中的一个重要领域,它涉及到制造过程中的自动化、智能化和优化。随着计算能力的提高和数据技术的发展,人工智能(AI)技术在智能制造控制中的应用也逐渐成为主流。本文将从背景、核心概念、算法原理、代码实例、未来趋势等多个方面进行深入探讨,以帮助读者更好地理解AI在智能制造控制中的应用和研究进展。1.1 背景介绍智能制造控制是制造业中的一个重要领域,涉及到制造...

2018美亚杯个人赛刷题-程序员宅基地

文章浏览阅读5.4k次,点赞6次,收藏27次。文章目录写在前面题目1.E2.C3.B -D-4.C -E-5.C6. D7.D8. A9.A10.C11.E12.D13.D14.A15.D16.E17.D18.A19. B20.C21.E22.D23.A24.C25.C26.D27.D28.C29.D30.D31.C32.E33.D34.B -C-35. -E-36.A37.A38.D39.D -C-40.B41.C42.E -D-43.C44.B45.A46.C47.E48.B49.D50.CPS写在前面这是美亚杯2018个人赛的个人_2018美亚杯个人赛

ECS框架学习(Entitas)入门_ecs框架 entitas-程序员宅基地

文章浏览阅读6.2k次。公司要求使用ECS框架经行开发,没办法只能自己学习了。记录一下学习过程。框架的含义可以去其他地方查看,我这里写一点我的理解(新人,不对请谅解)。ECS即Entity-Component-System(实体-组件-系统) 的缩写。它做到了行为、数据分开,Component存数据。Entity用来就是由各个Component组成。System用来经行他们中间的通信。对于网上或者官方说速度更快、更容..._ecs框架 entitas

vars()函数用法-程序员宅基地

文章浏览阅读1.5w次,点赞10次,收藏35次。python内置函数。vars() 函数返回对象object的属性和属性值的字典对象。vars([对象])当函数不接收参数时,其功能和locals函数一样,返回当前作用域内的局部变量。当函数接收一个参数时,参数可以是模块、类、类实例,或者定义了__dict__属性的对象。#作用于模块>>> import time>&a_vars()

vue中实现文字超出横向滚动_el-pagination超出屏幕-程序员宅基地

文章浏览阅读4.3k次,点赞3次,收藏14次。vue中实现文字超出横向滚动marquee组件<template> <div class="marquee-wrap" ref="marquee-wrap"> <div class="scroll" ref="scroll"> <p class="marquee">{{text}}</p> <p class="copy" ref="copy"></p> </div>_el-pagination超出屏幕

随便推点

Qt笔记_正则表达式(regular expression)_qt regex-程序员宅基地

文章浏览阅读9.2k次,点赞4次,收藏28次。手册里使用的词汇是 regexp 优点: 方便地完成字符串的一些处理操作,例如验证、查找、替换和分割等。类名称为QRegExp类,是基于Perl的正则表达式语言,支持Unicode。头文件:#include < QRegExp >//(尖括号中的空格是为了适应markdown而添加的,编程时不使用多余的空格)qmake:QT += core帮助文档中指出:All functions in_qt regex

系统设计与分析homework5_sdlc的第一阶段是分析。写一个简单的报告,包括: 分析新系统需要解决的问题 l可行-程序员宅基地

文章浏览阅读151次。一、根据订旅馆建模文档,Asg-RH.pdf:1. 绘制用例图模型(到子用例)给出 make reservation 用例的活动图2、根据课程练习“投递员使用投递箱给收件人快递包裹”的业务场景分别用多泳道图建模三个场景的业务过程场景一x科技公司发明了投递柜,它们自建了投递柜以及远程控制系统。注册的投递员在推广期免费使用投递柜。由于缺乏资源,仅能使用y移动平台向客户发送短信通知。..._sdlc的第一阶段是分析。写一个简单的报告,包括: 分析新系统需要解决的问题 l可行

LayUI的后台管理模板_layui后端模板-程序员宅基地

文章浏览阅读8k次,点赞2次,收藏18次。  以前没有做网页开发不知道的内容太多了,现在开始做了这一块,发现内容真多。  星期五接到一个资产核查的任务,时间紧,我对网页这一块的内容还不是很熟练,有些着急,在网上一搜,LayUI的模板,有很多好评和讲解,拿来一用,感觉很不错。  这个后台系统可以很快上手,界面部分不用操心太多,很多页面有实例,略微改动就可以直接使用。  写程序界面是个大问题,这下省事多了,虽然后期项目使用LayUI比较少,但做一些中小型的项目真的是很好的选择,最主要的就是快。..._layui后端模板

常见的数组概念-程序员宅基地

文章浏览阅读90次。常见数组_常见的数组

如何从零开始实现TDOA技术的 UWB 精确定位系统(1)_uwb_tdoa-程序员宅基地

文章浏览阅读1.1k次,点赞28次,收藏24次。这是一个系列文章,将向你介绍如何从零开始实现一个使用TDOA技术的 UWB 精确定位系统。重要提示劝退说明Q:做这个定位系统需要基础么?A:文章不是写给小白看的,需要有电子技术和软件编程的基础Q:你的这些硬件/软件是开源的吗?A:不是开源的。这一系列文章是授人以“渔”,而不是授人以“鱼”。文章中我会介绍怎么实现UWB定位系统,告诉你如何克服难点,但不会直接把PCB的Gerber文件给你去做板子,不会把软件的源代码给你,不会把编译好的固件给你。我不会给你任何直接的结果,我只是告诉你方法。_uwb_tdoa

各种常见报错汇总_vs未经处理的异常怎么处理-程序员宅基地

文章浏览阅读10w+次,点赞2次,收藏13次。Visual Studio解决办法:报错原因:堆栈溢出,可能是定义的某个变量太大而没有修改栈保留大小所至。本人的问题是用ege画图的时候定义的地图面积太大导致。解决方法:项目→属性→链接器→系统→堆栈保留大小→设置成一个比较大的数并应用。即可完美解决,如果还没解决可能是设置的不够大。其实真正应该修改的是你的代码,问题就出现在为什么会有栈溢出问题,很简单,显然是数组或者开辟的指针空间太大!所以,解决办法就是将大数组定义在main()外部当作全局变量,全局变量放在数据区,空间足够使用。或者写在mai_vs未经处理的异常怎么处理