全球化时代到来,国际社会深度融合,跨国、跨文化的交流成为常态。如何帮助人们突破语言关、实现无障碍交流,成为人工智能企业亟待解决的问题。
谷歌翻译、百度翻译、有道翻译等在线翻译是最常见的智能翻译形态。随着人工智能和大数据的发展,机器翻译有了新的应用形式,功能也更加齐全。
在线翻译是最常见的智能翻译形态
目前,很多翻译类的产品将机器翻译和OCR技术以及语音识别技术进行结合,可以实时地通过摄像头来翻译外文指示牌、菜单、说明书等,也可以结合语音技术进行对话翻译。
数据被誉为人工智能的“石油”,在推进机器翻译实现突破发展的过程中发挥了举足轻重的作用。
数据堂作为全球领先的人工智能数据服务提供商,推出了智能翻译数据解决方案。数据堂目前拥有英韩、英日、中韩、中缅、汉维等一系列句级对齐的双语平行语料,可支持多语言互译。
数据堂的专业数据处理团队,在句法标注、事件标注、语料标注等专业自然语言处理具备丰富的数据经验丰富,支撑智能翻译技术覆盖医疗、外贸、体育、金融、能源、计算机、法律等专业领域,提供更精准更便利的翻译服务。
拍照识别
最为用户熟知的拍照识别产品当属百度识图。植物、动物、名人、品牌等等,百度识图可以“识万物”。
最为用户熟知的拍照识别产品当属百度识图
机器识别万物是数亿级数据训练的结果。数据堂的数据产品能够有效提升拍照识别的准确率。
在数据堂数据产品的支持下,机器不仅可以智能识别当前拍照场景,对拍摄的带文字图片还能够转为文本,满足出国旅游、出国购物、货品信息识别等场景所需。
文本翻译
所谓文本翻译,就是采用NLP技术,将拍照或语音输入的识别文本进行目标语种翻译。
国内多家AI企业都在文本翻译上取得了长足的发展,以OPPO为例,其Color OS系统里的拍照翻译、语音翻译等场景,为用户在跨语言社交上做出了突出的贡献。
OPPO机器翻译成果逐渐应用到各项业务系统中去
数据堂依托自身的数据资源、技术优势以及丰富的数据处理经验,研发了多种语言平行语料数据集。工作人员已经对数据进行了清洗脱敏质检,是优质的文本类数据分析的基础语料库。
自动朗读
Read Aloud,TTSReader等都是常用的文本阅读软件,这些产品能够帮助人们通过语音获取界面信息。
依靠自动朗读,人们可以暂时解放双眼、通过语音获取信息。这对于视障人士尤为重要,这些产品的出现能够帮助视障人士实现更为流畅、友好的人机交互。
数据堂研发的可用于TTS的数据能够助力上述文本阅读软件轻松转换文字成语音,同时支持将选择朗读的语言转换为其它语种语言进行学习。
数据堂在深刻理解智能翻译应用场景的基础上,推出了多种场景化数据。
此外,数据堂为满足客户的个性化需求,还推出了智能翻译数据定制服务,包括自然场景文字图片采集、打印体文字图片采集和不同语种互译。
·自然场景文字图片采集:针对拍照翻译需求,采集菜单、路牌、包装等不同场景下的文字图片,并进行字符级、单词级和行级标注。
·打印体文字图片采集:针对拍照翻译需求,采集PPT、Word文档、手机截屏等不同场景下的文字图片,并进行字符级、单词级和行级标注。
·不同语种互译:针对机器翻译需求,可支持中、英、日、韩、德、法、西、俄、葡等几十种语种的平行语料互译。