找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

标贝科技WAIC2019首秀 强AI语音技术赋能语音交互场景落地

admin 2019-8-29 21:56 46人围观 资讯

8月29日,WAIC2019世界人工智能大会于上海世博中心&上海世博展览馆举办。本届大会以“智联世界 无限可能”为主题,以“高端化、国际化、专业化、市场化、智能化”为特色,吸引全球AI领域科研专家、AI企业厂商、政府机构、媒体及观众亲临现场,就AI技术、产业发展趋势及AI+场景解决方案做深度交流,共同见证AI产业的发展。本届WAIC活动共持续三天,从8月29日开始至8月31日结束。

作为国内领先的人工智能语音合成及数据服务提供商,标贝科技应邀参加,携全线语音合成及数据服务等系列产品亮相大会,包括语音合成互动产品“你说我学”、声音超市、语音合成整体解决方案、TTS评测系统及语音合成、语音识别、计算机视觉及自然语言处理、歌曲等数据服务。标贝拥有行业领先的语音合成技术及深厚AI数据基础,打造具备高品质、多类别、多场景的语音合成方案,以及高质量、安全与专业为特点的数据服务。

本届WACI2019共吸引来自海内外包括微软、亚马逊、IBM及国内BAT、滴滴等400余家知名厂商参加,其中超过一半以上来自AIOT及智能语音领域。标贝科技深耕语音交互与AI数据市场,以“语音连接场景、数据服务技术”为理念,本次首秀亮相WAIC2019国际舞台, 不仅展现自身AI语音技术优势及领先地位,还与全球AI厂商交流意见,推进智能语音在AIOT场景应用落地,迎接万物互联时代的到来。

语音技术助力交互场景落地 标贝打造高品质的语音合成方案

“您好,我是齐天大圣孙悟空!”孙悟空声音在场馆中响起。不过,这可不是孙悟空配音者来到现场,这酷似孙悟空的声音就来自于标贝语音合成互动产品“你说我学”。除了孙悟空特色合成声音外,还包括台湾女声小美、中文儿童冉冉等6个动漫IP形象,滑动到对应人物形象进行点击,说出你想要的话语,人物就会将话语用个性化声音表达出来。

据标贝科技介绍,针对语音合成时间长、成本高、流程复杂等难点,标贝自有创新语音合成系统,打造包括“你说我学”、声音超市、语音合成标准化和需求定制方案等在内的语音方案产品。

例如

1、声音超市“所听即所得”,快速挑选好声音

基于3000余小时自有合成数据库、深度学习技术及高精度数据自动预处理技术优势,标贝打造“声音超市”这一高质量的语音合成产品。

该产品特色在于汇集370余种音库,根据多元音色、类型、明星、动漫IP和优质发音人等类别,通过所听即所得的方式,满足客户快速挑选好声音的需求。

2、语音合成整体解决方案-高品质、多类别、多场景

基于Attention机制等算法+专业的人工数据处理方式,利用储备的优质发音人资源进行专业的TTS音库制作,从而提供一整套的个性化整体解决方案。

包括:多语种语音合成、个性化语音定制、在离线语音合成、多音色合成、本地化部署等,满足各类场景下的语音合成需求。

以上标贝语音产品及解决方案广泛应用于智能客服、机器人、儿童阅读、泛娱乐、新闻、 智能硬件等重要场景中。

事实上,随着人工智能与互联网及终端设备的融合应用,智能语音在人机交互方面扮演重要的重要角色,完整贯穿人与设备、设备与设备之间,而语音合成则是重要的语音信息载体和交互声音的来源。

在标贝展台现场,行业厂商及观众对标贝语音合成技术场景的应用、媲美人声的合成效果及整体解决方案能力,表现出极大的关注与赞赏。一方面,赞叹当前AI语音合成技术效果更接近人声,未来专属个性化声音值得期盼。另一方面,语音交互已出现于以上提到的很多熟悉的场景中,其中语音合成解决了好声音来源的问题,完美交互自然少不了有温度、个性的声音支持。

从本届WAIC参展厂商来看,IOT及智能语音厂商超过一半数量,足以看出语音交互在IOT的重要性。

专注高质量与安全的数据服务 助力AI场景落地

2018年是人工智能商业化的元年,而2019年则是人工智能场景落地的元年。

尽管本届WAIC话题聚焦在无人驾驶、医疗、金融、安防等热门AI落地场景应用,但一切场景落地的前提基础则需要数据支持,为AI产品技术体系的端到端连接与应用提供坚持基础。

标贝科技基于深度学习+高精度预处理技术,以及国际安全体系保障,为客户提供高质量、安全、专业的数据设计、数据采集、数据加工处理、评测分析等服务,业务覆盖语音合成、语音识别、计算机视觉、自然语言处理、歌曲等重要领域,致力于让产品更加智能与精准。

在数据质量方面,经过严格专业的立项设计、数据采集加工处理、语音标注校对及结构处理等系列流程,标贝能够实现快速产出高质量的人工智能数据,与算法、模型、架构等进行深度匹配,形成可进行落地的产品形态。

在安全方面,标贝拥有欧盟GDPR通用数据保护条例、英国ISO信息安全管理体系标准为指导,以数据主体及用户隐私保护为核心,建立数据信息安全体系。实时严格监管数据控制、处理过程,制定数据安全性操作指导规范及应急响应机制,以此保护数据主体及用户数据隐私安全。

基于技术与数据的双重优势加持,标贝科技打造极具规模化的语音库,聚焦明星、动漫IP和优质发音人,满足现有客户的特殊需求;目前语音数据超市规模超10万小时,40种明星IP音库;20种歌曲音库;定制库230种;80种合成自有库,包括中美儿童/男女声、粤语/台语/韩语/日语/方言男女声、智能客服、前端训练集等;50种识别自有库,包括成年人、青少年/儿童、多语种等。

标贝强大AI技术+深厚数据基础做支撑,客户产品如虎添翼,增添强劲势能,完美支持产品落地。

深耕AI语音及数据服务 标贝做AI产业的“水电媒”

过去3年来,标贝科技深耕AI语音交互及数据领域,取得了飞速的发展。

截至目前,标贝已与百度、阿里、腾讯、微软、京东、滴滴、字节跳动、网易、360、三星等国内外百余家企业客户建立合作,服务项目累计超过300项,涵盖汽车、教育、客服、零售、阅读、智能硬件等领域。

标贝科技以“语音连接场景、数据服务技术”为理念,从IP声音布局、AI技术创新、深厚的数据积累这三方面,构建自身竞争优势,做AI产业的“水电媒”,为产业赋能,提供基础设施服务。

一方面,语音交互在终端设备中的角色和作用更加突出,而语音合成则是交互的重要基础。标贝看好智能语音未来发展,通过AI语音技术创新,不断优化语音合成模型,提升语音合成效果质量,以提供广泛多元的语音类型,触达连接更多语音场景,为智能语音交互厂商提供更多的声音可选性。

另一方面,标贝将高质量与安全放在数据服务的第一位,无论是自有语音合成方案、声音超市、语音合成评测系统方面,还是为客户提供数据业务支持。数据已深入贯穿在产品、技术的每一个环节。只有当数据基础足够扎实才能跟技术充分融合,助力AI场景的完美落地。

此外,标贝还源源不断为行业免费开放多种类型的语音数据库,包括中文合成语音数据库10000句,长达12小时,以支持智能科技、生活、娱乐、教育等领域的学术科研、与商业应用。

毫无疑问,AI、互联网与5G的结合,将加快万物互联时代的到来。对产业而言,各方紧密协作,更需要强大且坚实的基础服务。对企业而言,找准自身定位,做好核心业务,为产业发展提供必要基础支持,更是构建有力的竞争优势。

随着AI语音技术不断进步,未来将迎来智能语音市场的真正爆发。标贝将继续深耕语音及数据市场,为AI产业提供基础设施服务,创建强有力的竞争势能。


点赞
我有话说......