新闻本地快讯旅游数码房产健康农业娱乐军事汽车民生美食生活两性财经国际社会科技美女
您的位置:中华湖南网 > 生活 > 文章
2019-04-14 来源:未知 次浏览
数字时代 被改变的生活和生意





4月12日,为期三天的2019中国数字阅读大会在杭州西湖文体中心开幕,本届大会的主题是:“e阅读,让生活更美好。”

这两天的中国数字阅读大会,无论是现场的体验式展示,还是大咖们在人工智能峰会上的畅想,无一不展现了已然或即将到来的美好生活。

当然,美好生活的降临,也意味着行业挑战的降临。面对飞速进步的技术、多变的阅读口味、更为年轻化的受众群体、群强并起的产业环境,数字阅读与传统出版的从业者都在思考。

即使你没有尝试过有声阅读,但在开车的时候总听到过林志玲、王宝强们为你导航的声音。

不难想象——之前,为了训练语音引擎,需要把声音的主人请到录音棚里去录音,再生成音库。但今天,这样繁琐的流程不需要了。

人工智能应用于阅读行业,最典型最直接的方式就是让所有的书都可以听。声音是人机交互当中的一个最重要的环节,是未来的一把钥匙。因此,在4月12日下午举行的人工智能峰会上,有一个关键词就是“声音”,围绕它衍生了关于数字阅读的无限可能。

你听到的明星播报,都是被复刻的

如今,每个人的声音都在跟使用的APP、手机终端、智能硬件——包括音箱,发生着语音方面的交互,这极大地提升了语音采集的手段。咪咕数字传媒有限公司VP王丛刚说,随着5G技术的发展,采集声音的速度也更为快捷。当然,不能忽略的是,训练模型的计算机的运算能力在这十年之内也取得了质的飞跃。

那么,被采集的声音到了哪里?

它们会被收集到类似“灵犀云”(咪咕的智能语音能力平台)这样的语音智能平台。随后,技术人员对它们进行后期的加工处理。这些平台可以提供语音识别、语音转写、语音翻译、语音合成,以及基于语音能力之后的应用场景。

灵犀云对接了中国移动、咪咕公司后面的视频内容、音频内容。基于这些内容,通过语音方式跟平台进行交互的时候,会根据受众的不同,进行定向推送。

将来,每一位用户都可以在这类平台上制作自己的音库。这些个性化的音库可以用来干嘛?

王丛刚很喜欢纳兰词:“但看纳兰词的时候,我在想,如果纳兰的声音被留存下来。那么,当我们听到纳兰性德用深情的声音在朗读:点滴芭蕉心欲碎,声声催忆当初。欲眠还展旧时书。鸳鸯小字,犹记手生疏。这个时候,你读他的词集就是一种别样的意味。”

事实上,如果纳兰活在今天,这是一个轻易实现的愿望。

科大讯飞消费者BG智能助手业务部总经理马啸就展示了跟财经作家吴晓波老师合作的有声书。

“我们当然知道吴晓波老师没有时间去把它一段一段录下来,但是人工智能可以。”马啸说,知名的主播、演员的声音都复刻下来,让它变成永久的财富,“它可以永久地为我们去播报,即使本人已经离开了这个世界,依然可以去继续他的工作,这一点我觉得是非常有意思的一件事情,相信未来我们每个人都可以把自己的声音留给这个世界。”

也许手机将变得不那么重要了

在捷波朗中国区商务总监陈栩斌的预计中,2019年的后半程,全球会有超过25亿的智能手机,其中超过一半的人会使用语音助手。在他看来,这是人机交互的必然规律——从电脑产生至今,人们在不断解放着自己的双手:从两只手到一只手到一根手指头。

“今天,我们完全可以不用我们的双手,我们全部都可以用我们的语音来跟机器来做交互,只要它精准识别到你的声音的话。”陈栩斌说。