相关新闻
-
家具也华丽转身 互联网平台背后的故事
2026-04-18 09:17疫情当前,就在很多家居企业一筹莫展,甚至连正常经营都无法开展的时候,有着“互联网木匠“之称的丽维家推出了不一样的家居互联网网站制作“营销策略”。以往的家居营销活动,要么放在线下卖场门店,要么
-
工业4.0遇到边缘计算 智能制造的新机遇
2026-04-16 12:58'工业4.0'被看作是以智能制造为主导的“第四次工业革命”。它的理念源自信息技术与工业技术的融合,通过信息物理系统(CPS)实现产品全生命周期中各制造单元间相互独立地自动交换信息、触发动作和
-
乐玩LEWIN官方网站签约旭阳集团小程序开发——助力二十六周年司庆落实、落细!
2026-04-12 08:23中国旭阳集团有限公司创立二十多年来,经历了由单一公司到多家公司、由区域性公司到全国性公司的发展。我们秉持'垂直一体化'的管理模式、'纵向一体化'的发展模式,坚持具有旭阳特色的战略目标,持续创
-
乐玩LEWIN官方网站为您介绍APP原生开发和APP混合开发各自的优缺点
2026-04-03 19:23目前市场上主流的APP有三种:原生APP、WebAPP(HTML5)和混合APP,对应的定制开发是原生开发、H5开发和混合开发。那么这三种开发模式有什么区别呢?让我们分别区分和比较三者的优缺
-
乐玩LEWIN官方网站小编带你了解响应式网站开发和PC手机网站的区别
2026-04-02 20:14手机端和PC端分开做,可以设计成两种不同的风格,根据企业的定位,做出不一样的感觉,而且后台的数据库还是可以用一个数据库。对于PC端来说兼容性会比较与普通网站建设要好。只是做双端的话所需的时间
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。
18998542236
现在就想找顾问聊聊立即咨询