强噪音环境音频降噪模块声学降噪技术
【2012我爱方案秀开发者论坛精彩笔录】

发布时间:2012-04-28 阅读量:2360 来源: 发布人:

中心议题:
    *  强噪音环境音频降噪模块声学降噪技术


本文整理自华达管理有限公司在2012我爱方案秀开发者论坛上的演讲。

注:请下载演讲PPT,通过音频,更为直接的了解降噪效果。
强噪音环境音频降噪模块 声学降噪技术
http://www.52solution.com/data/datainfo/id/6508

我们这个公司主要是做技术研究的,主要是聚焦在声学这个数理方面。我们是个高科技的公司,有一些香港本地的大学,特别是理工大学是我们的技术伙伴,如我们有一些技术难题,可以跟他们去交流,他们也会给出一些建议。为什么我们要讲到声学降噪这个问题呢?很简单,只要哪里有通信,哪里就有噪声,这是不可避免的。降噪就是一个必须要解决的问题,不管你打电话,你做音视频,做其他的都会噪声,关键要有不同的解决方案。我们在这个方面已经做了将近20年了,我们涉及到噪声,最后觉得这是一个必须解决的问题,只要有通信,都要解决这个问题。

还有一个重要原因是这个声音是下一代的OS,我们觉得是关键技术。为什么?你看苹果,苹果现在有个语音识别的。其实我们总结一下,关于所有这个,因为我们将来技术的发展和计算机的发展肯定是这样的,第一代计算机我不知道大家知不知道,第一代计算机是光电驱动,可能现在没什么人用过那种计算机了,我们那个年代我们用过。第二代的很多人可能用过了,只要做开发的,那就是DOS和unix。到第三代了,就是大家所有的人都用了,那就是Windows操作系统,就是Windows操作系统。苹果现在也是,但它为什么要做语音识别呢?我们用写个字、干什么的来跟你交流,那不方便,我们用讲话的形式,那也就是下一代要驱动的,也就是用语音的形式来驱动,是我们最自然的交流工具。

再下一代还有什么?有没有谁知道的?再下一代的驱动方式,操作系统你觉得会是什么?有没有人能知道?看来没有,我说一下,心智的,现在人家在美国已经做了,它做得不太好。它现在有一个玩具那样的东西,它戴在这儿,它现在是一个游戏程序,还没到那个程度,而且还要弄点什么东西让你接触的更好,将来肯定是不会这样的,这是方向。像语音识别说了多少年?几十年了,现在是不是开始慢慢的走近生活了?你要敢想,才有成果。

为什么我们要做降噪?说是一个挑战性的课题,这个是叫强噪音的,其实好多人说降噪的方案多的去了,一看满世界都是,为什么?但是强噪音的环境那就不一样了,怎么说呢?比如你在距离比较远的,噪声环境比较强的,比如说地铁、车站、机场、矿井、火场,比如你做消防的在火场,然后是战场,餐厅,你将来做通信的话,如果用这个在做通信的时候,现在在全球来说就是一个很有挑战性的,能做到什么程度的,要看你的环境和你的条件,还有你的通道。这个远距离的,比如像我们现在说的做音频的监控,现在的监控基本上都是视频的,实际上看起来就叫无声电影,但是将来肯定是有声电话,当然在保护大众的隐私的情况下会这样,还有会议电话,还有智能电视,这是将来的方向。

我们知道在做智能电视的时候,实际上就是一个比较好的视频会议电话系统。你要是说polycom一套就是十好几万,那不是跟你说笑的,稍微差一点的意大利的那个,那也是好几万。国内有没有呢?现在还做不到。为什么?音频那个解决不了,在你的客厅里还有其他噪声,距离远,你自己放大的那个放大器如果有点问题,都必须解决。

将来我就希望不要让外国人都占了我们的市场,我们自己也能做一个,所以说我们要解决这个挑战。还有像机器人,现在的机器人都是拿着,你说你跟别人说话的时候,在家里边谁有拿两个电话自己在那儿说话的呢?也要解决这个问题。还有远距离去方便性的提取,相当于手电筒一样,旁边的就旁边的降低了,我要收的这个放增强了,这样提高我们的音质。

很多朋友想知道你是怎么做的?我们给你们讲一个原理性的东西。在做降噪的时候,比如说像国内也有做的,像比亚迪也做IC,也做降噪的,它是在模拟的那个范围,是做时序的,那个是比较简单的,就是有一个门槛,最后破了这个就算影音,低过这个就当是噪声,就把它掐掉或者拉低,这种属于噪声比较弱的时候可以这么做,但强的时候是不行的。


 


再一个在单通道做的比较好的,一定要用平面的那个来做,像滤波的方式、均衡器的方式。但是均衡器是手动的,我们想做的是不要手动,让计算机去做,要不然你还做技术干嘛,噪声变了,让计算机做一个自适应,跟着它变。这个道理是说语音和噪声是一个比较,你知道了噪声的频幅和语音的频幅之后,你就把语音那部分提升,把噪声那部分摁下来,这就是我们做不到的。

在这个上面,我跟你说是全球最有挑战性的,你看像系统制造商Apple、Google、Samsung、Polycom它们在降噪上花了很大的力气来做这个,要么它自己不做,它一定是收购别人的那个方案公司,像Siri语音识别,它自己没做,它就是收购了一家叫Siri的公司。还有像Polycom,它在比较有名的公司里面用的比较贵的那个电话会议系统一定是像八爪鱼,还有其他的,还有很多IC制造商,但是它们也各有所长,我们主要是做有距离的,这个是比较有挑战性的,我们在这个方面还是做了可以不谦虚的说是跟它们远距离单声道的降噪是有可比性,甚至有时候不客气的,比其他的可能还做的好点。然后再就是MIC制造商。

这么多外国的公司都在做这个。为什么?就是这块市场将来是很大的,还有一些方案商。为什么要用我们的呢?就是我们的降噪技术为了让客户用起来比较简单,把我们的降噪技术和DSP模块放进去,然后做了这个之后,就不是做一个产品或做某一个东西,就可以带出一类的方案。那一类是什么方案呢?就是像我刚才说的助听器,电话会议系统等。这两天很多人问我,说你们这个价钱太贵了,我说现在没办法,用DSP的方案肯定成本会高的。

在我们这个方案里一般用行业的会比较好一点,当然说是高端的消费电子产品也会好一点。

第一,我们可以给客户定制。我在这个行业做了将近20年,客户有特殊要求,我们可以跟他定,说你有什么特殊的环境,怎么用,我们可以帮你做。但一般的别人大厂商是不会这么做的,还有我们是用的数字解决方案,模拟的那个实用方法。你看的是一个DSP,最后你用的时候,实际上加上电源等就可以了,跟用一个有源的器件差不多的,模拟器件是这样,这样为了让客户比较简单。

第二,我们可以帮客户升级。比如说你有了什么新的要求,我们可以马上跟你定制化。

现在我们听一下这个效果,先听一下,这个就是在没有降噪之前的,我们再听听降噪之后的,在噪声比较低的情况下你听听,再听,噪声基本上就没了。一般打电话人家可以容忍,你说助听器的话他就不能容忍了或长期听这种噪声的,一定会对你的耳朵有影响。

这个就是在车里面的,这个是富豪车里面录的,它有呜呜呜的声音,噪音都有拉低了。再看下一个,这个就是我们跟国外的,我们不好说哪家,他做了类似这样的模块,我们的呢?就说这是国外的已经成产品卖出去的,我们当时也成产品开始量产,也开始做了,先听听他们真实环境是怎么回事。这就比较吵,在工厂里面,这个是国外的他们做的降噪25%的那个,看看我们降噪25%是什么样的效果,因为它有一个适应过程,后边就开始慢慢干净了,再看看他们降噪80%,再看看我们的,明显其他噪音等都比他们要低。


 


再看一下,这一个是单麦克风和双麦克风的比较,这是在饭堂里面说话时候的噪音。这个就是两个麦克风的,这个声音就比较干净了,比刚才要好多了。这个就是汽车里边,就是发动机的噪音很大的时候,大家听一会,前面看了那个有车的时候基本上听不到那个声音。再看后边,这个是最典型的例子,打枪的声音,基本上听不到人声,再把那个放一下,你看看,它开始有枪声,但我适应它了之后马上噪音就降下来。当信噪比在负的时候也可以做,就是噪声比你说话的信号还要强的时候都能做到。然后我们还有其他的应用,可以用到比如像助听器、手机、音频监视器、会议电话系统,我们刚才说了,还有平板电脑,你现在看到很多人用平板电脑的时候,还有打电话的时候显得很不方便,还有比如说矿井电话、港口电话、Smart  TV,实际上就是做家庭视像电话的那个方案了,像直升机、军警、消防的这种都需要这种技术,还有车载免提,当然你需要高档一点的,然后机器人通信。

我们这个模块刚才已经说了,现在是一个单声道的,要是有控制要求的话,我们可以马上把它转成一个双声道的,也就是两个麦克风的,把噪声大大降低。不过单声道有一个要求,你看那个信噪比,就要求信噪比一定要大于语音是负的,我们也可以做,采样率现在是8K,你要做的话,我们可以升级到16K,然后把芯片升级就可以了。然后这个必须要信号有一个延迟,因为拿到一桢的数据之后才能做处理。这就是大概我们的模块的一个样子,那个尺寸在那边,下面的那个就是把模块已经放到天花板上了,可以做演示,如果演讲之后大家有兴趣,我们可以做一个给你们听一听也可以。

其他的,我们还涉及到比如说音频的和语音的编解码我们也都能帮你们解决,然后语音识别的,当然不是超大规模磁波量的我们也可以做,还有回波抵消,还有比较低速率的,就是为了做一些玩具这样的,里面的编解码我们也做一做。然后再就是阵列麦克风,除了两个麦克风,我们还可以做到四个、八个,都可以做,就是看成本和代价的问题了。然后我们也做一些技术模拟的,关于声音定位追踪的,比如现在的都是靠手动的,将来比如像polycom它就是在会议系统的时候,谁说话,它就把镜头转向那个人了,这个我想我们也可以做,可能没它那么好,但是至少这个工作我们是可以完成的,谢谢大家。

相关资讯
从分销龙头到智造推手:大联大如何以“双擎计划”重构半导体生态价值链?

在全球半导体产业深度变革与工业4.0深化阶段,大联大控股以创新驱动与生态协同的双重引擎,再度彰显行业领军地位。据Brand Finance 2025年5月9日发布的“中国品牌价值500强”榜单显示,大联大品牌价值同比提升12.3%,排名跃升至第218位,连续三年实现位次进阶。这一成就不仅源于其在亚太分销市场28.7%的占有率(ECIA数据),更与其“技术增值+场景赋能”的战略转型密不可分。面对工业数字化万亿规模市场机遇,公司通过深圳“新质工业”峰会推动23项技术合作落地;凭借MSCI连续三年AA级ESG评级,构建起覆盖绿色供应链与低碳创新的治理架构;而在汽车电子赛道,则以“生态立方体”模式缩短技术创新产业化周期。随着“双擎计划”的启动,这家半导体巨头正以全链协同之势,重塑智造升级的技术底座与商业范式。

AMD对决NVIDIA:Radeon AI Pro R9700能否撼动RTX 5080的市场地位?

2025年5月21日,AMD在台北国际电脑展(Computex 2025)正式发布首款基于RDNA 4架构的专业显卡Radeon AI Pro R9700,标志着其在AI加速领域的全面发力。该显卡采用台积电N4P工艺打造的Navi 48芯片,晶体管密度达到每平方毫米1.51亿个,相较前代提升31%。凭借32GB GDDR6显存、1531 TOPS的INT4算力及四卡并联技术,R9700瞄准AI推理、多模态模型训练等高负载场景,直接挑战NVIDIA在专业显卡市场的统治地位。

革新电流传感技术:TMR电流传感器的核心技术优势与市场蓝海分析

在工业自动化、新能源及智能电网领域,电流检测的精度与可靠性直接影响系统安全性与能效表现。传统霍尔(Hall)电流传感器因温漂大、响应速度慢等缺陷,已难以满足高精度场景需求。多维科技(Dowaytech)基于自主研发的隧道磁电阻(TMR)技术,推出了一系列高精度、低温漂、高频响的电流传感器,成为替代传统方案的革新力量。

半导体巨头Wolfspeed深陷债务危机 或启动破产重组程序

全球碳化硅半导体龙头企业Wolfspeed正深陷债务危机漩涡。据路透社、彭博社等多家权威媒体援引知情人士消息,因未能与债权人就数十亿美元债务达成重组协议,该公司或于未来两周内启动《美国破产法》第11章程序寻求债务重组。受此消息影响,其股价在盘后交易中暴跌57%,市值单日蒸发超10亿美元。这场危机不仅暴露了第三代半导体企业在技术商业化进程中的财务风险,更引发市场对碳化硅产业链稳定性的深度担忧。截至发稿,Wolfspeed官方尚未就破产传闻作出正式回应,但此前财报中关于“持续经营能力存疑”的预警已为此次风暴埋下伏笔。

芯片厂商Microchip发起价格攻势 PolarFire系列降价30%抢占边缘计算市场

全球半导体行业正经历深度调整之际,美国芯片大厂Microchip于5月20日宣布对其PolarFire FPGA(现场可编程门阵列)及SoC(片上系统)产品线实施30%幅度的价格下调。这一战略性定价调整源于EEnews europe披露的内部策略文件,标志着该公司在边缘计算领域发起市场份额争夺战。