大象声科申请双阶段神经声码器的语音合成方法、系统、终端及介质专利提升音频保真度
栏目:合作伙伴 发布时间:2026-01-26
分享到:
  专利摘要显示,本发明公开了一种双阶段神经声码器的语音合成方法、系统、终端及介质,涉及语音合成技术领域,双阶段包括幅度重建阶段和相位生成阶段,方法包括

  专利摘要显示,本发明公开了一种双阶段神经声码器的语音合成方法、系统、终端及介质,涉及语音合成技术领域,双阶段包括幅度重建阶段和相位生成阶段,方法包括:在幅度重建阶段中,基于ICCRN模型利用监督学习的方式得到估计幅度谱;在相位生成阶段时,基于幅度重建阶段中得到的估计幅度谱与ICCRN模型,结合生成对抗网络,生成与估计幅度谱高度拟合的相位谱;基于估计幅度谱与相位谱,得到合成后的语音样本。本发明将ICCRN模型应用在幅度谱重建阶段和相位谱生成阶段中,且在相位谱生成阶段,创新的提出GAN的方式,利用估计幅度谱去生成一个高度拟合幅度的相位谱,解决了相位-幅度固有的一对多的关系,有利于提升音频保真度和设备兼容性。

  天眼查资料显示,大象声科(深圳)科技有限公司,成立于2017年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本139.1857万人民币。通过天眼查大数据分析,大象声科(深圳)科技有限公司共对外投资了1家企业,参与招投标项目2次,财产线条,此外企业还拥有行政许可21个。

  声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

  ”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

  赫鲁晓夫做梦也没想到,那个在宴会上指着他鼻子怒吼“我块头大”的中国硬汉,最后竟一语成谶!

  江西网友晒“九肥一瘦”比例香肠,被调侃可以当蜡烛用,商户称有人订才会灌

  追风者Evolv X2 / XT View矩阵灯显版机箱上市,1499 / 499元