Antkillerfarm Hacking V8.5

speech » 深度语音识别（四）——语音合成参考资源

2021-07-31 :: 5149 Words

语音识别参考资源（续）
语音合成参考资源
气象+

语音识别参考资源（续）

https://mp.weixin.qq.com/s/I_WiSkA4Cu7N_FmoEJTADg

一次对语音技术的彻底批判

https://mp.weixin.qq.com/s/CXIO05_09vwWFJwfDyZQUA

迈向语音识别领域的ImageNet时刻

https://mp.weixin.qq.com/s/Izn6LPCRKNxkTHmkqbAzeg

从算法到应用：滴滴端到端语音AI技术实践

https://mp.weixin.qq.com/s/YTQOgGvFfBdasV18PmboGQ

深度学习在单声道录音中的说话人角色识别优化实践

https://mp.weixin.qq.com/s/PAHwyoxNbi8HDMGh2JtJPQ

58同城语音识别技术的探索和实践

https://mp.weixin.qq.com/s/A9bSp3H3UzAEgL4N7o1KpQ

使用tensorflow进行音乐类型的分类

https://mp.weixin.qq.com/s/j9Kis3AsyYjo3EYOJ6XzBA

端到端声源分离研究：现状、进展和未来

https://mp.weixin.qq.com/s/RC2Yj0cCXBBJaPpflBLB-w

语种识别

https://mp.weixin.qq.com/s/w6Uxr8oB_PHvIHf9ksTVsw

LRSpeech：极低资源下的语音合成与识别

https://mp.weixin.qq.com/s/TdGq07BZ9JcYeKo6Y8gtdA

音频预训练模型

https://mp.weixin.qq.com/s/ybanqEzEDtwTJ-y6piBv8Q

黑白键上的字节跳动：全球最大钢琴MIDI数据集背后的故事

https://mp.weixin.qq.com/s/wZfBg175ylxZj-k4Xzggqw

端到端语音识别模型

https://mp.weixin.qq.com/s/kEtoG4QVNn248k3Yhulrvw

《语音识别引擎后端架构设计》58同城

https://mp.weixin.qq.com/s/x_l5QliTPv7NyUJ5k4uaMQ

基于Transformer的高效、低延时、流式语音识别模型

https://mp.weixin.qq.com/s/4zm4kO4CU9-0sYKTSYdudw

10小时训练数据打造多语种语音识别新高度

https://mp.weixin.qq.com/s/_84nqrEMGC-Q-fPdEiPDgQ

3人半年打造语音识别引擎——58同城语音识别自研之路

https://mp.weixin.qq.com/s/8dFWQ-7m0jN5PvVIUeM33w

利用Android手机和YAMNet ML模型进行声音分类（一）

https://mp.weixin.qq.com/s/y7UZooc97gPgonnM3C9qxg

利用Android手机和YAMNet ML模型进行声音分类（二）

https://mp.weixin.qq.com/s/xS0fS8Haxt_DXxlw7VEo4Q

移动端的语音识别分享

https://mp.weixin.qq.com/s/wRAc0Vzrdxqr-dqXqqYapw

中文文本纠错算法–错别字纠正的二三事

https://zhuanlan.zhihu.com/p/377983386

流式语音识别原理和实现思路

https://mp.weixin.qq.com/s/zgoc3g5p-bq5xTKI_7Z8gA

ASR：从GMM到Transformer

语音合成参考资源

https://mp.weixin.qq.com/s/jwV4glj8vIUKSelzeRrxSg

语音合成

https://mp.weixin.qq.com/s/bFjXDQlxRbt1ia-DSfYazw

SampleRNN语音合成模型

https://mp.weixin.qq.com/s/xAO7mX64miTXE8E2vZ5q_w

Facebook开源TTS神经网络VoiceLoop：基于室外声音的语音合成

https://mp.weixin.qq.com/s/CVBSvQwnDqT-IVCZV7idog

极限元语音算法专家刘斌：基于深度学习的语音生成问题

https://mp.weixin.qq.com/s/zWmJ3uXnFtXaI2BotoadHA

从技术到产品，苹果Siri深度学习语音合成技术揭秘

https://mp.weixin.qq.com/s/6xxXOx59lDZx0kUPb_ftBA

漫谈语音合成之Char2Wav模型

https://mp.weixin.qq.com/s/8e4bkyTJIxHZ1y95GshA0Q

开源的语音合成系统WORLD介绍以及使用方法

https://mp.weixin.qq.com/s/JSnyE2k7jqd5GR1lHA6WUg

阿里巴巴Oral论文：用于语音合成的深度前馈序列记忆网络

https://mp.weixin.qq.com/s/p_VjFwwDCu1i_ovUljaoVw

阿里巴巴语音交互智能团队：基于线性网络的语音合成说话人自适应

https://mp.weixin.qq.com/s/imotc0RfPsvA9h5-1nouMA

端到端语音合成及其优化实践(上))

https://mp.weixin.qq.com/s/NlOH0wmToJvDudIDC-aM1g

端到端语音合成及其优化实践(下)

https://mp.weixin.qq.com/s/HLe4DUZWWfdorcgYOj9gzw

语音合成领域的首个完全端到端模型，百度提出并行音频波形生成模型ClariNet

https://zhuanlan.zhihu.com/p/45702794

微信是不是可以来一个文字转语音功能了？

https://mp.weixin.qq.com/s/DB2C-a_xEyoczuNSG9Bt7w

基于深度前馈序列记忆网络，如何将语音合成速度提升四倍？

https://mp.weixin.qq.com/s/t1ht3weG63Sj59n-MW-Prw

语音合成论文和英伟达撞车，韩国小哥紧急放出全部草稿代码和样本

https://mp.weixin.qq.com/s/1glxeUx-4DCWRjJQMW7IiQ

语音合成论文与韩国小哥“撞车”后续：英伟达“赶紧”把代码开源了

https://mp.weixin.qq.com/s/c1QSGia52ICTc25i-C91Rg

GAN跨界合成高保真音乐，Jeff Dean听了都陶醉

https://mp.weixin.qq.com/s/f1W7PFLwkoJtVXb_7Rh3sw

极大提升合成速度，百度提出首个全并行语音合成模型ParaNet

https://mp.weixin.qq.com/s/aHupAjPNFdUdaG9Uof_obQ

速度提升270倍！微软和浙大联合推出全新语音合成系统FastSpeech

https://mp.weixin.qq.com/s/gaoZ6pQmiXBP3BNDec1nQg

FastSpeech语音合成系统技术升级，微软联合浙大提出FastSpeech2

https://mp.weixin.qq.com/s/JEYucJ16Zsxc6yWHPHGaZA

浙大研发AudioFace：随心录语音就能实时生成3D面部动画

https://mp.weixin.qq.com/s/HubxAFbxCdoaFHNOhfm9QQ

Facebook频谱图模型生成比尔·盖茨声音，性能完胜WaveNet、MAESTRO

https://mp.weixin.qq.com/s/QbSPOHvYD9CGnbPmigeYdA

多语言语音合成和跨语言语音克隆

https://mp.weixin.qq.com/s/McWHS0esRRhIiBlB4CAGXA

柯南变声器的算法原理解析

https://mp.weixin.qq.com/s?__biz=MzIzNjc0MTMwMA==&mid=2247491892&idx=1&sn=d23d0c20e3af340e5a55f19f98636811

2019深度学习语音合成指南

https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652055045&idx=3&sn=5c2a564350bdf5c2acb8679d05cba219

DeepMind推出GAN-TTS：用生成对抗网络实现高保真语音

https://mp.weixin.qq.com/s/-X2bgZ5P5BrPZFDJ-Dl1AQ

MelGAN：基于生成对抗网络快速生成音频

https://zhuanlan.zhihu.com/p/91024324

变分自编码器（VAE）在语音合成中的应用

https://mp.weixin.qq.com/s/oaI_X2SYeKVn7oXWGtFQag

爱奇艺语音转换技术的探索与实践

https://mp.weixin.qq.com/s/qPx1W_OebGgvb4g9Sb944A

使用GAN进行高保真语音合成

https://mp.weixin.qq.com/s/5cn3UBZbA5Cwk4YvKteYBA

吃下文本吐出语音，DeepMind提出新型端到端TTS模型EATS

https://mp.weixin.qq.com/s/eqMs7B70PZO4M7U5S1g5tg

跟郎朗媳妇有得一拼的AI，只看弹琴动作，完美复现原声

https://zhuanlan.zhihu.com/p/278037596

语音转换Voice Conversion—特征分离技术

https://zhuanlan.zhihu.com/p/278243561

语音转换Voice Conversion —直接转换技术

https://mp.weixin.qq.com/s/u2Op6y1vdZKtAlfhAYGLsQ

语音合成方向：歌唱合成（singing voice synthesis)

https://mp.weixin.qq.com/s/FYjXOl7dk3uQriGBuny8DA

志玲姐姐的导航声音是如何产生的？？

气象+

四川电力丰富，很多电站在规划期间就只考虑了外送需求，以至于电厂主回路直接接上超高压/特高压线路送走了，压根就没过四川电网。只有辅助回路接进了省网，但是线路容量很小。

https://www.zhihu.com/question/548984091

上海经信委回应发函向四川要电，称“不和民生抢电力，优先保障居民用电”，如何看待这一回应？

https://www.sohu.com/a/578059311_121284943

长江流域60年来最严重干旱，鄱阳湖洞庭湖“瘦成闪电”

https://www.sohu.com/a/579966753_120146415

四川限电：临终老人靠子女打扇子降温居民辗转3个家避开断电

在罗马尼亚海港和河港里，还滞留着约200艘德国海岸防御船、运输船及卫生船，这些船上载有德国平民、士兵、伤员、难民和来自德国各修船厂的工人。

在这个危急关头，主管黑海海军船厂和装备工厂工作的齐布海军少将决定担任这批船只的指挥官，并立即率领它们向多瑙河上游进发。

https://www.zhihu.com/question/549233580

如何看待纳粹德国舰队因河流干旱“重现天日”，数十艘露出水面，载有大量弹药？

https://www.guancha.cn/internation/2022_08_20_654516_s.shtml

欧洲大旱，“饥饿之石”重见天日：“如你看到我，就哭泣吧”

2012年7月21日北京特大暴雨

7·20北京暴雨是指2016年7月19日1时至21日6时，北京市出现强降雨天气，此次降雨持续时间长、总量大、范围广，降雨总量超过了2012年7·21北京特大暴雨。

2023年7月29日20时至8月2日07时，北京出现极端强降雨天气。

历时八年建设，耗资八亿人民币，位于北京门头沟门头沟潭柘寺附近的北京悉昙酒店被毁。

https://www.zhihu.com/question/614628336

时隔11年，中央气象台发布史上第二个暴雨红色预警，此次暴雨为何如此猛烈？其破坏力有多大？

您的打赏，是对我的鼓励

speech » 深度语音识别（四）——语音合成参考资源

语音识别参考资源（续）

语音合成参考资源

气象+

Recent Posts in speech

Recent Posts in All Blogs