python - 怎样表达一段语音的强度(响度)?
问题描述
我希望通过一段语音分析语音的强度(响度)。
因为是工科狗而非理科狗,且对于音频信号分析是外行,只简单看了下FFT,所以对于自己分析语音强度的方法没有安全感。希望这方面的高手能够指导下。非常感谢!!!
以下是我获取语音信号数据的过程。123.wav语音文件来自于百度合成的mp3转码,所以这段语音就算存在噪音也应该是微量的,这里不用再滤波了(就算滤波也不知道滤波器系数该用什么)。我猜想到此应该是没有问题的?
# -*- coding: utf-8 -*-import numpy as npimport pylab as plimport wavef = wave.open('/home/dyan/123.wav', 'rb')# 读取格式信息# (nchannels, sampwidth, framerate, nframes, comptype, compname)params = f.getparams()nchannels, sampwidth, framerate, nframes = params[:4]# 读取波形数据str_data = f.readframes(nframes)f.close()wave_data = np.fromstring(str_data, dtype=np.short)# 在时间轴上画波形图# 以上nchannels=1, sampwidth=2, framerate=16000lenth=len(wave_data)ti=lenth/16000.0t = np.arange(0, ti, ti/lenth)pl.plot(t,wave_data)pl.show()
波形图(时间长度大约1.8s)
我希望在播放这段语音的时候,通知语音的强度,但是显然频率太快了,并不要这么快,比如0.2s一次统计也许是比较合适的。我有2个想法,但是不确定,没有安全感:
1、每0.2s求振幅绝对值平均值。2、每0.2s取振幅绝对值最大值。
不了解音频信号处理,所以完全不知道这两种方案中的一种能不能代表语音强度。或者应该用其他的方式。
综上所述,2个问题:
1、这样获取波形数据wav_data是否正确?2、怎样表达这段语音的强度(响度)?
问题解答
回答1:声音就是机械振动波
它的强度就是振幅大小
高音和低音是 频率
相关文章:
1. python - Django ManyToManyField 字段数据在 admin后台 显示不正确,这是怎么回事?2. 为什么span的color非要内联样式才起作用?3. mysql sum去除重复4. 老师无限级分类有点难哟 不好理解5. javascript - swiper.js嵌套了swiper 初始设置不能向下一个滑动 结束后重新初始6. docker gitlab 如何git clone?7. 请问没有对以太网通信进行封装的python库?8. python - pysciter 如何配置运行环境?9. javascript - webpack 怎么在压缩时候删除换行10. python - 如何修改twisted自带的日志输出格式?

网公网安备