wavとpcmの変換(Pythonバージョン)


wavとpcmは音声信号処理で最も一般的なファイルフォーマットであり、2つのファイルフォーマットを必要とする相互変換に遭遇することが多い.wavは、一般に復号後[−1,1]のfloatデータを格納し、ファイルヘッダに44バイトの記録ファイルのサンプリングレート、長さなどの情報が格納される.pcmはint型整数を格納し,サンプリングレート関連情報は一切含まない.原理は簡単ですが、整理したほうが使いやすいです.
 
wav回転pcm
原理:ファイルヘッダを取り除き、データをint型にすればよい.
import numpy as np
def wav2pcm(wavfile, pcmfile, data_type=np.int16):
    f = open(wavfile, "rb")
    f.seek(0)
    f.read(44)
    data = np.fromfile(f, dtype= data_type)
    data.tofile(pcmfile)

 
pcm回転wav
原理:waveライブラリを利用して、チャネル情報、サンプリングビット数、サンプリングレートなどの情報をファイルヘッダとして追加し、pcmデータを直接書き込むことができます.
import wave
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
    pcmf = open(pcm_file, 'rb')
    pcmdata = pcmf.read()
    pcmf.close()

    if bits % 8 != 0:
        raise ValueError("bits % 8 must == 0. now bits:" + str(bits))

    wavfile = wave.open(wav_file, 'wb')
    wavfile.setnchannels(channels)
    wavfile.setsampwidth(bits // 8)
    wavfile.setframerate(sample_rate)
    wavfile.writeframes(pcmdata)
    wavfile.close()