アドベントカレンダー12日目です。下の記事のPython3系で行うため、MFCCを求める手段で挫折したことの記録。

経緯

つまづいたこと

上記の記事はO'Reilly Japan - 実践機械学習システムを参考に行っており、音声認識の特徴量としてMFCCを求める際、scikits.talkboxというライブラリを使用していました。

当初は僕も同じようにライブラリを使おうと思いましたがうまく使えず、2to3というコマンドで3系に置き換えてもダメでしたので断念。MFCCを求めるプログラムを自分で実装しようと考え、下の記事を読みながらわかんねえわかんねえと叫ぶ。

このライブラリを使ったサンプルコードです。

from scipy import io
from scipy.io import wavfile
from python_speech_features import mfcc

data = io.wavfile.read('xxxx.wav')
ceps = mfcc(data)

これで簡単にMFCCを求めることができました。