ในการพล็อต MFCC ใน Python เราสามารถทำตามขั้นตอนต่อไปนี้ -
- กำหนดขนาดรูปและปรับช่องว่างภายในระหว่างและรอบๆ แผนผังย่อย
- เปิดและอ่านไฟล์ WAV
- คำนวณคุณสมบัติ MFCC จากสัญญาณเสียง
- สร้างร่างและชุดแผนย่อย
- แลกเปลี่ยนสองแกนของอาร์เรย์
- แสดงข้อมูลเป็นรูปภาพ เช่น บนแรสเตอร์ปกติ 2 มิติ
- หากต้องการแสดงรูป ให้ใช้ show() วิธีการ
ตัวอย่าง
from python_speech_features import mfcc
import scipy.io.wavfile as wav
import matplotlib.pyplot as plt
import numpy as np
plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True
(rate, sig) = wav.read("my_audio.wav")
mfcc_data = mfcc(sig, rate)
fig, ax = plt.subplots()
mfcc_data = np.swapaxes(mfcc_data, 0, 1)
cax = ax.imshow(mfcc_data, interpolation='nearest', cmap='copper', origin='lower')
plt.show() ผลลัพธ์
