본문 바로가기

signal processing4

Mel-spectrogram 딥러닝을 이용하여 음성 인식, 음성 처리, 화자 인식, 감정 인식 등에서 많이 쓰이는 음성의 특징 추출 방법에는 Mel-Spectrogram, MFCC가 있다. 그 중 Mel-Spectrogram에 대하여 어떻게 추출하여 쓸 수 있는지 적어보겠다. *STFT(Short Time Fouriter Transform) STFT는 주파수 특성이 시간에 따라 달라지는 사운드를 분석하기 위한 방법이다. 시계열 일정한 시간 구간으로 나누고 각 구간에 대해 스펙트럼을 구한 데이터다. 시간-주파수 2차원 데이터로 나타낸다. *Mel-Spectrogram 주파수의 단위를 다음 공식에 따라 멜 단위(Mel unit)로 바꾼 스펙트럼을 말한다. - Mel-scale Mel-scale은 이러한 pitch에서 발견한 사람의 음을.. 2020. 5. 28.
물리적 거리에 따른 음성 이동경로 측정 방법 (아날로그 딜레이) 사운드 카드에서 한 개의 스테레오 채널을 통해 음성 이동경로(아날로그 딜레이)를 측정하고자 한다. 소프트웨어 툴로는 'Adobe Audition 3.0'을 사용한다. 정확한 측정을 위해 입력 신호는 임펄스 신호를 이용한다. 샘플링 주파수는 아날로그 딜레이를 그대로 측정할 수 없기에 디지털로 변환하여 측정한다. 높은 해상도를 위해서 Soundcard가 지원하는 최대 샘플링 주파수인 96 kHz를 이용한다. 다음과 같이 입력과 출력에 마이크와 스피커를 연결하고 거리에 따라 소요 시간을 측정한다. 사용하는 기본 공식은 거리 = 속력 × 시간 을 이용한다. 여기서 속력은 음속으로 340m/s에 해당한다. 고정된 거리에서 여러번 측정했을 때 정확한 시간이 측정되지 않는다. 제대로 측정하지 못한 이유를 알기 위해 .. 2020. 5. 26.
Fourier Transform and System (2) 보호되어 있는 글 입니다. 2020. 4. 25.
Fourier Transform and System (1) Fourier Transform and system · Time-to-frequency transform - Continuous-Time Fourier Transform, CTFT - Discrete-Time Fourier Transform, DTFT - Discrete Fourier Transform, DFT · system equation - Frequency response - z-transform CTFT and DTFT · Continuous-Time Fourier Transform(CTFT) t : time in sec f : frequency in Hz x(t) ↔ X(f) 시간을 스펙트럼으로 바꾸는 것, 스펙트럼을 시간으로 바꾸는 두 가지 공식이다. 주파수를 정의하는 기본적인 식은 exp(.. 2020. 4. 24.