본문 바로가기

분류 전체보기86

[ 디지털 신호처리 ] Audio Signal Processing | cepstrum, MFCC 인하대학교 김병형 교수님의 '디지털 신호처리' 수업을 바탕으로 정리한 글입니다. 1. Cepstrum analysis 1) Spectrum Time waveform을 고속푸리에변환 (FFT, Fast Fourier Transform)하여 만든 Spectrum은 다음과 같은 특징을 가진다. 시간 영역 신호를 구성하는 주파수들과 그 강도를 보여준다. 스펙트럼 상의 특정 위치가 주파수 성분이며, 주파수 성분의 높이는 해당 주파수 성분의 강도를 나타낸다. 스펙트럼은 신호의 대역폭을 보여준다. 신호가 포함하고 있는 저주파부터 고주파까지의 분포를 확인할 수 있다. 주파수 대역 특성을 알 수 있다. 예를 들어 낮은 주파수에 강도가 높은 성분이 있으면 저음이 강한 신호라고 할 수 있다. harmonics와 기본 주파수.. 2023. 11. 10.
[ 디지털 신호처리 ] Audio Signal Processing | glottal signal, vocal tract, formant frequency 인하대학교 김병형 교수님의 '디지털 신호처리' 수업을 바탕으로 정리한 글입니다. 1. 음성 (Audio) 1) 소리의 주파수 원리 주파수의 3요소 : 진폭 (Amplitude), 주기 (Cycle), 파장의 길이 (Wavelength) 진폭 : 진동의 중심부터 최고점까지의 폭으로, 소리의 크기를 나타내는 지표 주기 : 일정 시간을 두고 동일한 상태를 반복하는 현상으로, 주파수가 높을수록 주기는 짧아짐. 파장의 길이 : 주기의 길이를 말하며, 파장의 길이는 주파수가 높을수록 짧아짐. 낮은 음일수록 주파수가 낮다. (더 많이 진동한다.) 높은 음일수록 주파수가 높다. (덜 진동한다.) 2) 소리의 3요소 음의 높이 (Pitch) 소리의 높낮이, 즉 소리의 진동 횟수 차이. 진동 횟수가 많을 수록 소리의 높이.. 2023. 11. 10.
[ 논문 리뷰 ] Emotional Attention: A Study of Image Sentiment and Visual Attention 1. Abstract 이 논문에서 이야기하고자 하는 것은 크게 두가지이다. Interrelationships of image sentiment and visual saliency, Relation between emotional properties of an image and visual attention 1) Interrelationships of image sentiment and visual saliency image가 emotion-eliciting stimuli로서 작동한다. 이때, 이미지의 spatial, semantic context를 학습한 model을 생성하는데 DNN을 사용한다. 이 모델은 human attention을 효과적으로 모방하는 모델이며, 인간의 정서적 반응과 시각적 atte.. 2023. 9. 23.
tf.keras load_model 오류 - ValueError: No model config found in the file at ... Callback 함수에서 ModelCheckpoint를 설정하고 best model을 저장하였다. 저장한 모델을 불러오려고 했는데 다음과 같은 오류가 떠서 해결해보려고 한다. from tensorflow.keras.callbacks import ModelCheckpoint from tensorflow.keras.models import load_model model_cp = ModelCheckpoint('best_model.h5',save_weights_only=True, monitor='val_loss', save_best_only=True, mode='min') model_best = load_model('best_model.h5') model_best " ValueError: No model con.. 2023. 8. 19.