dohyeon

  • 홈
  • 태그
  • 방명록
DOHYEON

mel-scale 1

멜 스펙트로그램(Mel Spectrogram) 간단 정리

참고 자료https://en.wikipedia.org/wiki/Mel_scalehttps://m.blog.naver.com/sooftware/221661644808 1. Introduction나는 음성과 인공지능을 결합하는 작업에 관심을 가지고 있다.그래서 그와 관련된 연구/프로젝트를 많이 찾아서 하고 있는 중이다.요즘에는 크게 1) 머릿속 내부 발화(Inner Speech)의 Voice Reconstruction 연구, 2) 통화 데이터 기반 실시간 인공지능 거짓말(보이스피싱) 탐지기 개발 이렇게 두 가지의 프로젝트를 하는데, 이 두 프로젝트 모두 공통적으로 음성 데이터에서 어떻게 유의미한 feature를 뽑아낼 것인지에 대한 고민이 필요하다. 이러한 좋은 feature를 뽑아낼 수 있는 대표적인 방법..

[Audio & Speech Fundamentals] 2024.04.29
이전
1
다음
더보기
프로필사진

dohyeon

음향, 음성, 인공지능 공부합니다.

  • 분류 전체보기 (10)
    • [Audio & Speech Fundamental.. (5)
    • [Sound Event Detection] (1)
      • DCASE2023 (0)
      • DCASE2024 (0)
      • DCASE ~2023 (1)
    • [Speech Enhancement] (1)
    • [Fundamentals] (2)
      • [Fundamentals] 논문 (2)
      • [Fundamentals] 코드리뷰 (0)
    • [기타] (1)
      • XAI (1)
    • [Cloud Computing] (0)
      • AWS (0)

Tag

mel spectrogram, mean teacher, polyphonic sed, psds, semi-supervised, mel-scale, psd-roc, semi-supervised learning, Unlabeled Data, XAI, 전처리, 설명가능한인공지능, mel-spectrogram, MFCC, 반지도학습, 대리분석, 평가지표, dcase, attention mechanism, 멜스펙트로그램,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Github Linkedin

Copyright © Kakao Corp. All rights reserved.

티스토리툴바