kaldi
-
[Kaldi tutorial] Feature extractionML/Kaldi 2020. 7. 29. 15:19
Introduction Feature extraction과 waveform-reading code는 MFCC와 PLP features를 만드는 것을 목표로 한다. Mel bin의 수나 minimum maximum freq 등 옵션들을 합리적인 디폴트로 설정한다. 이 코드는 오직 pcm data가 들어있는 .wav 파일을 사용한다. 흔히 .wav나 .pcm의 확장자를 가진다. 만약 데이터가 .wav가 아니면 사용자가 바꾸어야 한다. Command line tool인 compute-mfcc-feats와 compute-plp-feats는 다른 kaldi tool과 함께 feature들을 계산한다. Arguments 없이 실행하면 옵션들을 알려줄 것이다. Computing MFCC features 이 파트에서는..
-
[Kaldi tutorial] Data preparationML/Kaldi 2020. 7. 27. 17:02
ESPnet에서 data preparation을 kaldi style로 하고 있어서 document를 공부해보려 한다. Kaldi의 documentation은 Apache 2.0 라이센스를 따르고 있으므로 출처를 정확히 밝힌다. Introduction 예제 스크립트를 실행한 후에, 자신의 데이터로 kaldi 음성인식을 개발하고 싶을 것이다. 이 섹션은 어떻게 데이터를 준비하는지에 대해 설명한다. 이 페이지는 예제 스크립트의 최신 버전을 사용중이라고 가정한다. (ex egs/rm/s5/). Top-level인 run.sh 스크립트는 data preparation의 다양한 방법들과 관련된 command가 존재한다. local이라는 디렉토리는 data에 따라 다르게 작성된다. 예를 들어 RM setup과 WS..
-
Kaldi 예제 Voxforge 데이터ML/음성인식 2020. 1. 21. 16:53
지난번에 했던 예제는 나에게 불필요한 기능이 너무 많아서 다른 포스트를 보고 다시 시도한다. 1. kaldi projects 다운로드 git clone https://github.com/kaldi-asr/kaldi.git 본인이 설치하고 싶은 곳에 kaldi 프로젝트를 clone하자. cd kaldi ls output: CMakeLists.txt COPYING INSTALL README.md cmake docker egs misc scripts src tools windows 프로젝트 안에는 이러한 디렉토리와 파일들이 있다. 2. path 설정 나는 voxforge 예제를 실행할 것이기 때문에 voxforge의 디렉토리로 이동해야한다. cd egs/voxforge/s5 ls output: cmd.sh c..
-
Kaldi, Kaldi gstreamer 설치 및 예제 실행ML/음성인식 2020. 1. 21. 16:43
0. 개요 이 글은 개인적인 시행착오가 다 있는 글이므로 참고만 부탁드립니다! 그리고 마지막에 성공하지 못해서 아래 글을 참고하시는 것도 좋을 것 같네요! https://hanseokhyeon.tistory.com/entry/Kaldi-예제-Voxforge-데이터 Kaldi 예제 Voxforge 데이터 지난번에 했던 예제는 나에게 불필요한 기능이 너무 많아서 다른 포스트를 보고 다시 시도한다. 1. kaldi projects 다운로드 git clone https://github.com/kaldi-asr/kaldi.git 본인이 설치하고 싶은 곳에 kaldi.. hanseokhyeon.tistory.com 많은 기업들이 음성인식을 개발할 때 Kaldi를 이용한다고 한다. Kaldi에 대해 공부하기 위해 먼..