Tutorial
-
[Kaldi tutorial] Feature extractionML/Kaldi 2020. 7. 29. 15:19
Introduction Feature extraction과 waveform-reading code는 MFCC와 PLP features를 만드는 것을 목표로 한다. Mel bin의 수나 minimum maximum freq 등 옵션들을 합리적인 디폴트로 설정한다. 이 코드는 오직 pcm data가 들어있는 .wav 파일을 사용한다. 흔히 .wav나 .pcm의 확장자를 가진다. 만약 데이터가 .wav가 아니면 사용자가 바꾸어야 한다. Command line tool인 compute-mfcc-feats와 compute-plp-feats는 다른 kaldi tool과 함께 feature들을 계산한다. Arguments 없이 실행하면 옵션들을 알려줄 것이다. Computing MFCC features 이 파트에서는..
-
[Kaldi tutorial] Data preparationML/Kaldi 2020. 7. 27. 17:02
ESPnet에서 data preparation을 kaldi style로 하고 있어서 document를 공부해보려 한다. Kaldi의 documentation은 Apache 2.0 라이센스를 따르고 있으므로 출처를 정확히 밝힌다. Introduction 예제 스크립트를 실행한 후에, 자신의 데이터로 kaldi 음성인식을 개발하고 싶을 것이다. 이 섹션은 어떻게 데이터를 준비하는지에 대해 설명한다. 이 페이지는 예제 스크립트의 최신 버전을 사용중이라고 가정한다. (ex egs/rm/s5/). Top-level인 run.sh 스크립트는 data preparation의 다양한 방법들과 관련된 command가 존재한다. local이라는 디렉토리는 data에 따라 다르게 작성된다. 예를 들어 RM setup과 WS..
-
Kaldi 예제 Voxforge 데이터ML/음성인식 2020. 1. 21. 16:53
지난번에 했던 예제는 나에게 불필요한 기능이 너무 많아서 다른 포스트를 보고 다시 시도한다. 1. kaldi projects 다운로드 git clone https://github.com/kaldi-asr/kaldi.git 본인이 설치하고 싶은 곳에 kaldi 프로젝트를 clone하자. cd kaldi ls output: CMakeLists.txt COPYING INSTALL README.md cmake docker egs misc scripts src tools windows 프로젝트 안에는 이러한 디렉토리와 파일들이 있다. 2. path 설정 나는 voxforge 예제를 실행할 것이기 때문에 voxforge의 디렉토리로 이동해야한다. cd egs/voxforge/s5 ls output: cmd.sh c..
-
make와 Makefile 사용하기언어/C 2020. 1. 21. 16:52
그동안 gcc -o main -g *.c -lm 명령어를 이용해 직접 컴파일을 하였다. 하지만 GNU에서는 주로 make를 이용해 컴파일을 한다.(kaldi 설치하면서 많이 느낌.) Makefile은 make로 어떤 프로그램 구조를 컴파일하기 위해 명령어들을 작성해 놓은 파일로 보면 된다. 그럼 시작해보자. 1. Makefile 만들기 vim Make file vim을 이용해 파일을 생성하고 그안에 아래의 코드를 작성하였다. 1 run_anc : main.o anc.o functional.o secondary_path.o synchronizer.o 2 gcc -o run_anc main.o anc.o functional.o secondary_path.o synchronizer.o 3 4 main.o : ..
-
Kaldi, Kaldi gstreamer 설치 및 예제 실행ML/음성인식 2020. 1. 21. 16:43
0. 개요 이 글은 개인적인 시행착오가 다 있는 글이므로 참고만 부탁드립니다! 그리고 마지막에 성공하지 못해서 아래 글을 참고하시는 것도 좋을 것 같네요! https://hanseokhyeon.tistory.com/entry/Kaldi-예제-Voxforge-데이터 Kaldi 예제 Voxforge 데이터 지난번에 했던 예제는 나에게 불필요한 기능이 너무 많아서 다른 포스트를 보고 다시 시도한다. 1. kaldi projects 다운로드 git clone https://github.com/kaldi-asr/kaldi.git 본인이 설치하고 싶은 곳에 kaldi.. hanseokhyeon.tistory.com 많은 기업들이 음성인식을 개발할 때 Kaldi를 이용한다고 한다. Kaldi에 대해 공부하기 위해 먼..
-
docker pytorch image 이용해서 pytorch 사용하기개발 환경/Docker 2020. 1. 21. 16:37
이젠 더이상 피할 수 없다. 도커를 이용해 딥러닝해보자. 1. Nvidia pytorch image pull docker pull nvcr.io/nvidia/pytorch:19.09-py3 와이파이로 해서 그런가 매우 오래걸렸다. docker images output: REPOSITORY TAG IMAGE ID CREATED SIZE nvcr.io/nvidia/pytorch 19.09-py3 9d6f9ccfbe31 2 months ago 9.15GB 9.15GB... 오래 걸린 이유가 있었다. 2. Run 돌려보자. docker run -i -t --name pytorch nvcr.io/nvidia/pytorch:19.09-py3 /bin/bash 터미널을 켜봤다. ============= == PyTo..
-
gcc 설치 및 사용법언어/C 2020. 1. 13. 12:31
리눅스에서 C언어 개발 환경을 구축하기 위해 gcc를 사용해본다. 1. 설치 보통 우분투를 설치하면 gcc는 설치되어있다. 아래의 명령어를 통해 설치여부를 확인해보자. gcc output: gcc: fatal error: no input files compilation terminated. 이렇게 나오면 설치되어 있는 것이다. 버젼을 확인해보자. gcc --version output: gcc (Ubuntu 7.4.0-1ubuntu1~18.04.1) 7.4.0 Copyright (C) 2017 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not e..