ML/음성인식 2020. 1. 21. 16:43

0. 개요

이 글은 개인적인 시행착오가 다 있는 글이므로 참고만 부탁드립니다! 그리고 마지막에 성공하지 못해서 아래 글을 참고하시는 것도 좋을 것 같네요!

https://hanseokhyeon.tistory.com/entry/Kaldi-예제-Voxforge-데이터

Kaldi 예제 Voxforge 데이터

지난번에 했던 예제는 나에게 불필요한 기능이 너무 많아서 다른 포스트를 보고 다시 시도한다. 1. kaldi projects 다운로드 git clone https://github.com/kaldi-asr/kaldi.git 본인이 설치하고 싶은 곳에 kaldi..

hanseokhyeon.tistory.com

많은 기업들이 음성인식을 개발할 때 Kaldi를 이용한다고 한다. Kaldi에 대해 공부하기 위해 먼저 깔아보자!

1. Kaldi를 위해 필요한 패키지 설치

sudo apt-get update && apt-get install -y \
autoconf \
automake \
bzip2 \
g++ \
git \
gstreamer1.0-plugins-good \
gstreamer1.0-tools \
gstreamer1.0-pulseaudio \ 
gstreamer1.0-plugins-bad \ 
gstreamer1.0-plugins-base \ 
gstreamer1.0-plugins-ugly \
libatlas3-base \
libgstreamer1.0-dev \
libtool-bin \ 
make \ 
python2.7 \ 
python3 \ 
python-pip \ 
python-yaml \
python-simplejson \
python-gi \
subversion \
wget \
build-essential \
python-dev \
sox \
zlib1g-dev && \
apt-get clean autoclean && \
apt-get autoremove -y && \
pip install ws4py==0.3.2 && \
pip install tornado==4.5.3 && \
ln -s /usr/bin/python2.7 /usr/bin/python ; ln -s -f bash /bin/sh

복사해서 한번에 터미널에 치려했지만 짤려서 결국 일일이 쳤다...

마지막줄에

ln -s /usr/bin/python2.7 /usr/bin/python
ln -s -f bash /bin/sh

예상 output:

ln: failed to create symbolic link '/usr/bin/python': 파일이 있습니다
ln: failed to create symbolic link '/bin/sh': 허가 거부

이 명령어 두줄은 심볼릭 링크파일을 생성해주는 명령어이다. 쉽게 생각하면 윈도우의 바로가기와 같다. 기존에 있든 새로 설치했든 파이썬 2.7을 파이썬에 링크함으로써 리눅스의 기본 파이썬을 파이썬 2.7로 설정하는 과정이다. 근데 대부분 이미 파이썬 3.6이 기본 파이썬으로 설정되어있을 것이다. 그래서 파일이 있다는 에러가 출력될 것이다. 또한 /bin/sh는 관리자 권한 없이는 접근 불가능해서 허가 거부 에러가 출력될 것이다.

이렇게 개선된 명령어를 입력하면 심볼릭 파일이 잘 생성된다.

sudo ln -s -f /usr/bin/python2.7 /usr/bin/python
sudo ln -s -f bash /bin/sh

-f는 파일이 존재하든지 안하든지 강제로 심볼릭 파일을 생성한다.

2. Cuda 설치 & gcc 버젼 설정

Kaldi는 GPU를 주로 사용하기 때문에 cuda를 설치해줘야 한다. cuda 설치 방법은 다른 블로그에 많이 존재하니 이 글에서 언급하지는 않겠다.

Cuda는 gcc-7과 g++-7 버전으로 사용해야한다.

sudo apt install gcc-7 g++-7

sudo ln -s /usr/bin/gcc-7 /usr/local/cuda/bin/gcc
sudo ln -s /usr/bin/g++-7 /usr/local/cuda/bin/g++

위와 같이 설치후 심볼릭 링크를 걸어준다.

3. Jansson 설치

/opt로 이동 (관리자 권한이 계속 필요하다..)

cd /opt

jansson 설치 후 압축풀기

sudo wget http://www.digip.org/jansson/releases/jansson-2.7.tar.bz2
sudo bunzip2 -c jansson-2.7.tar.bz2 | sudo tar xf -

압축 푼 jansson-2.7로 가서 make, check, install

cd jansson-2.7

sudo ./configure
sudo make
sudo make check
sudo make install

머 이리저리 엄청 뜨는데 make check에서 PASS: 1로 뜨긴했다.

output:

...
============================================================================
Testsuite summary for jansson 2.7
============================================================================
# TOTAL: 1
# PASS:  1
# SKIP:  0
# XFAIL: 0
# FAIL:  0
# XPASS: 0
# ERROR: 0
============================================================================
...

주소를 파일에 입력

sudo echo "/usr/local/lib" >> sudo /etc/ld.so.conf.d/jansson.conf
sudo ldconfig
sudo rm /opt/jansson-2.7.tar.bz2
sudo rm -rf /opt/jansson-2.7

4. Github에서 kaldi 가져오기

cd /opt

sudo git clone https://github.com/kaldi-asr/kaldi.git

output:

'kaldi'에 복제합니다...
remote: Enumerating objects: 8, done.
remote: Counting objects: 100% (8/8), done.
remote: Compressing objects: 100% (8/8), done.
remote: Total 104130 (delta 0), reused 1 (delta 0), pack-reused 104122
오브젝트를 받는 중: 100% (104130/104130), 114.17 MiB | 10.18 MiB/s, 완료.
델타를 알아내는 중: 100% (80381/80381), 완료.

5. Kaldi tools 컴파일

kaldi tools를 컴파일하러 가자.

cd /opt/kaldi/tools
sudo make

output:

extras/check_dependencies.sh
extras/check_dependencies.sh: gfortran is not installed.
extras/check_dependencies.sh: Intel MKL is not installed. Run extras/install_mkl.sh to install it.
 ... You can also use other matrix algebra libraries. For information, see:
 ...   http://kaldi-asr.org/doc/matrixwrap.html
extras/check_dependencies.sh: Some prerequisites are missing; install them using the command:
  sudo apt-get install gfortran
Makefile:38: recipe for target 'check_required_programs' failed
make: *** [check_required_programs] Error 1

한번에 되면 섭하다. 에러를 읽어보니 gfortran이랑 Intel MKL이 설치가 안되있다고 한다.

sudo apt-get install gfortran

으로 gfortran을 설치해줬다. 다시 sudo make를 실행하니 여전히 Intel MKL이 설치되어 있지 않다고 뜬다. 그런데 컴파일은 시작되었고 보기 무섭게 빠르게 log가 빨리 올라간다... Intel MKL을 설치하고 다시 컴파일 해봐야겠다...

sh extras/install_mkl.sh

output:

E: The repository 'http://ppa.launchpad.net/george-edison55/cmake-3.x/ubuntu bionic Release' does not have a Release file.
N: Updating from such a repository can't be done securely, and is therefore disabled by default.
N: See apt-secure(8) manpage for repository creation and user configuration details.
extras/install_mkl.sh: MKL package intel-mkl-64bit-2019.2-057 installation FAILED.

설치 실패란다... 뭐가 문제일까... gfortran이랑 mkl을 둘다 설치하고 컴파일 했어야했는데... 우선 컴파일이 엄청 되긴 했으니 그냥 넘어가본다...(error1)

sudo ./install_portaudio.sh

위 명령어를 실행하니 설치가 엄청되었다.

cd /opt/kaldi/src

sudo ./configure --shared

output:

Configuring KALDI to use MKL.
Checking compiler g++ ...
Checking OpenFst library in /opt/kaldi/tools/openfst-1.6.7 ...
Checking cub library in /opt/kaldi/tools/cub-1.8.0 ...
Doing OS specific configurations ...
On Linux: Checking for linear algebra header files ...
Configuring MKL library directory: ***configure failed: MKL libraries could not be found. Please use the switch --mkl-libdir or try another math library, e.g. --mathlib=ATLAS (would be slower) ***

MKL libraries를 찾을 수 없다...

하지만 갓글, 갓허브는 해결해주었다.
https://github.com/kaldi-asr/kaldi/issues/3628#issuecomment-538070238

추가 - openfst-1.6.7 설치시 오류

나는 위에 output을 보면 알 수 있듯이 정상적으로 openfst-1.6.7이 설치되었다. 하지만 정상적으로 설치되지 않을 수도 있다. 그때 해결할 수 있는 방안을 제시한다.

cd /opt/kaldi/tools

wget http://www.openfst.org/twiki/pub/FST/FstDownload/openfst-1.6.7.tar.gz
tar -zxvf openfst-1.6.7.tar.gz
cd openfst-1.6.7
./configure
make
make install

다양한 글들이 저 링크에 들어가서 직접 설치하는 등 많은 방법을 제시한다. 위에 코드는 wget으로 다운 받고 압축풀고 직접 comfile하는 방식으로 진행된다.

이 글대로 하고나서 다시 sudo sh install_mkl.sh 하니깐
output:

extras/install_mkl.sh: MKL version 2019.0.1 is already installed.
...

이미 설치되어 있단다!!

다시 make...

sudo make

output:

extras/check_dependencies.sh
extras/check_dependencies.sh: all OK.
...
Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.

후... all OK.는 훼이크고 IRSTLM?설치하러 가자.

sudo sh extras/install_irstlm.sh

output:

...
***() Installation of IRSTLM finished successfully
***() Please source the tools/extras/env.sh in your path.sh to enable it

tools/extras/env.sh를 source해서 너의 path.sh에 IRSTLM을 가능하게 하라.라고 해서 실행했는데 env.sh는 extras가 아니라 tools안에 있다... 다시 실행하니 된다. ㅎㅎ

머 이제 진짜 make를 해보자...ㅎㅎ

sudo make

그러나 저 Warning은 안사라졌다... 넘어가보자...

추가

IRSTLM은

6. Kaldi src 컴파일

cd /opt/kaldi/src

sudo ./configure --shared

output:

Kaldi has been successfully configured. To compile:

  make -j clean depend; make -j <NCPU>

성공적으로 configured하였다.

sudo make depend
sudo make

무리없이 된 거 같다. 30분은 걸린 거 같다..

cd /opt/kaldi/src/online
sudo make depend
sudo make

이것도 마지막으로 완료.

7. gst-plugin 컴파일

cd /opt/kaldi/src/gst-plugin
sudo make depend
sudo make

8. gst-kaldi-nnet2-online 컴파일

cd /opt
sudo git clone https://github.com/alumae/gst-kaldi-nnet2-online.git

cd /opt/gst-kaldi-nnet2-online/src
sudo sed -i '/KALDI_ROOT?=\/home\/tanel\/tools\/kaldi-trunk/c\KALDI_ROOT?=\/opt\/kaldi' Makefile
sudo make depend
sudo make

9. kaldi-gstreamer-server clone

cd /opt
sudo git clone https://github.com/alumae/kaldi-gstreamer-server.git
sudo git clone https://github.com/jcsilva/docker-kaldi-gstreamer-server.git

cd docker-kaldi-gstreamer-server

sudo chmod +x start.sh
sudo chmod +x stop.sh

후 설치는 다 끝났다.

10. DB 다운로드

sudo mkdir /opt/models
cd /opt/models

sudo wget https://phon.ioc.ee/~tanela/tedlium_nnet_ms_sp_online.tgz
sudo tar -zxvf tedlium_nnet_ms_sp_online.tgz

DB가 1.4GB라 다운받는데 시간이 꽤 걸린다.

sudo wget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/sample_english_nnet2.yaml
sudo find /opt/models/ -type f | sudo xargs sed -i 's:test:/opt:g'
sudo xargs sed -i 's:full-post-processor:#full-post-processor:g' /opt/models/sample_english_nnet2.yaml

sed 명령어는 어떠한 문자열을 원하는 문자열로 바꾸는데 주로 쓰인다. sudo find ... 명령어는 파일 안에서 모든 test를 /opt로 바꾼다. 우리의 models 디렉토리의 경로가 /opt이기 때문이다.

sudo cat ./sample_english_nnet2.yaml

로 확인해보면

# You have to download TEDLIUM "online nnet2" models in order to use this sample
# Run download-tedlium-nnet2.sh in '/opt/models' to download them.
use-nnet2: True
decoder:
    # All the properties nested here correspond to the kaldinnet2onlinedecoder GStreamer plugin properties.
    # Use gst-inspect-1.0 ./libgstkaldionline2.so kaldinnet2onlinedecoder to discover the available properties
    use-threaded-decoder:  true
    model : /opt/models/english/tedlium_nnet_ms_sp_online/final.mdl
    word-syms : /opt/models/english/tedlium_nnet_ms_sp_online/words.txt
    fst : /opt/models/english/tedlium_nnet_ms_sp_online/HCLG.fst
    mfcc-config : /opt/models/english/tedlium_nnet_ms_sp_online/conf/mfcc.conf
    ivector-extraction-config : /opt/models/english/tedlium_nnet_ms_sp_online/conf/ivector_extractor.conf
    max-active: 10000
    beam: 10.0
    lattice-beam: 6.0
    acoustic-scale: 0.083
    do-endpointing : true
    endpoint-silence-phones : "1:2:3:4:5:6:7:8:9:10"
    traceback-period-in-secs: 0.25
    chunk-length-in-secs: 0.25
    num-nbest: 1
    #Additional functionality that you can play with:
    #lm-fst:  /opt/models/english/tedlium_nnet_ms_sp_online/G.fst
    #big-lm-const-arpa: /opt/models/english/tedlium_nnet_ms_sp_online/G.carpa
    #phone-syms: /opt/models/english/tedlium_nnet_ms_sp_online/phones.txt
    #word-boundary-file: /opt/models/english/tedlium_nnet_ms_sp_online/word_boundary.int
    #do-phone-alignment: true
out-dir: tmp

use-vad: False
silence-timeout: 10

# Just a sample post-processor that appends "." to the hypothesis
post-processor: perl -npe 'BEGIN {use IO::Handle; STDOUT->autoflush(1);} sleep(1); s/(.*)/\1./;'

#post-processor: (while read LINE; do echo $LINE; done)

# A sample full post processor that add a confidence score to 1-best hyp and deletes other n-best hyps
##full-post-processor: ./sample_full_post_processor.py

logging:
    version : 1
    disable_existing_loggers: False
    formatters:
        simpleFormater:
            format: '%(asctime)s - %(levelname)7s: %(name)10s: %(message)s'
            datefmt: '%Y-%m-%d %H:%M:%S'
    handlers:
        console:
            class: logging.StreamHandler
            formatter: simpleFormater
            level: DEBUG
    root:
        level: DEBUG
        handlers: [console]

경로가 /opt/models로 바껴있는 것을 확인할 수 있다.

11. Test

cd /opt/docker-kaldi-gstreamer-server

sudo ./start.sh -y /opt/models/sample_english_nnet2.yaml

Start!!

wget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/kaldigstserver/client.py -P /tmp
wget https://raw.githubusercontent.com/jcsilva/docker-kaldi-gstreamer-server/master/audio/1272-128104-0000.wav -P /tmp
wget https://raw.githubusercontent.com/alumae/kaldi-gstreamer-server/master/test/data/bill_gates-TED.mp3 -P /tmp

다운로드 완료

python /tmp/client.py -u ws://localhost:80/client/ws/speech -r 32000 /tmp/1272-128104-0000.wav

output:

Traceback (most recent call last):
  File "/tmp/client.py", line 4, in <module>
    from ws4py.client.threadedclient import WebSocketClient
ImportError: No module named ws4py.client.threadedclient

ws4py가 없다고 하여 설치해주었다.

pip install ws4py

설치 후 다시 명령어를 실행해보니 이번에는 Connection refused 에러가 났다. ssh로 접속해서 그런지 확인해봐야겠다.
output:

Traceback (most recent call last):
  File "/tmp/client.py", line 127, in <module>
    main()
  File "/tmp/client.py", line 122, in main
    ws.connect()
  File "/home/han/.local/lib/python2.7/site-packages/ws4py/client/__init__.py", line 217, in connect
    self.sock.connect(self.bind_addr)
  File "/usr/lib/python2.7/socket.py", line 228, in meth
    return getattr(self._sock,name)(*args)
socket.error: [Errno 111] Connection refused

Connection refused는 IP 주소가 유효하지 않으면 발생하는 에러다. 열심히 삽질해보니 서버가 동작을 안한것이다.

위에서 start.sh 파일을 실행했을때 아무런 로그가 뜨지 않아서 성공한줄 알았지만 사실 아니었다. /opt로 가보면 master.log와 worker.log 파일이 생겼을 것이다. 열어보면 에러가 담겨있을 것이다.

output:

tornado가 없다고 한다. 설치해주자

pip install tornado

다시 start.sh를 실행해보면 이제서야 제대로 돌아간다. master.log와 worker.log를 확인해보자.

DEBUG 2019-12-09 21:24:06,752 Starting up server 
    INFO 2019-12-09 21:24:11,315 101 GET /worker/ws/speech (127.0.0.1) 0.36ms 
    INFO 2019-12-09 21:24:11,315 New worker available <__main__.WorkerSocketHandler object at 0x7f12c4ecce50> 
    INFO 2019-12-09 21:24:38,998 101 GET /client/ws/speech?content-type= (127.0.0.1) 0.24ms 
    INFO 2019-12-09 21:24:38,998 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: OPEN 
    INFO 2019-12-09 21:24:38,998 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Request arguments: content-type="" 
    INFO 2019-12-09 21:24:38,998 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Using worker <__main__.DecoderSocketHandler object at 0x7f12c4ee7850> 
    INFO 2019-12-09 21:24:39,229 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Forwarding client message (<type 'str'>) of length 2048 to worker 
    INFO 2019-12-09 21:24:39,480 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Forwarding client message (<type 'str'>) of length 2048 to worker 
    INFO 2019-12-09 21:24:39,731 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Forwarding client message (<type 'str'>) of length 2048 to worker 
    INFO 2019-12-09 21:24:39,983 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Forwarding client message (<type 'str'>) of length 2048 to worker 
    INFO 2019-12-09 21:24:40,235 02fa1d9b-1df4-4ff1-a6be-056d606e02e5: Forwarding client message (<type 'str'>) of length 2048 to worker

돌아가는 듯해 보인다.

다시

python /tmp/client.py -u ws://localhost:80/client/ws/speech -r 8192 /tmp/bill_gates-TED.mp3

를 실행시켜보았지만 되는 듯하다가 만다...

output:

Audio sent, now sending EOS
Received error from server (status 1)

12. 결론

Kaldi에 대해서 아무것도 모르다가 tutorial이라는 글을 보고 무작정 따라하기 시작했다. 따라하면서 설치하다보니 많은 것을 배우게 되었다. 하지만 나는 음성인식 성능과 방법론에 대해 연구하고 싶지 시스템을 구축하는 것에 대해서는 관심이 없다. 이 글은 여기서 마무리하고 다른 tutorial을 보고 시도해봐야겠다. 참고로 kaldi의 간단한 예제는 동작이 되는 것을 확인했다. 다른 글에서 언급할 예정이다.

출처:
https://bourbonkk.tistory.com/27

저작자표시

'ML > 음성인식' 카테고리의 다른 글

Listen, Attend and Spell 논문 리뷰 (0)	2020.04.08
Kaldi 예제 Voxforge 데이터 (0)	2020.01.21
Phoneme recognition (Spikegram, MFCC, Spectrogram, Melspectrogram) (0)	2020.01.21
Speech Emotion Recognition 연구 기록 (0)	2020.01.21

ABOUT ME

HanSeokhyeon.log HanSeokhyeon.log

0. 개요

1. Kaldi를 위해 필요한 패키지 설치

2. Cuda 설치 & gcc 버젼 설정

3. Jansson 설치

4. Github에서 kaldi 가져오기

5. Kaldi tools 컴파일

추가 - openfst-1.6.7 설치시 오류

추가

6. Kaldi src 컴파일

7. gst-plugin 컴파일

8. gst-kaldi-nnet2-online 컴파일

9. kaldi-gstreamer-server clone

10. DB 다운로드

11. Test

12. 결론

'ML > 음성인식' 카테고리의 다른 글

티스토리툴바

ABOUT ME

0. 개요

1. Kaldi를 위해 필요한 패키지 설치

2. Cuda 설치 & gcc 버젼 설정

3. Jansson 설치

4. Github에서 kaldi 가져오기

5. Kaldi tools 컴파일

추가 - openfst-1.6.7 설치시 오류

추가

6. Kaldi src 컴파일

7. gst-plugin 컴파일

8. gst-kaldi-nnet2-online 컴파일

9. kaldi-gstreamer-server clone

10. DB 다운로드

11. Test

12. 결론

'ML > 음성인식' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바