전체 글
-
ESPnet 설치 및 CPU 예제 실행 (docker)ML/ESPnet 2020. 7. 22. 13:50
ESPnet은 speech와 관련된 다양한 태스크를 end-to-end로 해결하려는 툴킷이다. Speech에 대한 연구를 하고 있는 입장으로서 ESPnet에 대한 공부를 시작해볼까 한다. 첫번째로 시도할 것은 가장 중요한 설치이다. 대강 설치하는 방법을 읽어보니 역시나 복잡하다. 이리저리 쓰는 패키지도 많고 Kaldi도 쓰고 PyTorch도 쓰고 CUDA도 쓰고... 하지만 docker를 지원하기 때문에 그냥 docker image 받아서 사용하려 한다. github.com/espnet/espnet espnet/espnet End-to-End Speech Processing Toolkit. Contribute to espnet/espnet development by creating an account o..
-
Chapter 16 Natural Language Processing with RNNs and AttentionML/딥러닝 2020. 6. 18. 19:43
자연어 처리 태스크의 가장 흔한 접근방법은 RNN을 사용하는 것 문장에서 다음 문자를 예측하는 character RNN 텍스트의 나머지 정보 없이, 매 iteration마다 텍스트의 랜덤한 비율만 학습하는 stateless RNN 그다음은 stateful RNN, 학습하는 iteration들 사이에 hidden state를 보존하고 오른쪽으로 차례로 읽는 Sentiment analysis를 생성하는 RNN (영화 리뷰를 읽고 평가자의 감정을 추출하는) Encoder-Decoder 구조를 사용해 NMT 두번째 파트로 attention mechanisms Attention을 사용하는 RNN-based Encoder-Decoder 구조 Transformer GPT-2 and BERT Generating Sha..
-
Github에 내 코드 반영하기 (clone, add, commit, push)개발 환경/Github 2020. 5. 30. 21:45
Github를 사용하고자 마음을 먹었다면 github에 내 코드를 올리든가 이미 존재하는 코드를 수정해서 반영해야한다. 한번 방법을 알아보자. 0. git 다운로드 windows git-scm.com/download/win Git - Downloading Package Downloading Git Now What? Now that you have downloaded Git, it's time to start using it. git-scm.com Linux sudo apt-get install git macOS brew install git 1. git clone 레포지토리(저장소)를 내 로컬에 다운 받아보자. 다운 받고자하는 폴더에서 윈도우는 git bash를 키고(파일탐색기에서 우클릭하면 Git ba..
-
Docker, docker-compose에 원하는 GPU만 할당하기개발 환경/Docker 2020. 5. 21. 14:20
현재 내 서버에는 GPU가 2개 있는데 학습하고 있는 코드는 multi-gpu 코드가 아니다. 그러므로 2개의 GPU에 각각 코드를 돌린다면 2번의 실험을 동시에 할 수 있다. 그래서 docker-compose를 이용해 특정 GPU만 할당하는 방법을 알아보았다. 0. GPU 확인 nvidia-smi output: 1070 2개가 보인다. GPU index는 0부터 시작하여 2개니깐 1에서 끝난다. 1. docker docker run -e NVIDIA_VISIBLE_DEVICES=1 hsh0322/las-pytorch python3 train.py 위와 같이 -e NVIDIA_VISIBLE_DEVICES=(원하는 GPU number)로 옵션을 넣어주면 된다. 2. docker-compose version..
-
파이썬으로 맥에서 깨진 한글 파일명 복구개발 환경/Mac 2020. 5. 15. 14:39
네이버 메일에서 첨부파일을 다운 받았는데 파일명이 전부 깨져버렸다... 물론 그냥 들어가서 내용을 보면 파일명을 유추할 수 있고 문서를 읽는데는 아무런 문제가 없지만, 개발자의 욕심? 끈기?를 이용해 복구하는데에 성공했다. 0. 나의 환경 OS: macOS Catalina 10.15.4 상대방 OS: windows (추정) 브라우저: 사파리 (크롬으로 했을때도 깨진 상태로 받아진다.) 네이버 메일 1. NFC vs NFD? 이리저리 찾다보니 알게된 사실이다. Unicode를 정규화하는 방법이 있는데 맥과 윈도우는 그 방법이 서로 다르다. 맥: NFD (Normalization Form Canonical Decomposition) 윈도우: NFC (Normalization Form Canonical Com..
-
Chapter 9 Unsupervised Learning TechniquesML/딥러닝 2020. 5. 7. 15:17
대부분의 머신 러닝 기술들이 supervised learning에 기반하여 발달하고 있지만, 사실 대부분의 데이터는 라벨링이 되어 있지 않다. Input feature X가 존재하지만 라벨 y는 존재하지 않는다. 세상 대부분의 문제들이 unsupervised인 경우가 많으므로 unsupervised learning은 큰 잠재력을 내포하고 있다. 생산 라인에서 제품의 사진을 가져와서 제품의 결함을 발견하는 시스템을 만든다고 하자. 자동으로 사진을 찍는 시스템을 만들면 하루에 수천장의 사진을 얻을 수 있을 것이다. 몇 주 동안 사진을 계속 찍는다면 매우 큰 데이터셋을 만들 수 있을 것이다. 그러나 라벨이 없다. 만약 결함이 있는지 없는지 판단하는 binary classifier를 만든다면, 'defectiv..
-
Windows Terminal 기본 프로필 바꾸기개발 환경/Windows 2020. 4. 27. 17:13
MS에서 Windows terminal을 현재 0.7 preview 버전으로 공개해놨다. 다운로드는 Microsoft Store에서 terminal 검색하면 받을 수 있다. 사용하다보니 default로 열리는 terminal이 power shell이라 불편했다. 그래서 바꾸는 법을 찾아보았다. 1. settings.json 열기 위와 같이 설정을 누르면 settings.json이 메모장어플로 열린다. 2. defaultProfile 변경 위쪽에 보면 "defaultProfile": "{c6eaf9f4-32a7-5fdc-b5cf-066e8a4b1e40}", 라는 특성이 존재한다. 여기서 뒤에 guid를 내가 원하는 프로필로 바꿔주면 된다. guid는 밑에 프로필들 나와있는 곳에서 알 수 있다.