Jupyter Notebook 설치 및 셋팅
머신러닝 관련 코드를 작성해보기 위해 환경을 세팅해보자. 다른 방법들도 많겠지만 가장 많이 쓰는 주피터 노트북을 설치하고 파이썬 패키지를 어떻게 관리할 것인지를 살펴보도록 하자.
주피터 노트북
주피터 노트북(jupyter notebook)은 웹 브라우저에서 파이썬 코드를 작성하고 실행까지 해볼 수 있는 REPL방식의 개발도구이다. 머신러닝이나 데이터분석 용도로 파이썬을 사용하는 사람들이 사용하는 툴로써 가벼우며 코드를 실행하고 수정하기가 간편하다. 또한 notebook형태로 파일이 공유가 가능하다.
REPL(Read–Eval–Print Loop) : 명령어를 한줄씩 입력하며 실행 상황을 지켜보는 방식(대화형)
먼저 파이썬을 설치하자. 파이썬이 이미 설치가 되어있다면 생략 하자.
파이썬 pip를 설치한 후 pip install jupyter
로 주피터 노트북을 설치 할 수 있지만 일반적으로 아나콘다(Anaconda)
를 설치하면 Jupyter Notebook
이 함께 설치되어 주피터를 사용할 수 있다. 물론 pip
를 이용하면 원하는 패키지만 그떄 그때 설치하여 사용할 수는 있지만, 아나콘다를 설치하면 데이터 처리 및 분석에 필요한 패키지가 모두 포함되어 설치가 되기 때문에 약간 설치시간이 오래 걸리긴 하지만 아나콘다를 사용하는 것을 추천한다.
아나콘다(Anaconda) 설치
이 글에서는 Ubuntu18.04 기준으로 설명하도록 하겠다. 또한 최신버전을 위해 반드시 아나콘다 사이트에서 최신 URL을 확인하여 설치를 진행하길 바란다.
계속 엔터를 눌러 설치한다(bashrc등록 여부는 Y로 입력해준다 - 그렇지 않으면 수동설정)
아나콘다(Anaconda) 공식홈 참고
설치 확인
만약 삭제하길 원한다면…
주피터 노트북 실행
화면에 출력된
http://localhost:8888/?token=***
으로 접속하면 된다.
(jupyter notebook --generate-config
명령으로jupyter_notebook_config.py
파일을 생성하면 해당 파일에서 세부설정이 가능하다.)
접속화면
우측 상단에 New > Python3를 선택하면 새로운 창이 생성된다.
이제 웹상에서 파이썬 코드를 작성하고 실행 할 수 있다.
matplotlib 패키지를 이용하여 가공된 데이터를 그래프로 표현 할 수 있다.
주피터 노트북은 개인 로컬환경에 설치하여 직접 띄울수도 있지만, Microsoft에서는 azure notebook, Google에서는 Colab에서 클라우드상의 주피터환경을 제공해주고 있으니 간단한 학습용로라면 이를 활용하는 방법도 좋을 것이다. 공짜다!
(주피터 노트북 사용법에 대한 부분은 다루지 않겠다.)
더 살펴보자…
아나콘다 가상환경
개발을 위한 파이썬 패키지 가상환경을 별도로 만들고 싶다면 conda에서 지원하는 명령어로 사용이 가능하다. 만약 아나콘다를 사용하지 않고 pip
를 사용한다면 virtualenv
로 가상환경을 관리 할 수 있다.
가상환경을 선택하여 활성화를 하게 되면
(가상환경명) winuss@ubuntu:~$
와 같이 프롬프트 앞에 해당 가상환경명이 표시가 된다. 이후 패키지를 설치하게 되면 활성화된 가상환경에만 패키지가 설치가 된다.
다시 가상환경을 비활성화하거나 삭제하려면,
파이썬에서는 한 라이브러리에 대해 하나의 버전만 설치가 가능한데 이는 여러개의 프로젝트를 진행하게 되면 문제가 될 수 있다. 작업을 바꿀때마다 다른 버전의 라이브러리를 설치해야 해야 하는 번거러움을 방지하기 위해 독립된 가상환경이 필요한 것이다.
아나콘다에 패키지 설치
가상환경을 활성화 하지 않고 가상환경명을 지정하여 패키지를 설치 할 수도 있다. mytest
라는 가상환경에 tensorflow
를 설치 및 삭제를 해보자.
주피터 확장기능 설치
주피터 확장기능을 사용하면 좀더 편리한 기능들을 사용할 수 있다.
확장을 활성화 하려면
Nbextensions 탭
을 클릭하거나 http://localhost:8888/nbextensions에서 확인 할 수 있다.
참고