개요
노트북에서 텐서플로우를 깔아 CPU만으로 사용하는데 아래와 같은 Warning Message가 뜨는 것을 발견했다. 실행해는 문제가 없는데 개발자들이면 들어봤을 SSE 명령어 셋등이 제대로 실행이 안될것을 생각하니 왠지 컴퓨터 성능을 십분 발휘하지 못한다는 생각이 들었다. 따라서 해결책을 검색해보니 텐서프로우 소스를 본인 PC환경해서 직접빌드하면 해결을 할 수 있다고 하여 내용을 살펴보고 정리하여 포스팅 한다.
텐서플로우 바이너리를 통한 설치는 다른 포스팅을 참고하면 좋을 듯 하다.
이 포스팅은 가장 마지막으로 2018년 2월 tensorflow r1.5, Ubuntu 14.04.5, Cuda 9.1, Cudnn 7.0.5에서 정상동작함을 확인했다.
텐서플로우 실행시 경고 메세지
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE3 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX2 instructions, but these are available on your machine and could speed up CPU computations.
W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use FMA instructions, but these are available on your machine and could speed up CPU computations.
관련 Github 이슈
https://github.com/tensorflow/tensorflow/issues/7693에서 정보를 찾을 수 있었다.
해결방법
텐서플로우 소스를 직접 받아 로컬 환경에서 빌드하면 –config=opt 옵션을 주고 빌드하면 본인의 로컬 환경에 맞는 텐서플로우 바이너리를 생성 할 수 있다.
바이너리 설치 대비 빌드 설치가 좋은점은?
- 위의 경고메세지가 뜨지 않는다.
- 최신 CUDA 드라이버나 cuDNN버전을 설정하여 설치할 수 있다.
- 아무래도 성능이 최적화 되지 않을까 하는 합리적 추측인데 직접 경험해보지는 못했다.
- 아직 정식 릴리즈 되지 않은 RC버전의 기능 사용이 필요하다면 시도해볼만 하다.
텐서플로우 소스를 빌드하여 설치하는 동영상
동영상으로 친절하게 설치를 진행하는 동영상이 공유한다. 이 동영상을 참고하는것이 가장 쉽고 필요한 부분은 아래의 코드스니펫을 copy & paste 하자.
소스 빌드 방법 정리
위 동영상과 텐서플로우 소스 빌드를 참고하여 설치를 진행하면 되지만 copy & paste 및 정보접근을 용이하기 위해 내용을 아래에 정리한다.
아래 설치는 파이썬 2.7 + CPU 사용의 가이드다. 파이썬 3.x는 아래에서 configure 명령 실행시 파이썬 위치를 3.x로 바꾸어 주면 된다. GPU 설치는 위의 링크를 참고하자.
텐서플로우 소스 클론
텐서플로우 소스를 직접 클론 받아 원하는 브랜치로 체크아웃 하면 된다. 필요한 사람은 1.1.0이 RC니까 그 버전으로 빌드해도 된다.
혹시나 실수할까봐 적어놓는 건데 (왜그런지는 모르겠으나) r1.5같은 리비전이 아니라 v1.5.0으로 체크아웃하면 bazel빌드가 제대로 되지 않는 것을 경험하였다. 참고하자.
$ git clone https://github.com/tensorflow/tensorflow
$ cd tensorflow
$ git checkout r1.0
# 2018년 2월 다시 설치할 일이 있어 찾아보니 현재는 버전이 1.5이다. 따라서 아래의 브랜치로 이동한다.
$ git checkout r1.5
Bazel 설치
Bazel 설치는 텐서플로우 홈페이지에 나온대로 링크를 따라가 설치하면 된다.
파이썬 의존성 설치
텐서플로우 빌드하기
2018년 2월 설치시 필자는 CUDA 9.1 + Ubuntu 14.04.5 + cudnn7.0.5로 셋팅했다.
cudnn 7 이후로 deb로 설치가 가능한데 설치 된 라이브러리 libcudnn.so.7 및 libcudnn.so.7.0.5는 /usr/lib/x86_64-linux-gnu 아래에 존재한다.
bazel 빌드하기
bazel 빌드를 돌린다.
$ bazel build --config=opt //tensorflow/tools/pip_package:build_pip_package
# r1.5 빌드실패 해결 버전
$ bazel build --config=opt --config=cuda tensorflow/tools/pip_package:build_pip_package --action_env="LD_LIBRARY_PATH=${LD_LIBRARY_PATH}"
혹시 r1.5 에서 빌드 시도시에는 아래와 같이 에러가 난다면 위의 빌드실패 해결버전으로 빌드한다.
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cublasGemmEx@libcublas.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocublasZhpmv_v2@libcublas.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cufftExecD2Z@libcufft.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocublasSrotg_v2@libcublas.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cufftExecR2C@libcufft.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocublasSsyrk_v2@libcublas.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cublasDgemm_v2@libcublas.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocufftSetWorkArea@libcufft.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cublasChemm_v2@libcublas.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocublasZher2k_v2@libcublas.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cufftExecC2C@libcufft.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocurandSetStream@libcurand.so.9.0' bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference to cublasDrotm_v2@libcublas.so.9.0'
bazel-out/host/bin/_solib_local/_U_S_Stensorflow_Spython_Cgen_Unn_Uops_Upy_Uwrappers_Ucc___Utensorflow/libtensorflow_framework.so: undefined reference tocurandSetPseudoRandomGeneratorSeed@libcurand.so.9.0
파이썬 whl 만들기
bazel 빌드 후 파이썬 pip설치용 whl을 만들어 /tmp/tensorflow_pkg 경로에 생성한다.
아래와 같이 확인해보면 whl이 생성된 것을 확인 할 수 있다. 파일명은 버전에 따라 달라질 수 있다.
virtualenv activate
기본 텐서플로우의 권장 사항인 virtualenv환경으로 들어간다. virtualenv를 사용하지 않는다면 넘어가도 된다.
pip로 텐서플로우 설치
pip를 통해 빌드된 텐서플로우를 설치한다.
텐서플로우 설치 확인하기
파이썬을 실행하여 텐서플로우가 제대로 설치되었는지 확인해보자.
아래 구문에 에러가 나지 않으면 제대로 설치가 된 것이다.