7/29/2018

GTX960 과 GTX1050/1060 에 관해. 동영상 위주/ HEVC H265 동영상 인코딩에 대해/ 인텔 퀵싱크

몇 가지 찾아본 내용을 정리한다.

1.
게임성능으로 대표되는 기본 성능은
GTX1050 < GTX960 < GTX1060 이라 한다.
소비전력은
GTX1050 < GTX1060 < GTX960 인 것 같다. 현 세대가 나은데 이건 찾아봐야 한다.

구할 수 있는 값차이가 아주 많이 나지 않는다면 1050가라는 말도 검색된다.

현재 중고가는
GTX960 < GTX1050 < GTX1060 이라는 모양이다.
잠시 찾아 보니 GTX960의 중고가는 최소 7만원까지 가는 모양이다.
GTX1060은 암호화폐 채굴용으로 많이 쓰인다. 비디오램 6GB짜리가 제일 많이 사용되고, 그 다음이 비디오램 3GB짜리인 듯. 그래서 1060은 중고도 값이 비싼 편이고, 덕분에 라이트 게임용으로 컴퓨터를 꾸미는 사람들이 GTX1050을 사기도 했다고 한다. 그래서 2018년인 지금도GTX1050과 GTX960의 중고가가 벌어져 있는 것 같다.




2.
게임외적인 성능, 그러니까 관건인 동영상 인코딩의 경우, CPU인코딩보다는 무조건 빠르다. (특히 구세대 로우급CPU와 최신 보급형 GPU의 차이는 확실)
그런데 1050이나 1060이나 NVENC성능은 똑같단 소리가 있다. 다시 말해 동세대 같은 칩셋 계열이면 상위 모델이든 하위 모델이든 게임에 영향을 주는 코어갯수같은 건 달라도, NVENC 동영상 인코딩용 코어는 똑같은 게 똑같은 갯수만큼 들어가 있거나 GTX시리즈는 모두 2개만 활성화돼 있다는 소리가 있다. 다만 완전히 같지는 않고 지원하는 해상도가 고급, 하급 라인업이 다를 수 있음은 공식 사이트에서 확인할 수 있다. 어쨌든 어느 사이트에서 본 이 루머를 먼저 확인해 볼 일이다.

NVIDIA VIDEO CODEC SDK

https://en.wikipedia.org/wiki/Nvidia_NVENC
https://developer.nvidia.com/nvidia-video-codec-sdk

NVDEC와 NVENC은 현 세대에 와서는 CUDA코어와는 따로 동작한다(GTX750때는 CUDA코어를 사용했다고 한다). 그래서 동영상 디코딩, 인코딩 가속하면 GPU는 놀고 비디오 엔진(VE)은 일하는 모양을 GPU-Z같은 걸로 확인가능하다고 한다.

그럼 nVidia의 지포스 그래픽카드 모델 중 어떤 것이 어디까지 지원하는가? nVidia는 매우 불친절해서 그런 표는 여기에 없다. 그냥 코어 칩셋 코드명만 나열해 놓았다.
(나중에 표를 찾아 아래에 추가한다)

https://help.elgato.com/customer/portal/articles/2471964-which-nvidia-graphic-cards-do-support-nvenc-technology-
https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units#GeForce_600_series
: 지포스 600시리즈 이후부터 모델명 - 출시일 - 코드네임 등. 언제나 그렇듯이, 완전히 믿지는 말고 참고자료. 자기 VGA에 뭐가 박혀 있는 지는 카드 제조사, 판매사 정보와 GPU-Z같은 유틸리티로 직접 봐야 한다.



  • Kepler 세대 GPU는 예를 들어, GTX650을 말한다. H264 UYV 4:2:0 을 4K해상도까지 가속할 수 있다. 그 외 전부 안 된다.
  • Maxwell 세대 GPU는 1세대, 2세대가 나뉜다. 1세대(GM107 ?)는 H264 가속을 완전히 지원하고 H265 인코딩은 말이 없다. 2세대는 H265 YUV 4:2:0 을 4K해상도까지 지원한다는 모양.
  • 맥스웰 GM206 세대가 GTX950, GTX960인 모양이다. 모두 4K해상도까지 지원.
  • 내가 잘못 알고 있는 게 아니라면 Pascal 세대 GPU가 GTX1050, 1060이다. (GTX1030은 NVDEC은 지원해도 NVENC을 지원하지 않는다는 구절을 본 적 있다) 다 지원. 세부모델에 따라 최고해상도가 다르다. (초고해상도 TV영상 인코딩하는 사람들이 알아야 할 사항같다)
  • Volta GPU도 다 지원.

결국, 동영상 가속용으로 뭘 하나 산다면 GTX950, GTX960 중고면 가능하고, 완전하게 기능을 쓰고 싶다면 GTX1050, GTX1060 계열 신품이나 중고가 된다. 요즘건 짧은 프로파일로 나오는데 옛날건 긴 프로파일로 나와서 케이스가 작으면 그것도 고려할 요소. (케이스때문에 VGA를 바꾸는 것은 본말전도다. 케이스를 바꾸는 게 낫다)

※ 각 세대의 제일 아랫단 엔트리급은 마치 인텔의 엔트리급 CPU가 (지금도 그러는지 모르겠는데) 퀵싱크를 지원하지 않았던 것처럼 NVENC가 빠진 게 있고, 칩셋 자체를 구세대것으로 쓰면서 이름만 뒷세대로 만들기도 했다. 그 외 GTX750계열 모델 일부처럼 제조시기에 따라 사용 GPU 칩셋이 달라서 맨 나중에 만든 건 NVENC을 지원하는 것도 있다. 그래서, 비디오카드의 모니터 출력 해상도와 특성처럼, 동영상 인코딩을 어디까지 가속하느냐와 어떤 GPU칩셋을 썼느냐는 구입 전 각 모델에 대해 다시 확인해야 한다.

GTX650과 GTX950 을 비교한 2015년글(딱 3년 전) .
http://www.nowpug.com/review/278293


찾았다. 매트릭스
https://developer.nvidia.com/video-encode-decode-gpu-support-matrix
클릭하면 큰 그림으로 보인다.






3.
H264때도 그랬지만 H265에 와서도 CUDA나 NVENC는 CPU인코딩보다 질이 떨어진다는 말이 있다.
http://bombcat.egloos.com/6094367
https://namu.wiki/w/H.265, 동영상 인코더: 나무위키 항목

대충 품질은 CPU > CUDA > NVENC = QuickSync
대신 속력은 CPU << CUDA < NVENC = QuickSync
인 모양이다. (AMD의 CPU, GPU 인코더는 대중적인 무료 프로그램은 아직 지원하는 데가 적지만, 점점 늘어나고 있다고 하며 샤나인코더 게시판을 보니 추천도 올라온다.)
인텔 CPU에서 H265 지원은 디코딩은 하스웰, 인코딩은 스카이레이크의 퀵싱크 탑재 라인업부터라고 한다. nVidia GPU처럼 인텔 CPU도 구세대로 갈수록 해상도와 영상 조건이 붙어 있다고.

게임방송, 유튜브 업로드 등에는 CPU보다 GPU를 쓴 인코더가 좀 떨어져도(그래도 읽어 보니 H264때보다는 H265때가 좀 나아진 모양이다) 큰 문제는 안 된다고 한다. 업로드 후 어차피 서버에서 변환하기 때문에 최고로 정성들여 업로드해봐야 품질이 떨어지게 된다고. 그래서, 아예, CPU인코더로 얻을 수 있는 품질을 기준으로 용량이 더 큰 GPU인코더처리 영상을 만든 다음 그걸 올리는 게 훨씬 시간이 절약된다는 것이다. 일단 고성능 CPU를 쓴 것보다도 몇 배 이상 빠르다니까. 이러면 확실히, 실시간 스트리밍이라면 GPU가 낫네.


4.
반디캠의 인코더 도움말 웹페이지

인텔 퀵싱크 비디오 (윈도우 7이상, 퀵싱크 탑재 CPU)
https://www.bandicam.co.kr/support/tips/intel-quick-sync/
인텔 CPU의 내장 비디오칩셋을 활성화하기 위해서는 내장비디오 출력단자에 모니터를 연결해야 한다. (이건 기본, 옛날부터) 드라이버니 화면 해상도 설정 화면에서 모니터 감지하는 것이니 하는 것은 그 다음 이야기.

반디캠: HEVC인코딩:
인텔은 스카이레이크 이상(이 링크는 나우퍼그것. 스카이레이크 i5 퀵싱크 HEVC인코딩이 샌디 i5의 순수 CPU기반 HEVC인코딩과 비교해, 인코딩 옵션에 따라 10~20배나 빠르다는 리뷰), nVidia는 GTX950 이상, 중급 이상AMD. H264인코딩은 그 아래에서도 지원하기도 하지만 정확한 것은 카드 HW정도에 나온 칩셋 등 상세사양을 봐야 함.


5.
샤나인코더에서 HEVC인코딩 사용기 하나 링크.
https://shana.pe.kr/shanaencoder_qa/27073
HEVC 코덱 설정: 프리셋 ultrafast/fast/medium 의 차이.
용량차이없음. 화질변화는 (기록자가 보기에) 대단하지 않음. 그래서 이 사람은 ultrafast(가장 빠름)로 사용하고 있다고. 샤나인코더 기본값은 두 단계 느린 veryfast임.
대신 이 사람은 비트레이트 1450, 해상도는 1920x1080 full HD를 사용함. 즉, 저해상도로 CRF 인코딩해 전체화면 확대를 하는 환경이 아님.
글 말미에, 인텔 퀵싱크 인코딩은 엄청 빠르지만 제일 느린 프리셋으로 해도 샤나인코더보다 화질이 안 좋다고. (다만, 다른 사람의 평가처럼 비트레이트 여유있게 주고 고해상도 영상을 스트리밍하거나 업로드하는 데는 좋음. VGA에 비하면 CPU도 싸고_)


프리셋에 대해서는 아래글 참고. 약 2년 전에 나온 글.

How to Produce High-Quality H.264 Video Files
It's time for an H.264 tune-up. Lean how choose the right encoding tool and optimize H.264 encodes for ideal quality and device compatibility.
By Jan Ozer
http://www.streamingmedia.com/Articles/ReadArticle.aspx?ArticleID=94216&PageNum=1
http://www.streamingmedia.com/Articles/ReadArticle.aspx?ArticleID=94216&PageNum=2
용량은 같고 질이 달라짐. 질이 다르다는 것은 곧 인코딩 시간이 다르다는 말.
해당 글에서는 ultra fast에사 fast까지는 1할 정도 차이.
ultra fast와 medium은 2할 정도의 차이,
ultra fast와 slow는 3할 정도의 차이.
ultra fast에서 slower로 가면 거의 두 배 차이.
ultra fast와 placebo는 12배 정도 차이나며 느려진다고.

같은 사이트에 H265관련해서도 글이 있다. 그런데 그 글은 좀 이상해서.. ultrafast가 medium보다 질이 낫다는 글도 있어서 인용하지 않았다. 당시 공개된 소스의 버그였든가 리뷰의 문제같아서.


CRF 에 대해서, H264와 H265의 결과물 차이에 대해선 아래 링크 참고.
H.264 vs HEVC 변환 시험 결과 http://teus.me/453


6.
요즘은 staxrip, A's 등 다른 인코더도 있다고 함. virtualdub, mediacoder, 샤나인코더정도만 써본 내겐 좋은 정보.

7.
NVENC 화질향상 프리셋 (샤나인코더 4.9가 나오기 전 기준)
https://shana.pe.kr/shanaencoder_preset/49294
직접 입력하는 프리셋 옵션 설명

샤나인코더 설명 페이지. 인코딩 모드 설명, 무손실 인코딩
https://shana.pe.kr/shanaencoder_tip/1359


댓글 없음:

댓글 쓰기

ABC



어제 한 일, 하지 않은 일이 오늘 해야 할 일을 결정한다. 미뤄둔 일은 반드시 새끼친다. - ?

훌륭한 서비스에 대한 결과로 주어지는 것이 이윤이다. - 헨리 포드

생각날 때 귀찮더라도 백업해라. 내일 웃는다. - ?

매사 최적화는 좋은 습관이다. 시간을 가장 귀중히 여기는 습관은 더 좋다. - ?

네가 지금 자면 꿈을 꿀 것이다. 그러나 네가 지금 노력하면 꿈을 이룰 것이다. - ?

마감이 되어 급하게 일하는 것은, 밤새 술마시고 시험치는 것과 같다. 최선을 다해 시험봤을 지는 몰라도, 최선을 다해 공부하지는 않았다. 사는 것도 마찬가지다. 얄팍한 머리와 요행을 믿고 임기응변하는 데 맛들인다면, 인생도 어느덧 그렇게 끝난다. - ascii

위대한 생각을 길러라. 우리는 무슨 짓을 해도 생각보다 높은 곳으로는 오르지 못한다. - B. 디즈레일리

꿈의 크기는 자신이 성취할 수 있는 한계를 뛰어넘어야 합니다. 꿈에 압도되지 않는다면 그 꿈은 크지 않은 겁니다. - 앨런 존슨 설리프