ZOL论坛 > 兴趣圈子论坛 > Z神通联盟论坛 > Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程
帖子很冷清,卤煮很失落!求安慰
返回列表
签到
手机签到经验翻倍!
快来扫一扫!

Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

574浏览 / 2回复

gaojie20

gaojie20

6
精华
124
帖子

等  级:Lv.5
经  验:3075
  • Z金豆: 206

    千万礼品等你来兑哦~快点击这里兑换吧~

  • 城  市:安徽
  • 注  册:2005-03-01
  • 登  录:2017-10-05
  • 身份验证
发表于 2017-07-17 02:46:34
电梯直达 确定
楼主

前言

正好前两天有玩家谈到了DL算法应用的装机需求,顾起此文聊一下深度学习的需求和WINDOWS10下的简单架设


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

GTX1080TI比GTX1080最大的提升是什么?


1、INT8/FP32的算法提升


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

anandtech放出了一张参数对比图表,其实仔细看是有点问题的,我就从这点问题说起。


FP64:计算双精度浮点运算。

FP32:计算单精度浮点运算。

FP16:计算半精度浮点运算。

INT8:8-bit的整数运算(一个字节),新增的增强8位整数支持是可以在一个周期内, 对打包在32-bit里的4个8位整数(记做:A0A1A2A3), 完成操作:Y = A0 * B0 + A1 * B1 + A2 * B2 + A3 * B3 + X其中Y和X均为32-bit整数, A和B均为8-bit整数,理论上INT8能以400%的性能(相比于float)完成8-bit整数的点乘和累加操作. 对最近流行的神经网络推导很有用途.


那来看看GTX1080TI GP102的各种运算的比值

FP64:FP32=1:32

双精度运算能力是单精度运算能力的1/32

FP16:FP32=1:64

半精度运算能力是单精度运算能力的1/64

INT8:FP32=4:1

INT8运算能力是单精度运算能力的4倍


GTX 1080 Ti获得了与Titan X相同的4:1 INT8性能比,这对于深度学习的神经网络推理性能至关重要。因此,GTX 1080 Ti实际上具有比Titan X更高的计算性能,除非需要Titan X提供的最后1GB显存,否则GTX 1080 Ti会更加划算,所以除了Titan Xp,GTX1080TI是无敌的存在了。

而1080的INT8是不是如图中NA描述的一点都没有呢?实际上不是的。


GP104 GTX1080


FP64:FP32=1:32

双精度运算能力是单精度运算能力的1/32

FP16:FP32=1:64

半精度运算能力是单精度运算能力的1/64

INT8:FP32=2:1

INT8运算能力是单精度运算能力的2倍


所以除了架构上的CUDA单元区别,对于INT8/FP32的性能增幅,GTX1080TI是GTX1080的两倍。这也是GTX1080TI对比GTX1080最大的提升了,其实游戏这些而言提升真的远不如INT8/FP32的翻倍提升来的明显。


2、CUDA的单元提升


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

GTX1080TI构架


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

GTX1080构架


GTX 1080 Ti提供了超过11.3 TFLOPS的FP32性能,着色/纹理性能比当前的GTX 1080提前28%,而ROP吞吐量优势为26%,内存带宽则大大增加了51.2%。

小结论:所以如果你只是要玩玩游戏的话,其实1080已经足够你玩了,1080TI对比1080的提升游戏不是重点,除非你要玩深度学习,否则你没啥必要从1080换到1080TI的。说道深度学习不得不说到由Python提供支持的领先的开放数据科学平台Anaconda已经支持WIN10 X64了,这解决了过去只能在LINUX下运行的尴尬,也给了大众一个进入深度学习的捷径。


那么我也拿一张GTX1080TI来晒个单顺便演示下如何在WIN10 X64下进行深度学习平台的搭建。


第一章、开箱


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

ZOTAC索泰旗下的PGF OC(玩家力量至尊 OC)显卡是他们目前的最高端产品,主打正反两面的1600色LED酷炫灯光和夸张的供电设计。GTX1080Ti-11GD5X PGF OC供电区域有16+2相供电,基本属于同类产品中供电数最夸张的之一,整卡功耗320W。


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

四面观


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

三年质保


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

型号为ZOTEC GTX1080TI-11GD5X PGF



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

拆箱就是附件盒



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

卡皇本体和显卡支架



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

正面



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

白色的LED灯管,三风扇设计



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

背面使用了带有透明镂空的金属镶嵌塑料的背板设计



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

POWER BOOST芯片



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

ZOTEC的MICROUSB调试接口



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

侧面看厚度是足足的三槽设计,虽然是双槽挡板



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

ZOTEC的LOGO灯


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

双8PIN外接供电


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

底部一样可以看到密集的热管阵列



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

3DP 1HDMI 1DVI的IO组合



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

前侧能看到四热管



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

这张卡其实是无比庞大的,单看卡真看不出,我拿出GTX1080公版一对比,就能看出,PGF这卡比1080公版可是粗壮太多了。


第二章、简测


测试平台:



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

CPU:INTEL XEON E5 2696 V3

主板:华擎X99E-ITX/AC已刷鸡血BIOS

内存:三星M391A2K43BB1-CRCQ  DDR4 2400 ECC 16GBX2

SSD:三星SM961 1TB

显卡:索泰PGF GTX1080TI 11GB DDR5X

散热:金钱豹4U+安耐美白蝠UCCL9

电源:酷冷V850/白色定制硅胶线

WIFI:INTEL 7260 AC


关于这个鸡血BIOS的特效如下:



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


特点是一次BIOS刷新之后,无需EFI分区写入微码终身有效!
我提供一下ASROCK X99E ITX/AC的鸡血BIOS下载:

链接: http://pan.baidu.com/s/1c2DziFm 密码: yyap

光效



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

关机状态



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

轻载状态:蓝灯



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

满载状态:红灯


GPUZ参数



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


3DMARK


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

FIRE STRIKE ULTRA 7009


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

TIME SPY 9578




Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

TIME SPY压力测试98.9



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

FIRE STRIKE ULTRA压力测试97.3



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

VRMARK BLUE ROOM 3135



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

VRMARK ORANGE ROOM 3135


温度测试



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

3DMARK FIRE STRIKE ULTRA测试最高温度64度



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

3DMARK FIRE STRIKE ULTRA压力测试最高温度65度



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

甜甜圈拷机了快一个小时,也就63度附近。

但是这不是最搞笑的,搞笑的是在裸奔平台上,除了甜甜圈和3DMARK稳定性测试之外,其他测试显卡满载,风扇竟然是不转的,害我以为风扇坏了。。。。。。这散热貌似做的也太变态了一些,温度确实控制得很低。


FIRESTORM



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

索泰的APP我就装了看了一下,不是超频党也不是游戏党,所以我主动掠过。


第三章、WIN10 X64平台下的深度学习入门搭建


WIN10 X64下搭建深度学习的平台而言,Anaconda For Windows会相对配置简单得多,可作为首选的入门搭建平台推荐,其实Anaconda官网也给了WIN10下的安装说明,但是版本出得太勤快了,版本插件多了兼容小问题也多起来了,别看就那么短短的几行代码,具体执行起来撞头破血流的不在少数,所以我亲测了一个WIN10 X64下的一条龙安装流程仅供参考。


1、安装Anaconda 4.3.1For Windows


Anaconda是由Python提供支持的领先的开放数据科学平台。 Anaconda的开源版本是Python和R的高性能分发版本,包括超过100个用于数据科学的最流行的Python,R和Scala软件包。



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


ANACONDA:https://www.continuum.io/downloads

Anaconda 4.3.1For Windows

Python 3.6 version 64BIT INSTALLER :https://repo.continuum.io/archive/Anaconda3-4.3.1-Windows-x86_64.exe


2、安装Python并且创建环境


Python是纯粹的自由软件,语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,允许你用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。

使用管理员权限打开Anaconda Prompt


输入


  1. conda create -n tensorflow python=3.5




Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

更新输入

  1. y

复制代码


此时安装进行更新。


3、激活环境


  1. activate tensorflow

复制代码



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


4、环境检验


输入

  1. conda info --envs

复制代码



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

如图星号对应你的安装目录为成功


5、安装tensorflow


TensorFlow?是使用数据流图进行数值计算的开源软件库。灵活架构允许使用单个API将计算部署到桌面,服务器或移动设备中的一个或多个CPU或GPU。TensorFlow最初是由Google机器智能研究机构的Google Brain团队研究人员和工程师开发的,用于进行机器学习和深层神经网络研究,但该系统普遍足以适用于各种其他领域。

填坑:首先要填坑是因为一个小bug,如果不解决的话,安装tensorflow时出现 “Cannot remove entries from nonexistent file c:programDataanaconda3libsite-packageseasy-install.pth”,因为setuptools版本27.2.0太低,tensorflow要求29.0.1,所以匹配上不兼容,使用以下命令忽略安装的 setuptools版本可以解决。

  1. pip install --upgrade --ignore-installed setuptools

复制代码


针对GPU安装,输入

  1. pip install --upgrade https://storage.googleapis.com/t ... cp35m-win_amd64.whl

复制代码


针对CPU安装,输入

  1. pip install --upgrade https://storage.googleapis.com/t ... cp35m-win_amd64.whl

复制代码


6、GPU tensorflow依赖库


前置任务:安装vc_redist.x64.exe


CUDA的正常运行需要VC++环境的支持。


https://download.microsoft.com/download/9/3/F/93FCF1E7-E6A4-478B-96E7-D4B285925B00/vc_redist.x64.exe


GPU tensorflow依赖库有两个,


第一个:CUDA 8.0


https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_win10-exe



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

下载后安装。


第二个:cudnn5.1


http://developer2.download.nvidia.com/compute/machine-learning/cudnn/secure/v5.1/prod_20161129/8.0/cudnn-8.0-windows10-x64-v5.1.zip



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

解压后呈现如上三个文件夹



Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

把这三个文件夹复制到CUDA8.0的安装目录文件夹内,如上图所示。


7、TensorFlow 运行样本测试


简单的矩阵乘法测试


  1. import tensorflow as tf  

复制代码

  1. hello = tf.constant('Hello, TensorFlow!')  

复制代码

  1. sess = tf.Session()  

复制代码

  1. a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')  

复制代码

  1. b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')  

复制代码


  1. c = tf.matmul(a, b)  

复制代码


  1. #Creates a session with log_device_placement set to True.  

复制代码

  1. sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))  

复制代码

  1. #Runs the op.  

复制代码


  1. print (sess.run(c))

复制代码


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

命令显示GTX1080TI已经被调用。


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

最终显示白体数字显示该计算成功。


8、点开Anaconda Navigator安装spyder


Spyder是Python作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程


Windows10 X64环境GTX1080Ti TensorFlow Deep Learning搭建教程

然后就可以愉快的进行样本测量以及程序编程了。


总结


如果你是游戏玩家,拥有一张GTX1070或者GTX1080,那么我觉得你没啥必要去换成1080TI,真话。如果算游戏效能的话,这个升级的CP值不算太高。

如果你有意从事深度学习方面的开发和神经网络训练的课程学习,那么INT8的性能就是你需要看重的一个方面,TITAN XP、TITAN X PASCAL、GTX1080TI的INT8/FP32都是GTX1080以及以下级别显卡的双倍,不差钱的话,CP值最高的GTX1080TI值得选择。


评分 收藏 +1

lololo

lololo


精华

帖子

等  级:Lv.1
经  验:222
发表于 2017-07-17 13:44:04 1楼
谢谢,学习了。

qq_o024177r1...

qq_o024177r1132


精华

帖子

等  级:Lv.1
经  验:63
发表于 2017-10-20 19:44:51 2楼

有没有linux环境的搭建教程

高级模式
论坛精选大家都在看24小时热帖7天热帖大家都在问最新回答

针对ZOL论坛您有任何使用问题和建议 您可以 联系论坛管理员查看帮助  或  给我提意见

快捷回复 APP下载 返回列表