Keras深度学习框架配置

Please cite this paper(https://ejnmmires.springeropen.com/articles/10.1186/s13550-017-0260-9) if you found it useful. Thanks! Wang H, Zhou Z, Li Y, et al. Comparison of machine learning methods for classifying mediastinal lymph node metastasis of non-small cell lung cancer from 18F-FDG PET/CT images[J]. 2017, 7.

论文引用——3.2 测试平台

项目代码是在Windows 7上运行的,主要用到的Matlab R2013a和Python,其中Matlab用于patch的分割和预处理,卷积神经网络搭建用到了根植于Python和Theano的深度学习框架Keras。Keras是基于Theano的一个深度学习框架,它的设计参考了Torch,用Python语言编写,是一个高度模块化的神经网络库,支持GPU和CPU,用起来特别简单,适合快速开发。

直接上干货,拒绝走弯路

下载一个Anaconda Python Distribution; 网址: https://www.continuum.io/downloads#_windows

无脑安装,一直next

安装完成后,该有的基础包就都有了,安装完anaconda,就相当于安装了Python、IPython、集成开发环境Spyder、一些包等等。然后打开Anaconda Prompt,cd到 .py 文件的路径,输入“python **.py”,注意:这儿和cmd的命令相比多了一个“python”。要是你不加python,会提示错误:拒绝访问。

打开Anaconda Prompt,输入命令,就可以运行py文件了

在打开的Anaconda Prompt的命令行中输入“pip install keras",稍等片刻,keras直接就安装完了,好方便!

pip install keras

再接着输命令“conda install mingw libpython”,多等片刻,MinGW也就安装完了。

解决g++ not detected问题

最近我安装的时候感觉特别慢,有时候根本就没有进度,我怀疑是被墙了。

所以我默默地访问外国网站了,然后就有进度啦

接下来呢,开始装theano~三步走

1、下载theano的zip文件(https://github.com/Theano/Theano),解压到你电脑的.../Anaconda/Lib/site-packages/theano目录下,注意:原来这个site-packages里面本身就有一个叫做theano的东西,把它删了!替换成压缩包里的文件,并重命名为theano

2、添加环境变量: path: C:/Anaconda/MinGW/bin; C:/Anaconda/MinGW/x86_64-w64-mingw32/lib;

3、新建环境变量: PYTHONPATH: C:/Anaconda/Lib/site-packages/theano;

好了,理论上theano也安装成功了,测试一下看~在Anaconda Prompt的命令行中输入“python”,回车,然后输入“import theano”,回车。如果你看到“>>>”三个箭头,没有别的乱七八糟的东西了,就说明:你!安!装!成!功!啦!

至此,你已经可以运行keras的神经网络程序了,但是有一个小瑕疵:会警告你cl.exe找不到。你可以不理它,我提供解决方案是

去电脑的C盘目录下检索“cl.exe”,会出来几个cl.exe

靠谱的路径名是:C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin\x86_amd64

当然啰,前提是你电脑里面装了Visual Studio (VS),如果没装的话也没关系,装一下就好了啰。提供VS各个版本的免费下载地址:Visual Studio 各版本下载(http://blog.csdn.net/cometnet/article/details/19551125)

下载完,把搜索到的cl.exe的路径添加到系统路径Path里头,这个警告就会消失啦~

(可选)加速库CuDNN

从官网下载需要注册账号申请,两三天批准。网盘搜索一般也能找到最新版。

Windows目前就是cudnn-7.0-win-x64-v5.0-prod.zip。

下载解压出来是名为cuda的文件夹,里面有bin、include、lib,将三个文件夹复制到安装CUDA的地方覆盖对应文件夹,默认文件夹在:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA

添加环境变量: path: C:\Anaconda2;C:\Anaconda2\Scripts;

Cool,整个64位的python·keras就配置完成了,也就是说可以运行你的深度学习代码啰:)

至于说找keras的源代码,去这儿里随便挑一个,一般就用mnist_cnn.py。

如果你根据“干货”成功地配完了keras,那么就别往下看了,要是没成功,下面就是更加详细的步骤、遇到的错误和对应解决方案。供你参考:)

安装python

我选择的版本是2.7.11版本,注意了!不要装Python3.5.1,不然后续的深度学习配置各种坑。在Python的官方主页下载Python安装包。下载地址是:https://www.python.org/downloads/

下载2.7.11,不要追求最新的!!

选择64位!选择64位!选择64位!说三遍,不然到时候数据量大了就MemoryError了!

就是因为这个原因我要重新装python了!呵呵

我是Windows 7 64位的机子

当然喽,我当初没有装64位是有原因的,因为在运行mnist手写字体识别的神经网络时出现这个问题,那时我为了图简单,就干脆装了32位的python,哎,现在还得填坑!!!

64位的ImageDataGenerator会报错,但是你最后只要别用这个模块就好啦

在下载完成之后,一直点击下一步就OK了。注意:安装在系统盘!!

这儿选择just for me

在安装完成之后,我们需要手动添加环境变量:鼠标右键我的电脑 -> 属性 -> 点击高级系统设置 -> 点击环境变量 -> 点击PATH -> 在最后面加上我们的Python安装路径 -> 点击确定。反正就是Python27这个文件夹的系统目录

我的路径是:C:\\Python27

怎么看你有没有装成功咧,打开cmd命令行界面,输入python,返回了版本号,就可以啦

cmd怎么开我就不说了呗~

python安装成功!

安装pip

pip对于python就相当于apple store对于iPhone,是各个包的下载中心,刚刚下完的python相当于一个裸机,需要在pip里面下载一些深度学习需要的包~所以现在我们先下载安装pip。

同样需要在Python的官网上去下载,下载地址是:https://pypi.python.org/pypi/pip#downloads

自动跳转到这儿,下这个好了

下载完,解压到python27文件路径下

解压到这儿

打开,里面有一个setup.py,复制当前路径,在cmd下cd到这儿

cd C:\\Python27\\pip-8.1.1

到了C:\\Python27\\pip-8.1.1后,输入

python setup.py install

就酱,输两行代码

这种情况就是“没有配环境变量”!python安装的时候也一样

--------我是分割线---------

当然最近还出现了一个新的错误,就是这个

ImportError: No module named setuptools

要是你没遇到最好,直接跳到下一个分割线,遇到的话解决方法是:

直接用浏览器访问地址:https://bootstrap.pypa.io/get-pip.py,直接打开了get-pip.py的源代码,可以直接把内容拷贝出来,然后在本地创建get-pip.py。就是新建一个txt文档,粘贴内容,重命名成get-pip.py,注意:文件类型改成了.py

运行cmd,cd到get-pip.py所在目录(我是C:\\Python27),运行代码:

运行get-pip.py,安装完成

--------我是分割线---------

按照之前介绍的添加环境变量的方法,我们在PATH最后添加:

C:\\Python27\\Scripts;

然后看看到底pip安装成功了没,在cmd里面输入pip,会出现这个

good for u, 你成功了!

安装深度学习框架Keras

上面都是基本的准备东西,要是你已经跪在前面了,那。。只能。。自求多福:) 啰,我现在要开始正式讲keras怎么用了!

注意一点:python以及keras的所有代码都在cmd界面运行的

我们可以先看看现在python有些什么包,在cmd下输入:

pip list

现在有pip,setuptools,wheel这仨

我们需要先安装scipy和numpy这两个包,注意:这两的比较奇葩,用pip安装会给你出来一堆错误,建议用网上的scipy.exe和numpy.exe无脑装,省事儿。你可能在网上会看到whl等格式文件和所谓的去“官网”(http://www.numpy.org/)安装,我只能忠告一下:不要入坑。

numpy.exe 64位下载地址:http://vdisk.weibo.com/s/sTuT3rm3Mg2jC

scipy.exe 64位下载地址:http://download.csdn.net/download/feixueyinjiayue/9027923

也许scipy.exe需要注册账号,就提供一下我的这两个exe的百度云链接:numpy.exe、scipy.exe

下载完这两个exe,都是无脑安装的,一直摁next即可。然后在cmd下输入“pip list”查看是否安装完,如果成功了是这个界面

阶段性开心一下

接下来我介绍pip这个appstore怎么用。也就是一句话的事儿,在cmd中输入:pip install **(你想下载的包),回车就好了,确保有网,就可以自动开始下载安装啰,超级简单的。举例:

现在安装完scipy和numpy,我就可以下载安装keras了,就这样

pip install keras

这样keras就成功安装完了。

调试Keras

首先,你得有一个卷积神经网络的keras样例代码,一般来说比较推荐minst的,我可以提供代码和数据(https://pan.baidu.com/s/1nvla4TN#list/path=%2F),我想这个网站要成为下一步学习的垫脚石了,因为要开始小小地改代码了。

http://keras.io/

这个网站相当于keras的详细使用文档,是学习keras过程中避不开的参考

有了代码和数据,小改一下数据的路径,然后就开始解决一堆报错的问题了嘿嘿嘿:

错误1:sorry, unimplemented: 64-bit mode not compiled in

原因:32位的gcc不能编译64位程序。

解决方法:下载并安装64位gcc到E:\\MinGW\\bin,需要修改环境变量。(亲测不可行,呵呵)

错误2:'g++' is not recognized as an internal or external command.

我就是用我已经安装的codeblocks的g++.exe所在的路径放到环境变量里头就行了

错误3:TypeError: max_pool_2d() got an unexpected keyword argument 'mode'

这个就是keras内部的函数定义的时候形参多了一个“mode”,找到这个函数,把mode='average_exc_pad'这项删了即可;找函数的方法如下图,函数在theano_backend.py这个文件内(C:\\Python27\\Lib\\site-packages\\keras\\backend\\theano_backend.py),用搜索找到pool_out = downsample.max_pool_2d这个位置,把该删的删掉!

这个需要修改一下keras内部的代码~

--------我是分割线---------

如果实在遇到的坑太多,就换个方法,要是正常的话直接跳到下一个分割线就好了。

Anaconda python distribution 安装

下载一个Anaconda Python Distribution

网址:https://www.continuum.io/downloads#_windows

无脑安装,一直next

安装完成后,该有的基础包就都有了,安装完anaconda,就相当于安装了Python、IPython、集成开发环境Spyder、一些包等等。然后打开Anaconda Prompt,cd到py文件的路径,输入“python **.py”,注意:这儿和cmd的命令相比多了一个python。要是你不加python,会拒绝访问。

打开Anaconda Prompt,输入命令,就可以运行py文件了

然后在打开的Anaconda Prompt命令行中输入“pip install keras",这样keras直接就安装完了,好方便!

--------我是分割线---------

好了,我们继续填坑。

错误4:g++ not detected !

前提是我已经将E:\\Program Files (x86)\\CodeBlocks\\MinGW\\bin和lib, include加入系统路径了。呵呵

找不到g++!

解决办法:在[Anaconda2] 中输入命令“conda install mingw libpython”

成功解决g++ not detected问题

错误5:Exception: Compilation failed (return status=-1073741701)

错误提示长这样

-fPIC问题的解决(http://taoo.iteye.com/blog/1826912):看不懂,妈的

我的解决方法:首先不要用codeblocks的g++.exe,用Anacoda2中自带的MinGW的g++.exe,把这个路径加入环境变量

地址是C:\\Users\\Administrator\\Anaconda2\\MinGW\\x86_64-w64-mingw32\\bin,然后呢,错误提示变成了这样

error: CreateProcess: No such file or directory

对于这种错误4,错误5,我要提供一个终极解决方案啦!!!(不能忍了)

64位WIN7上成功安装theano,并运行了g++, GPU(http://blog.sina.com.cn/s/blog_990865340101hvuq.html)

我们已经安装完Anaconda了,然后现在要重!新!安!装!theano!

1、下载theano的zip文件(https://github.com/Theano/Theano),解压到.../Anaconda/Lib/site-packages/theano(文件里面有个theano的文件夹,拿出来放在E:/Anaconda/Lib/site-packages里面)目录下。

2、添加环境变量: path: E:/Anaconda/MinGW/bin;E:/Anaconda/MinGW/x86_64-w64-mingw32/lib;

(32bit E:/Anaconda/MinGW/i686-w64-mingw32/lib;)

新建环境变量: PYTHONPATH: E:/Anaconda/Lib/site-packages/theano;

g++.exe,theano这种问题完美解决!

至此,我所有的问题都顺利的解决了,你呢?是不是也可以成功地训练你的神经网络了呢?

历时72个小时,终于又看到了这个亲切的画面,开心死了!

写个彩蛋

对于64位的Anaconda,如果python要读入MATLAB的数据文件.mat,好像不能再用32位的那句代码了,因为会出现“Python.exe已停止工作”的错误。

sio.loadmat()不好使了

解决方法是换一个读入方法呗~

h5py.File()

这个函数有很多优点哦:

1、可以读入MATLAB Version 7.3 or later (save -v7.3) Variables can exceed 2GB on 64-bit systems ! 这个版本的mat文件能储存的数据量超级大。

2、 输入的矩阵就是mat内部存的形式,举例:mat文件里面有一个A(3*2)的变量,sio.loadmat()读入的是一个一维的(1*6)的数组,然后还得reshape()一下变成(3*2)的;h5py.File()直接就读入一个(3*2)的数组。

刚刚测试了一下花了我72小时的64·python·keras,真的可以利用的内存爆大诶!!!

你看!导入的训练集14w+,测试集20w+