配置Ubuntu中GDAL的Docker环境

  本文介绍在LinuxUbuntu操作系统中,基于Docker快速配置PythonC++2种不同编程语言可用的地理数据处理库GDAL开发环境的方法。

  本文就将PythonC++2种不同编程语言的GDAL模块配置方法分开来介绍,大家依据自己的需求来选择即可——但无论是哪种方法,配置GDAL模块的方法都非常简单,终端中输入几句代码就完成了。和我们之前在Windows系统中配置GDAL模块的文章更新:Visual Studio配置C++的GDAL库比起来,真的是方便了很多。

1 Python版本

  首先,我们访问GDAL库的Docker镜像官方网站(https://github.com/OSGeo/gdal/tree/master/docker)。这里需要注意,虽然这个官方网站似乎并没有明确说明它提供的版本只能Python使用,但是我这里下载后发现C++代码确实无法调用这个镜像中的GDAL模块。

  其中,官方网站提供了AlpineUbuntu两种不同系统的Docker镜像;并且对于不同的系统版本,其还提供了SmallFull两种不同的镜像内容,其中前者包含的内容相对较少,而后者包含的内容较为齐全(因此后者的镜像大小也就更大一些),而这两种镜像自身都是包含Python3.8或以上版本的。此外,关于SmallFull两种不同镜像的具体详细内容差异,我们这里就不再赘述了,大家在其官方网站查阅即可;具体如下图所示。

  在我这里,由于只是需要用GDAL库完成一些读取.tif格式文件的操作,所以并不需要特别完整的GDAL库,所以就选择了Small这个小一点的版本。

  接下来,我们在Ubuntu电脑的终端中执行如下的代码。这里需要注意,由于我需要的是Ubuntu系统的Small版本,所以我就输入如下的代码即可;如果大家使用的是Alpine操作系统,或者是Ubuntu系统的Full版本,那么按照上图中自己所需要的版本对应的名称,修改下述代码并执行即可。

代码语言:javascript
复制
docker pull ghcr.io/osgeo/gdal:ubuntu-small-latest

  运行上述代码,如下图所示。

  稍等片刻,我们就完成了镜像的获取。此时,我们可以通过如下的代码,查看当前电脑中Docker镜像的下载情况(也就是看看我们已经有了哪些镜像)。

代码语言:javascript
复制
docker images

  运行上述代码,如下图所示。

  其中,那个ghcr.io/osgeo/gdal就是我们刚刚下载好的GDAL库的镜像。

  接下来,运行如下的代码,从而基于刚刚下载好的镜像运行一个容器。

代码语言:javascript
复制
docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest

  其中,docker run是运行容器的命令,-it表示以交互模式运行容器,并分配一个终端,--rm表示在容器停止后自动删除容器(如果大家在使用容器后不想让它自动删除,就将这里的--rm去掉即可;如果大家是第一次接触Docker,那么建议带上这个--rm,防止自己摸索过程中不知不觉建立了好多个无用的容器,到时候还要手动一个一个删除);后面的就是我们刚刚下载好的镜像,表示我们要基于这个镜像去运行一个容器。运行上述代码,如下图所示。

  接下来,我们就进入了容器。此时,继续输入如下的代码,查看当前容器中GDAL库的版本信息。

代码语言:javascript
复制
gdalinfo --version

  运行上述代码,如下图所示。可以看到,此时将打印出我们GDAL库的版本信息。

  接下来,我们先通过如下的代码,退出当前镜像,回到终端中。

代码语言:javascript
复制
exit

  运行上述代码,如下图所示。

  我们既然配置了一个GDAL库的Docker镜像,那么后续肯定是需要将一些我们自己电脑中的文件(比如栅格图像、矢量数据等文件)带入到这个镜像的容器中去运行,所以肯定需要这个GDAL库的Docker镜像要和我们Ubuntu电脑中文件可以交互(换句话说,也就是可以读取、修改我们电脑中的文件与数据)。因此,我们在之后进入我们这个GDAL库的Docker镜像的容器时,需要通过如下的代码。

代码语言:javascript
复制
docker run -it --rm -v /home/dell/cppGDAL:/home/dell/cppGDAL ghcr.io/osgeo/gdal:ubuntu-small-latest

  上述代码和我们前面的docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest相比,很显然是多了-v /home/dell/cppGDAL:/home/dell/cppGDAL这一个部分——这一部分是用于挂载主机文件系统中的目录容器中的命令参数。其中,-vDocker命令中用于挂载文件或目录的选项,其后面的/home/dell/cppGDAL:/home/dell/cppGDAL,则是文件挂载的源目录和目标目录的路径——它指定了主机文件系统中的/home/dell/cppGDAL目录将被挂载到容器内的/home/dell/cppGDAL目录。

  这里多提一句,我们这里是将主机中的一个指定文件路径挂载到了容器中,所以属于Docker中的Bind mounts;如果我们这里是手动创建了一个Volume,然后挂载到容器中,那么就叫做Volume;此外还有一种叫做tmpfs mounts,是把容器的数据写入主机的内存中——上述的Bind mountsVolumetmpfs mounts,这3种都是Docker用以数据管理、数据记忆的方式。

  回到前述的代码。换句话说,上述命令将我的Ubuntu电脑中的/home/dell/cppGDAL目录与GDAL库的Docker镜像的容器中的/home/dell/cppGDAL目录进行了挂载。这样,在容器中对挂载点/home/dell/cppGDAL的操作将反映在主机系统的/home/dell/cppGDAL目录上,反之亦然。

  相当于通过这种方式,只要我将我需要用GDAL库处理的数据、代码等文件,都放在电脑的/home/dell/cppGDAL目录下,那么就可以在容器中对这些数据加以访问和处理。这样即实现了文件的交互,同样可以保证容器不会访问我们电脑中其他文件夹内的数据或者文件,保证了数据的安全。

  如果大家还是没有明白这句代码的意义,不着急,我们先运行上述代码,如下图所示。

  上图中运行完代码,我又不小心多运行了一句pwd代码,大家理解即可。

  为了更清晰地看到前述那一种进入容器的代码的意义,我们做一个如下的对比。如下图所示,这是我们用了那一句包含挂载文件夹命令的代码,进入我们的容器后,执行的操作;可以看到,此时在容器中,我们就可以进入/home/dell/cppGDAL目录下。

  而如果我们并没有挂载文件,而是用了本文中第一次出现的那一句代码进入容器的代码,也就是前面的docker run -it --rm ghcr.io/osgeo/gdal:ubuntu-small-latest代码,进入容器后会发现,cd进入home文件夹后,再ls,是看不到我们这个cppGDAL文件夹的;换句话说,此时我们就没有办法在容器内部读取我们电脑里/home/dell/cppGDAL目录下的文件了——连文件、数据都无法获取,那么这个GDAL镜像肯定也是没有用处的了。

  此外,前面我们还提到,-v /home/dell/cppGDAL:/home/dell/cppGDAL这一个部分可以保证镜像可以且仅可以读取/home/dell/cppGDAL目录下的文件,而不会读取到我们没有挂载的其他文件夹。针对这一个内容,我们再做一个对比。如下图所示,是我们直接在Ubuntu电脑的终端中,进入/home/dell目录的情况;可以很明显地看到,在电脑中的/home/dell目录下,不仅有我们的这个cppGDAL文件夹,还有很多很多其他的文件或者文件夹;而在上上图中,可以看到在容器中,我们进入/home/dell/cppGDAL目录下只能看到这个cppGDAL文件夹,而看不到电脑中这一路径下原本还有的其他文件或者文件夹。所以很明显,相当于我们就是可以在镜像中访问/home/dell/cppGDAL目录,但是无法访问没有挂载的其他文件夹,从而保证了其他无关文件夹的安全性。

  明白了上述内容,就可以开始我们的GDAL操作了。例如,我这里在/home/dell/cppGDAL目录下还有一个名称为TIF的文件夹,其中保存了一景遥感影像,那么我就可以通过gdalinfo语句,查看这一栅格数据的信息。如下图所示。

  最后,每一次完成镜像中的操作后,不要忘记通过exit命令,退出镜像。

  因为我这里是需要C++版本的GDAL模块,所以后来也就没有对上述Python版本的再加以代码测试;但经过上述配置,运行Python代码的GDAL程序应该是没有问题了。

2 C++版本

  接下来,我们介绍配置C++版本的GDAL模块的方法。

  由于GDAL官方似乎并未提供直接的C++版本镜像,所以我们这里就自己创建一个Docker镜像,随后在其中配置GDAL模块。这里需要注意,如果大家刚刚根据前文的流程,先配置了一个Python语言的GDAL模块的镜像,那么建议大家在另一个新的镜像内重新配置C++版本的,不要直接在前面的Python语言镜像中配置GDAL模块——因为官网说,在前面这个Python语言的GDAL模块的镜像内配置其他版本的GDAL模块,会容易由于GDAL模块的版本冲突导致容器无法工作(虽然我当时简单尝试了一下,发现即使如此,容器似乎还是可以正常工作的)。

  我们这里就在一个新的Ubuntu镜像中加以配置。首先,在终端中输入如下代码,创建一个Ubuntu镜像。

代码语言:javascript
复制
docker pull ubuntu

  运行上述代码,如下图所示。

  接下来,我们用前文提到的这一句代码,运行一个容器。这里我就不再用--rm了,从而使得我们这个容器之后可以多次重复使用。

代码语言:javascript
复制
docker run -it -v /home/dell/cppGDAL:/home/cppGDAL ubuntu:latest

  运行上述代码,如下图所示。

  接下来,因为我们这个容器是基于一个空白的Ubuntu镜像创建的,很多执行GDALC++代码所需的配置都没有处理,我们需要配置一下基本的环境。

  首先,通过如下代码更新软件包列表

代码语言:javascript
复制
apt update

  运行上述代码,如下图所示。

  随后,输入如下的代码,配置GDAL模块的C++库。其中,libpq-devPostgreSQL数据库的开发库,包含了开发PostgreSQL应用程序所需的头文件和静态库;gdal-binGDAL的二进制工具包,提供了一些用于处理地理空间数据的工具,如转换、裁剪等;libgdal-devGDAL的开发库,包含了开发GDAL应用程序所需的头文件和静态库。

代码语言:javascript
复制
apt install libpq-dev gdal-bin libgdal-dev

  运行上述代码,如下图所示。

  稍等片刻,中间有一个环节需要我们根据自己所在位置加以选择,从而配置自己的时区;如下图所示。

  完成配置后,通过如下的代码查看GDAL库的版本。

代码语言:javascript
复制
gdalinfo --version

  运行上述代码,如下图所示。

  接下来,我们再按照文章几句代码部署Linux系统Ubuntu的C++环境介绍的方法,配置UbuntuC++代码开发环境,这里就不再赘述了。

  随后,我们就可以在Docker中执行一个简单的C++程序,来验证这个GDAL库的配置是否成功。其中,我们因为已经挂载了文件夹,所以既可以在主机中通过其他编辑器来撰写这个C++代码,也可以在容器中通过Vim来撰写。但无论怎么撰写,都要记得将这个代码文件(也就是.cpp格式的文件)放在已经挂载了的文件路径内。

  这个简单的C++代码如下;其含义就是,从我们已经挂载了的主机的一个文件夹中,读取一景栅格影像,获取并打印其像元的行数与列数。

代码语言:javascript
复制
#include <iostream>
#include <gdal/gdal.h>
#include <gdal/gdal_priv.h>
using namespace std;

int main() {
const char* image_path = "/home/cppGDAL/TIF/LAI_A2000057_h30v05.tif";
GDALAllRegister();
GDALDataset* dataset = (GDALDataset*)GDALOpen(image_path, GA_ReadOnly);
if (dataset != nullptr)
{
int rows = dataset->GetRasterYSize();
int cols = dataset->GetRasterXSize();

    printf(&#34;Rows: %d\n&#34;, rows);
    printf(&#34;Cols: %d\n&#34;, cols);

    GDALClose(dataset);
}
return 0;

}

  随后,在容器内的上述代码文件目录下,执行如下的代码。

代码语言:javascript
复制
g++ gdal-config --cflags rec.cpp  gdal-config --libs gdal-config --dep-libs -o test

  其中,g++GNU C++编译器的命令,用于编译和链接C++代码。gdal-config --cflags表示使用gdal-config命令获取GDAL库的编译选项,包括头文件路径和其他必要的编译标志;--cflags参数告诉gdal-config命令返回编译选项。rec.cpp是要编译的C++源文件的文件名,也就是前面我们写的代码文件的文件名称。需要注意的是,上述代码中没有单引号,而都是反引号,大家输入的时候不要输错了。

  其次,gdal-config --libs使用gdal-config命令来获取GDAL库的链接选项,包括库文件路径和其他必要的链接标志;--libs参数告诉gdal-config命令返回链接选项。gdal-config --dep-libs使gdal-config命令来获取GDAL库所依赖的其他库的链接选项;--dep-libs参数告诉gdal-config命令返回依赖库的链接选项。

  最后,-o test是编译器选项,用于指定生成的可执行文件的名称为test-o选项后跟着要生成的可执行文件的名称。

  完成上述步骤,在当前目录下就会有一个可执行文件,名称为test。我们执行如下的代码,就可以执行这个可执行文件

代码语言:javascript
复制
./test

  运行上述代码,如下图所示。

  可以看到,已经可以打印出这一景遥感影像的像元行数与列数了。

  至此,大功告成。