9.1 使用C/C++库构建Fortran项目

NOTE:此示例代码可以在 https://github.com/dev-cafe/cmake-cookbook/tree/v1.0/chapter-9/recipe-01 中找到,其中有两个示例:一个是Fortran与C的混例,另一个是Fortran和C++的混例。该示例在CMake 3.5版(或更高版本)中是有效的,并且已经在GNU/Linux、macOS和Windows上进行过测试。

Fortran作为高性能计算语言有着悠久的历史。目前,许多线性代数库仍然使用Fortran语言编写,许多大型的数字处理包也保持与过去几十年的代码兼容。而Fortran提出了一个很自然的语法处理数值数组,它缺乏与操作系统交互,所以为了编程的通用性,需要一个互操作性层(使用C实现),才发布了Fortran 2003标准。本示例将展示如何用C系统库和自定义C代码来对接Fortran代码。

准备工作

第7章中,我们把项目结构列为一个树。每个子目录都有一个CMakeLists.txt文件,其中包含与该目录相关的指令。这使我们可以对子目录进行限制中,如这个例子:

  1. .
  2. ├── CMakeLists.txt
  3. └── src
  4. ├── bt-randomgen-example.f90
  5. ├── CMakeLists.txt
  6. ├── interfaces
  7. ├── CMakeLists.txt
  8. ├── interface_backtrace.f90
  9. ├── interface_randomgen.f90
  10. └── randomgen.c
  11. └── utils
  12. ├── CMakeLists.txt
  13. └── util_strings.f90

我们的例子中,src子目录中包括bt-randomgen-example.f90,会将源码编译成可执行文件。另外两个子目录interfaceutils包含更多的源代码,这些源代码将被编译成库。

interfaces子目录中的源代码展示了如何包装向后追踪的C系统库。例如,interface_backtrace.f90:

  1. module interface_backtrace
  2. implicit none
  3. interface
  4. function backtrace(buffer, size) result(bt) bind(C, name="backtrace")
  5. use, intrinsic :: iso_c_binding, only: c_int, c_ptr
  6. type(c_ptr) :: buffer
  7. integer(c_int), value :: size
  8. integer(c_int) :: bt
  9. end function
  10. subroutine backtrace_symbols_fd(buffer, size, fd) bind(C, name="backtrace_symbols_fd")
  11. use, intrinsic :: iso_c_binding, only: c_int, c_ptr
  12. type(c_ptr) :: buffer
  13. integer(c_int), value :: size, fd
  14. end subroutine
  15. end interface
  16. end module

上面的例子演示了:

  • 内置iso_c_binding模块,确保Fortran和C类型和函数的互操作性。
  • interface声明,将函数在单独库中绑定到相应的符号上。
  • bind(C)属性,为声明的函数进行命名修饰。

这个子目录还包含两个源文件:

  • randomgen.c:这是一个C源文件,它对外公开了一个函数,使用C标准rand函数在一个区间内生成随机整数。
  • interface_randomgen.f90:它将C函数封装在Fortran可执行文件中使用。

具体实施

我们有4个CMakeLists.txt实例要查看——根目录下1个,子目录下3个。让我们从根目录的CMakeLists.txt开始:

  1. 声明一个Fortran和C的混合语言项目:

    1. cmake_minimum_required(VERSION 3.5 FATAL_ERROR)
    2. project(recipe-01 LANGUAGES Fortran C)
  2. CMake将静态库和动态库保存在build目录下的lib目录中。可执行文件保存在bin目录下,Fortran编译模块文件保存在modules目录下:

    1. set(CMAKE_ARCHIVE_OUTPUT_DIRECTORY ${CMAKE_CURRENT_BINARY_DIR}/lib)
    2. set(CMAKE_LIBRARY_OUTPUT_DIRECTORY ${CMAKE_CURRENT_BINARY_DIR}/lib)
    3. set(CMAKE_RUNTIME_OUTPUT_DIRECTORY ${CMAKE_CURRENT_BINARY_DIR}/bin)
    4. set(CMAKE_Fortran_MODULE_DIRECTORY
    5. ${CMAKE_CURRENT_BINARY_DIR}/modules)
  3. 接下来,我们进入第一个子CMakeLists.txt,添加src子目录:

    1. add_subdirectory(src)
  4. src/CMakeLists.txt文件添加了两个子目录:

    1. add_subdirectory(interfaces)
    2. add_subdirectory(utils)

interfaces子目录中,我们将执行以下操作:

  1. 包括FortranCInterface.cmak模块,并验证C和Fortran编译器可以正确地交互:

    1. include(FortranCInterface)
    2. FortranCInterface_VERIFY()
  2. 接下来,我们找到Backtrace系统库,因为我们想在Fortran代码中使用它:

    1. find_package(Backtrace REQUIRED)
  3. 然后,创建一个共享库目标,其中包含Backtrace包装器、随机数生成器,以及Fortran包装器的源文件:

    1. add_library(bt-randomgen-wrap SHARED "")
    2. target_sources(bt-randomgen-wrap
    3. PRIVATE
    4. interface_backtrace.f90
    5. interface_randomgen.f90
    6. randomgen.c
    7. )
  4. 我们还为新生成的库目标设置了链接库。使用PUBLIC属性,以便连接到其他目标时,能正确地看到依赖关系:

    1. target_link_libraries(bt-randomgen-wrap
    2. PUBLIC
    3. ${Backtrace_LIBRARIES}
    4. )

utils子目录中,还有一个CMakeLists.txt,其只有一单行程序:我们创建一个新的库目标,子目录中的源文件将被编译到这个目标库中。并与这个目标没有依赖关系:

  1. add_library(utils SHARED util_strings.f90)

回到src/CMakeLists.txt:

  1. 使用bt-randomgen-example.f90添加一个可执行目标:

    1. add_executable(bt-randomgen-example bt-randomgen-example.f90)
  2. 最后,将在子CMakeLists.txt中生成的库目标,并链接到可执行目标:

    1. target_link_libraries(bt-randomgen-example
    2. PRIVATE
    3. bt-randomgen-wrap
    4. utils
    5. )

工作原理

确定链接了正确库之后,需要保证程序能够正确调用函数。每个编译器在生成机器码时都会执行命名检查。不过,这种操作的约定不是通用的,而是与编译器相关的。FortranCInterface,我们已经在第3章第4节时,检查所选C编译器与Fortran编译器的兼容性。对于当前的目的,命名检查并不是一个真正的问题。Fortran 2003标准提供了可选name参数的函数和子例程定义了bind属性。如果提供了这个参数,编译器将使用程序员指定的名称为这些子例程和函数生成符号。例如,backtrace函数可以从C语言中暴露给Fortran,并保留其命名:

  1. function backtrace(buffer, size) result(bt) bind(C, name="backtrace")

更多信息

interface/CMakeLists.txt中的CMake代码还表明,可以使用不同语言的源文件创建库。CMake能够做到以下几点:

  • 列出的源文件中获取目标文件,并识别要使用哪个编译器。
  • 选择适当的链接器,以便构建库(或可执行文件)。

CMake如何决定使用哪个编译器?在project命令时使用参数LANGUAGES指定,这样CMake会检查系统上给定语言编译器。当使用源文件列表添加目标时,CMake将根据文件扩展名选择适当地编译器。因此,以.c结尾的文件使用C编译器编译,而以.f90结尾的文件(如果需要预处理,可以使用.F90)将使用Fortran编译器编译。类似地,对于C++, .cpp.cxx扩展将触发C++编译器。我们只列出了C/C++和Fortran语言的一些可能的、有效的文件扩展名,但是CMake可以识别更多的扩展名。如果您的项目中的文件扩展名,由于某种原因不在可识别的扩展名之列,该怎么办?源文件属性可以用来告诉CMake在特定的源文件上使用哪个编译器,就像这样:

  1. set_source_files_properties(my_source_file.axx
  2. PROPERTIES
  3. LANGUAGE CXX
  4. )

那链接器呢?CMake如何确定目标的链接器语言?对于不混合编程语言的目标很简单:通过生成目标文件的编译器命令调用链接器即可。如果目标混合了多个语言,就像示例中一样,则根据在语言混合中,优先级最高的语言来选择链接器语言。比如,我们的示例中混合了Fortran和C,因此Fortran语言比C语言具有更高的优先级,因此使用Fortran用作链接器语言。当混合使用Fortran和C++时,后者具有更高的优先级,因此C++被用作链接器语言。就像编译器语言一样,我们可以通过目标相应的LINKER_LANGUAGE属性,强制CMake为我们的目标使用特定的链接器语言:

  1. set_target_properties(my_target
  2. PROPERTIES
  3. LINKER_LANGUAGE Fortran
  4. )