`
zhangyafei_kimi
  • 浏览: 261338 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

C++ Meta Programming 和 Boost MPL(3)

阅读更多

本系列全部转载自kuibyshev.bokee.com

1.
模板元编程的基本用途

1.1. 数值计算

上文提及的所有关于模板元编程的例子都是在编译时的数值计算,这是模板元编程的最简单直接的使用方法。数值计算主要利用模板的特化和局部特化能力进行递归演算,模板类被视为元函数,利用类中的一个静态常量保存结果。由于C++模板对非类型的参数有限制,一般只有整型和布尔型可以参加运算。元函数的结果一般放在一个静态的常量中,但对于整型而言还有一个更好的选择,可以放置在枚举中,其唯一的优点是静态常量是左值必须在运行期占有内存地址,也就是分配了内存空间,而枚举值不能作为左值,所以不占用内存空间,显得有些微的优势。这样,阶乘计算的例子可以改写如下:

#include <iostream>

template <unsigned n>

struct factorial

{

enum {

value = n * factorial<n-1>::value

};

};

template<>

struct factorial<0>

{

enum {

value = 1

};

};

int main()

{

std::cout<<factorial<6>::value<<std::endl; //6!=720

}

无论是编译期的递归还是运行期内存的节省,对比起模板元编程在数值计算上的不足,都显得有点得不偿失。主要有以下四点:

运算范围仅限于整型和布尔型,用途有限。

递归式的编程难于实行和理解。

C++编译器对编译期的递归都是有一定的限制的,C++标准建议进行17层递归实例化,这无疑不能满足稍复杂的程序。

大量消耗编译器资源的同时,降低了编译效率。

因此,用模板元编程作编译期数值计算并不在实践中经常使用,但它作为一个中心设施MPL库中发挥着重要的作用[6]

1.2. 解开循环(Loop Unrolling

当计算两个向量进行点乘,而维数不定时,例如:

int a[]={1,3,5,7};

int b[]={2,4,6,8};

考虑下面计算点乘的代码:

template <class T>

inline T dot_product(int dim, T* a, T* b) {

T result(0);

for (int i=0; i<dim; i++) {

result+=a[i]*b[i];

}

return result;

}

这里的代码很平常,但对于性能要求极高并大量使用点乘的应用程序,也许想再节省一点开销。如果能减少循环的计数,对性能也有比较可观的提升。这样代码应该展开以直接计算:

T result=a[0]*b[0]+a[1]*b[1]+a[2]*b[2]+a[3]*b[3];

但是我们希望泛化这个表达式,以便应用于不同维数的向量计算,这里,模板元编程正好可以发挥出它编译时计算和生成代码的能力。我们可以把代码改写成:

template <int DIM, class T>

struct DotProduct {

static T result(T* a, T* b) {

return *a * *b + DotProduct<DIM-1, T>::result(a+1, b+1);

}

};

//局部特化,用于结束递归

template <class T>

struct DotProduct<1, T> {

static T result(T* a, T* b) {

return *a * *b;

}

};

//包装函数

template <int DIM, class T>

inline T doc_product(T* a, T* b) {

return DotProduct<DIM, T>::result(a, b);

}

这种方法是定义了一个类模板DotProduct作为元函数,通过递归调用不断展开表达式,还定义了一个局部特化的版本,使它在维数递减到1时能够终结递归。

我们还留意到一个习惯,元函数都用struct而不是用class定义,这是因为struct中的成员可见性默认为public,在编写元函数时可以省却public:这个声明。

注意包装函数的接口已经改变,利用普通方法的函数是这样使用的:

doc_product(4, a, b);

现在的写法是:

doc_product<4>(a, b);

为什么不能使用相同的接口呢?原因是模板参数必须在编译时确定,所以DIM必须是一个常量,而不可能是一个变量。所以这是对此种编程技术的一个重大限制。当然,对于这类计算而言,向量的维数一般都能在编译时确定。

Todd Veldhuizen1995年第一次提出了这项技术,并且把这种技术运用到高性能数学计算的Blitz++库中。此外,在Blitz++库中还大量运用到一种称为表达式模板(Expression Template的技术,同样是为了减少线性代数计算中的循环次数和临时对象的开销。表达式模板尽管不属于模板元编程的范畴(因为它不是依赖编译时计算进行优化的),但它与模板元编程具有异曲同工的妙用,特别在高性能数学计算中能够发挥极大的用途。Todd Veldhuizen指出,通过这一系列的优化手段,C++在科学计算上的性能已经达到甚至超过Fortran的性能。

1.3. 类型处理

对类型的处理是模板元编程最重要和最具有现实意义的应用。由于模板可以接受类型参数,也可以通过typedef或定义内嵌类建立模板类的成员类型,再加以强大的模板特化的能力,使得类型计算几乎能有着数值计算所有的全部能力。

1.3.1. 类型分支选择

利用模板局部特化的能力,编译时的类型选择可以很容易做到:

//默认值,如果Ctrue就把第二个类型作为返回值

template<

bool C

, typename T1

, typename T2

>

struct if

{

typedef T1 type;

};

//局部特化,如果Cfalse就把第二个类型作为返回值

template<

typename T1

, typename T2

>

struct if<false,T1,T2>

{

typedef T2 type;

};

不过,有某些旧式编译器并不支持模板局部特化,这种情况下增加一层包装就可以巧妙地转为使用全局特化。

template< bool C >

struct if_impl

{

template< typename T1, typename T2 > struct result

{

typedef T1 type;

};

};

template<>

struct if_impl<false>

{

template< typename T1, typename T2 > struct result

{

typedef T2 type;

};

};

template<

bool C

, typename T1

, typename T2

>

struct if

{

typedef typename if_impl< C >

::template result<T1,T2>::type type;

};

元函数if是模板元编程中最简单但运用得最多的基础设施。

1.3.2. 类型的数据结构

把类型作为普通数据一样管理,这初看起来有点匪夷所思:普通数据可以运用struct或者array来组织,但C++并没有为类型提供一个专用的数据结构,可以利用的唯一设施是模板的参数列表。比如我们可以定义一个类型的数组如下

template <class a, class b, class c, class d, class e>

struct type_array;

但是为了使它真正像数组一样使用,还需要在其中定义一系列的typedef,比如某一下标的类型的提取等,类似于:

typedef a type1;

typedef b type2;

……

在这里,数组长度也无法动态变化是一个重大的缺陷。当然,有时候数组仍然是有用的,MPL就提供了一个框架为任何自定义的类型数据结构提供支持,下文会有所提及。现在先介绍一种更自动的类型组织方法——Typelist

2Typelist

上面提到过模板元编程是函数式的编程,参照其他一些函数式编程语言对数据的组织,很容易得到一些启发。比如在Scheme(一种LISP的变体)中,基本的数据结构是表,其他数据结构都必须用表的形式来表达。一个表可以这样定义:

”A” (“B” () (“C” () () ) ) (“D” () () )

这个表可以表示出一个二叉搜索树:

A

B

C

D

通过简单的表的递归,就可以构造出各种数据结构。注意到C++模板的实现体也是一种类型,利用类型的递归,同样的风格也可以吸收到模板元编程中。

Typelist的定义是很简单的:

template <class T, class U>

struct Typelist

{

typedef T Head;

typedef U Tail;

};

另外我们需要定义一个特殊的标记:

struct Nulltype;

这个无定义的类不能产生对象,它的存在仅仅为了提供一个结束的标记。现在我们定义一个Typelist,并在这一节里面反复使用:

typedef Typelist<int,

Typelist<float,

Typelist<long, Nulltype> > >

typelist;

这样的结构比起数组有什么优点呢?由于它的结构是递归的,我们可以很容易写一个通用的元函数提取它某一个位置的类型,我们甚至可以插入、修改和删除元素,然后返回一个新的Typelist

3)提取Typelist中的类型

如果需要按照位置来提取Typelist类型,可以定义这样一个元函数:

//声明

template <class List, unsigned int i> struct typeat;

//局部特化,当处理到需要提取的位置时,Head就是要返回的类型

template <class Head, class Tail>

struct typeat<Typelist<Head, Tail>, 0>

{

typedef Head result;

};

//如果未到需要提取的位置,在下一个位置继续递归

template <class Head, class Tail, unsigned int i>

struct typeat< Typelist<Head, Tail>, i>

{

typedef typename typeat<Tail, i-1>::result result;

};

这里使用了局部特化,对于不能支持局部特化的编译器,可以类似上面的if元函数的处理手法,适当修改这里的代码。

这个元函数按照以下方式调用:

typedef typeat<typelist, 0>::result result;

如果试图定义一个变量:

result a=<chmetcnv w:st="on" tcsc="0" numbertype="1" negative="False" hasspace="False" sourcevalue="1.2" unitname="F">1.2f</chmetcnv>;

编译器会抱怨无法把一个float类型转换为result类型,因为上面定义的typelist的第一个类型是int。而把下标0改为1以后,则可以编译通过,这证明元函数可以在编译时正确选择出所需的类型。

3 修改Typelist中的元素

实例化以后的模板已经成为一种类型,所以是不可能进行修改的,要达到修改的效果,唯一的方法是返回一种新的类型,使它带有新的Typelist

比如,如果要在一个已有的Typelist中添加一个类型,可以定义一个这样的元函数:

//声明

template <class List, class T> struct append;

//如遇到把空类型加入空类型,只需要返回 一个空类型

template <>

struct append<Nulltype, Nulltype>

{

typedef Nulltype result;

};

//如果把一个非空类型加入空类型,那么就可以直接返回

//一个只有一个元素的Typelist

template <class T> struct append <Nulltype, T>

{

typedef Typelist<T, Nulltype> result;

};

//如果把一个Typelist加入空类型,那么就可以

//直接返回这个Typelist

template <class Head, class Tail>

struct append <Nulltype, Typelist<Head, Tail> >

{

typedef Typelist<Head, Tail> result;

};

//当未到达Typelist尾部(遇到空类型)时,递归调用append元函数

template <class Head, class Tail, class T>

struct append <Typelist<Head, Tail>, T>

{

typedef Typelist<Head,

typename append < Tail, T>::result>

result;

};

这个append元函数不仅能插入一个类型,也可以把一个Typelist添加到另一个Typelist尾部。如果这样使用的话:

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics