C#泛型相关讲解
我们在编写程序时,经常 遇到两个模块的功能非常相似,只是一个是处理int数据,另一个是处理string数据,或者其他自定义的数据类型,但我们没有办法,只能分别写多个方法 处理每个数据类型,因为方法的参数类型不同。有没有一种办法,在方法中传入通用的数据类型,这样不就可以合并代码了吗?泛型的出现就是专门解决这个问题 的。读完本篇文章,你会对泛型有更深的了解。
为什么要使用泛型 为了了解这个问题,我们先看下面的代码,代码省略了一些内容,但功能是实现一个栈,这个栈只能处理int数据类型:
public class stack
{
private int[] m_item;
public int pop(){...}
public void push(int item){...}
public stack(int i)
{
this.m_item = new int[i];
}
}
上面代码运行的很好,但是,当我们需要一个栈来保存string类型时,该怎么办呢?很多人都会想到把上面的代码复制一份,把int改成 string不就行了。当然,这样做本身是没有任何问题的,但一个优秀的程序是不会这样做的,因为他想到若以后再需要long、node类型的栈该怎样做 呢?还要再复制吗?优秀的程序员会想到用一个通用的数据类型object来实现这个栈:
public class stack
{
private object[] m_item;
public object pop(){...}
public void push(object item){...}
public stack(int i)
{
this.m_item = new[i];
}
}
这个栈写的不错,他非常灵活,可以接收任何数据类型,可以说是一劳永逸。但全面地讲,也不是没有缺陷的,主要表现在:
当stack处理值类型时,会出现装箱、折箱操作,这将在托管堆上分配和回收大量的变量,若数据量大,则性能损失非常严重。 在处理引用类型时,虽然没有装箱和折箱操作,但将用到数据类型的强制转换操作,增加处理器的负担。 在数据类型的强制转换上还有更严重的问题(假设stack是stack的一个实例): node1 x = new node1();
stack.push(x);
node2 y = (node2)stack.pop();
上面的代码在编译时是完全没问题的,但由于push了一个node1类型的数据,但在pop时却要求转换为node2类型,这将出现程序运行时的类型转换异常,但却逃离了编译器的检查。
针对object类型栈的问题,我们引入泛型,他可以优雅地解决这些问题。泛型用用一个通过的数据类型t来代替object,在类实例化时指定t的类型,运行时(runtime)自动编译为本地代码,运行效率和代码质量都有很大提高,并且保证数据类型安全。
使用泛型 下面是用泛型来重写上面的栈,用一个通用的数据类型t来作为一个占位符,等待在实例化时用一个实际的类型来代替。让我们来看看泛型的威力:
public class stack<t>
{
private t[] m_item;
public t pop(){...}
public void push(t item){...}
public stack(int i)
{
this.m_item = new t[i];
}
}
类的写法不变,只是引入了通用数据类型t就可以适用于任何数据类型,并且类型安全的。这个类的调用方法:
//实例化只能保存int类型的类
stack<int> a = new stack<int>(100);
a.push(10);
a.push("8888"); //这一行编译不通过,因为类a只接收int类型的数据
int x = a.pop();
//实例化只能保存string类型的类
stack<string> b = new stack<string>(100);
b.push(10); //这一行编译不通过,因为类b只接收string类型的数据
b.push("8888");
string y = b.pop();
这个类和object实现的类有截然不同的区别:
1. 他是类型安全的。实例化了int类型的栈,就不能处理string类型的数据,其他数据类型也一样。
2. 无需装箱和折箱。这个类在实例化时,按照所传入的数据类型生成本地代码,本地代码数据类型已确定,所以无需装箱和折箱。
3. 无需类型转换。
泛型类实例化的理论 c#泛型类在编译时,先生成中间代码il,通用类型t只是一个占位符。在实例化类时,根据用户指定的数据类型代替t并由 即时编译器(jit)生成本地代码,这个本地代码中已经使用了实际的数据类型,等同于用实际类型写的类,所以不同的封闭类的本地代码是不一样的。按照这个 原理,我们可以这样认为:
泛型类的不同的封闭类是分别不同的数据类型。
例:stack<int>和stack<string>是两个完全没有任何关系的类,你可以把他看成类a和类b,这个解释对泛型类的静态成员的理解有很大帮助。
泛型类中数据类型的约束 程序员在编写泛型类时,总是会对通用数据类型t进行有意或无意地有假想,也就是说这个t一般来说是不能适应所有类 型,但怎样限制调用者传入的数据类型呢?这就需要对传入的数据类型进行约束,约束的方式是指定t的祖先,即继承的接口或类。因为c#的单根继承性,所以约 束可以有多个接口,但最多只能有一个类,并且类必须在接口之前。这时就用到了c#2.0的新增关键字:
public class node<t, v> where t : stack, icomparable
where v: stack
{...}
以上的泛型类的约束表明,t必须是从stack和icomparable继承,v必须是stack或从stack继承,否则将无法通过编译器的类型检查,编译失败。
通用类型t没有特指,但因为c#中所有的类都是从object继承来,所以他在类node的编写中只能调用object类的方法,这给程序的编写造 成了困难。比如你的类设计只需要支持两种数据类型int和string,并且在类中需要对t类型的变量比较大小,但这些却无法实现,因为object是没 有比较大小的方法的。 了解决这个问题,只需对t进行icomparable约束,这时在类node里就可以对t的实例执行compareto方法了。这个问题可以扩展到其他用 户自定义的数据类型。
如果在类node里需要对t重新进行实例化该怎么办呢?因为类node中不知道类t到底有哪些构造函数。为了解决这个问题,需要用到new约束:
public class node<t, v> where t : stack, new()
where v: icomparable
需要注意的是,new约束只能是无参数的,所以也要求相应的类stack必须有一个无参构造函数,否则编译失败。
c#中数据类型有两大类:引用类型和值类型。引用类型如所有的类,值类型一般是语言的最基本类型,如int, long, struct等,在泛型的约束中,我们也可以大范围地限制类型t必须是引用类型或必须是值类型,分别对应的关键字是class和struct:
public class node<t, v> where t : class
where v: struct
泛型方法 泛型不仅能作用在类上,也可单独用在类的方法上,他可根据方法参数的类型自动适应各种参数,这样的方法叫泛型方法。看下面的类:
public class stack2
{
public void push<t>(stack<t> s, params t[] p)
{
foreach (t t in p)
{
s.push(t);
}
}
}
原来的类stack一次只能push一个数据,这个类stack2扩展了stack的功能(当然也可以直接写在stack中),他可以一次把多个数据压入stack中。其中push是一个泛型方法,这个方法的调用示例如下:
stack<int> x = new stack<int>(100);
stack2 x2 = new stack2();
x2.push(x, 1, 2, 3, 4, 6);
string s = "";
for (int i = 0; i < 5; i++)
{
s += x.pop().tostring();
} //至此,s的值为64321
泛型中的静态成员变量 在c#1.x中,我们知道类的静态成员变量在不同的类实例间是共享的,并且他是通过类名访问的。c#2.0中由于引进了泛型,导致静态成员变量的机制出现了一些变化:静态成员变量在相同封闭类间共享,不同的封闭类间不共享。
这也非常容易理解,因为不同的封闭类虽然有相同的类名称,但由于分别传入了不同的数据类型,他们是完全不同的类,比如:
stack<int> a = new stack<int>();
stack<int> b = new stack<int>();
stack<long> c = new stack<long>();
类实例a和b是同一类型,他们之间共享静态成员变量,但类实例c却是和a、b完全不同的类型,所以不能和a、b共享静态成员变量。
泛型中的静态构造函数 静态构造函数的规则:只能有一个,且不能有参数,他只能被.net运行时自动调用,而不能人工调用。
泛型中的静态构造函数的原理和非泛型类是一样的,只需把泛型中的不同的封闭类理解为不同的类即可。以下两种情况可激发静态的构造函数:
1. 特定的封闭类第一次被实例化。
2. 特定封闭类中任一静态成员变量被调用。
泛型类中的方法重载 方法的重载在.net framework中被大量应用,他要求重载具有不同的签名。在泛型类中,由于通用类型t在类编写时并不确定,所以在重载时有些注意事项,这些事项我们通过以下的例子说明:
public class node<t, v>
{
public t add(t a, v b) //第一个add
{
return a;
}
public t add(v a, t b) //第二个add
{
return b;
}
public int add(int a, int b) //第三个add
{
return a + b;
}
}
上面的类很明显,如果t和v都传入int的话,三个add方法将具有同样的签名,但这个类仍然能通过编译,是否会引起调用混淆将在这个类实例化和调用add方法时判断。请看下面调用代码:
node<int, int> node = new node<int, int>();
object x = node.add(2, 11);
这个node的实例化引起了三个add具有同样的签名,但却能调用成功,因为他优先匹配了第三个add。但如果删除了第三个add,上面的调用代码则无法编译通过,提示方法产生的混淆,因为运行时无法在第一个add和第二个add之间选择。
node<string, int> node = new node<string, int>();
object x = node.add(2, "11");
这两行调用代码可正确编译,因为传入的string和int,使三个add具有不同的签名,当然能找到唯一匹配的add方法。
由以上示例可知,c#的泛型是在实例的方法被调用时检查重载是否产生混淆,而不是在泛型类本身编译时检查。同时还得出一个重要原则:
当一般方法与泛型方法具有相同的签名时,会覆盖泛型方法。
泛型类的方法重写 方法重写(override)的主要问题是方法签名的识别规则,在这一点上他与方法重载一样,请参考泛型类的方法重载。
泛型的使用范围 本文主要是在类中讲述泛型,实际上,泛型还可以用在类方法、接口、结构(struct)、委托等上面使用,使用方法大致相同,就不再讲述。
小结 c# 泛型是开发工具库中的一个无价之宝。它们可以提高性能、类型安全和质量,减少重复性的编程任务,简化总体编程模型,而这一切都是通过优雅的、可读性强的语 法完成的。尽管 c# 泛型的根基是 c++ 模板,但 c# 通过提供编译时安全和支持将泛型提高到了一个新水平。c# 利用了两阶段编译、元数据以及诸如约束和一般方法之类的创新性的概念。毫无疑问,c# 的将来版本将继续发展泛型,以便添加新的功能,并且将泛型扩展到诸如数据访问或本地化之类的其他 .net framework 领域。
c#泛型编程
泛型:通过参数化类型来实现在同一份代码上操作多种数据类型。利用“参数化类型”将类型抽象化,从而实现灵活的复用。
例子代码:
class program
{
static void main(string[] args)
{
int obj = 2;
test<int> test = new test<int>(obj);
console.writeline("int:" + test.obj);
string obj2 = "hello world";
test<string> test1 = new test<string>(obj2);
console.writeline("string:" + test1.obj);
console.read();
}
}
class test<t>
{
public t obj;
public test(t obj)
{
this.obj = obj;
}
}
输出结果是:
int:2
string:hello world
程序分析:
1、 test是一个泛型类。t是要实例化的范型类型。如果t被实例化为int型,那么成员变量obj就是int型的,如果t被实例化为string型,那么obj就是string类型的。
2、 根据不同的类型,上面的程序显示出不同的值。
c#泛型机制:
c#泛型能力有clr在运行时支持:c#泛型代码在编译为il代码和元数据时,采用特殊的占位符来表示范型类型,并用专有的il指令支持泛型操作。而真正的泛型实例化工作以“on-demand”的方式,发生在jit编译时。
看看刚才的代码中main函数的元数据
.method private hidebysig static void main(string[] args) cil managed
{
.entrypoint
// code size 79 (0x4f)
.maxstack 2
.locals init ([0] int32 obj,
[1] class csharpstudy1.test`1<int32> test,
[2] string obj2,
[3] class csharpstudy1.test`1<string> test1)
il_0000: nop
il_0001: ldc.i4.2
il_0002: stloc.0
il_0003: ldloc.0
il_0004: newobj instance void class csharpstudy1.test`1<int32>::.ctor(!0)
il_0009: stloc.1
il_000a: ldstr "int:"
il_000f: ldloc.1
il_0010: ldfld !0 class csharpstudy1.test`1<int32>::obj
il_0015: box [mscorlib]system.int32
il_001a: call string [mscorlib]system.string::concat(object,
object)
il_001f: call void [mscorlib]system.console::writeline(string)
il_0024: nop
il_0025: ldstr "hello world"
il_002a: stloc.2
il_002b: ldloc.2
il_002c: newobj instance void class csharpstudy1.test`1<string>::.ctor(!0)
il_0031: stloc.3
il_0032: ldstr "string:"
il_0037: ldloc.3
il_0038: ldfld !0 class csharpstudy1.test`1<string>::obj
il_003d: call string [mscorlib]system.string::concat(string,
string)
il_0042: call void [mscorlib]system.console::writeline(string)
il_0047: nop
il_0048: call int32 [mscorlib]system.console::read()
il_004d: pop
il_004e: ret
} // end of method program::main
再来看看test类中构造函数的元数据
.method public hidebysig specialname rtspecialname
instance void .ctor(!t obj) cil managed
{
// code size 17 (0x11)
.maxstack 8
il_0000: ldarg.0
il_0001: call instance void [mscorlib]system.object::.ctor()
il_0006: nop
il_0007: nop
il_0008: ldarg.0
il_0009: ldarg.1
il_000a: stfld !0 class consolecsharptest1.test`1<!t>::obj
il_000f: nop
il_0010: ret
} // end of method test`1::.ctor
1、第一轮编译时,编译器只为test<t>类型产生“泛型版”的il代码与元数据——并不进行泛型的实例化,t在中间只充当占位符。例如:test类型元数据中显示的<!t>
2、jit编译时,当jit编译器第一次遇到test<int>时,将用int替换“范型版”il代码与元数据中的t——进行泛型类型的实例化。例如:main函数中显示的<int>
3、clr为所有类型参数为“引用类型”的泛型类型产生同一份代码;但是如果类型参数为“值类型”,对每一个不同的“值类型”,clr将为其产生一份独立的代码。因为实例化一个引用类型的泛型,它在内存中分配的大小是一样的,但是当实例化一个值类型的时候,在内存中分配的大小是不一样的。
c#泛型特点:
1、如果实例化泛型类型的参数相同,那么jit编辑器会重复使用该类型,因此c#的动态泛型能力避免了c++静态模板可能导致的代码膨胀的问题。
2、c#泛型类型携带有丰富的元数据,因此c#的泛型类型可以应用于强大的反射技术。
3、c#的泛型采用“基类、接口、构造器,值类型/引用类型”的约束方式来实现对类型参数的“显示约束”,提高了类型安全的同时,也丧失了c++模板基于“签名”的隐式约束所具有的高灵活性
c#泛型继承:
c#除了可以单独声明泛型类型(包括类与结构)外,也可以在基类中包含泛型类型的声明。但基类如果是泛型类,它的类型要么以实例化,要么来源于子类(同样是泛型类型)声明的类型参数,看如下类型
class c<u,v>
class d:c<string,int>
class e<u,v>:c<u,v>
class f<u,v>:c<string,int>
class g:c<u,v> //非法
e类型为c类型提供了u、v,也就是上面说的来源于子类
f类型继承于c<string,int>,个人认为可以看成f继承一个非泛型的类
g类型为非法的,因为g类型不是泛型,c是泛型,g无法给c提供泛型的实例化
泛型类型的成员:
泛型类型的成员可以使用泛型类型声明中的类型参数。但类型参数如果没有任何约束,则只能在该类型上使用从system.object继承的公有成员。如下图:
泛型接口:
泛型接口的类型参数要么已实例化,要么来源于实现类声明的类型参数
泛型委托:
泛型委托支持在委托返回值和参数上应用参数类型,这些参数类型同样可以附带合法的约束
delegate bool mydelegate<t>(t value);
class myclass
{
static bool f(int i){...}
static bool g(string s){...}
static void main()
{
mydelegate<string> p2 = g;
mydelegate<int> p1 = new mydelegate<int>(f);
}
}
泛型方法:
1、c#泛型机制只支持“在方法声明上包含类型参数”——即泛型方法。
2、c#泛型机制不支持在除方法外的其他成员(包括属性、事件、索引器、构造器、析构器)的声明上包含类型参数,但这些成员本身可以包含在泛型类型中,并使用泛型类型的类型参数。
3、泛型方法既可以包含在泛型类型中,也可以包含在非泛型类型中。
泛型方法声明:如下
public static int functionname<t>(t value){...}
泛型方法的重载:
public void function1<t>(t a);
public void function1<u>(u a);
这样是不能构成泛型方法的重载。因为编译器无法确定泛型类型t和u是否不同,也就无法确定这两个方法是否不同
public void function1<t>(int x);
public void function1(int x);
这样可以构成重载
public void function1<t>(t t) where t:a;
public void function1<t>(t t) where t:b;
这样不能构成泛型方法的重载。因为编译器无法确定约束条件中的a和b是否不同,也就无法确定这两个方法是否不同
泛型方法重写:
在重写的过程中,抽象类中的抽象方法的约束是被默认继承的。如下:
abstract class base
{
public abstract t f<t,u>(t t,u u) where u:t;
public abstract t g<t>(t t) where t:icomparable;
}
class myclass:base
{
public override x f<x,y>(x x,y y){...}
public override t g<t>(t t) where t:icomparable{}
}
对于myclass中两个重写的方法来说
f方法是合法的,约束被默认继承
g方法是非法的,指定任何约束都是多余的
泛型约束:
1、c#泛型要求对“所有泛型类型或泛型方法的类型参数”的任何假定,都要基于“显式的约束”,以维护c#所要求的类型安全。
2、“显式约束”由where子句表达,可以指定“基类约束”,“接口约束”,“构造器约束”,“值类型/引用类型约束”共四种约束。
3、“显式约束”并非必须,如果没有指定“显式约束”,范型类型参数将只能访问system.object类型中的公有方法。例如:在开始的例子中,定义的那个obj成员变量。比如我们在开始的那个例子中加入一个test1类,在它当中定义两个公共方法func1、func2,如下图:
下面就开始分析这些约束:
基类约束:
class a
{
public void func1()
{ }
}
class b
{
public void func2()
{ }
}
class c<s, t>
where s : a
where t : b
{
public c(s s,t t)
{
//s的变量可以调用func1方法
s.func1();
//t的变量可以调用func2方法
t.func2();
}
}
接口约束:
interface ia<t>
{
t func1();
}
interface ib
{
void func2();
}
interface ic<t>
{
t func3();
}
class myclass<t, v>
where t : ia<t>
where v : ib, ic<v>
{
public myclass(t t,v v)
{
//t的对象可以调用func1
t.func1();
//v的对象可以调用func2和func3
v.func2();
v.func3();
}
}
构造器约束:
class a
{
public a()
{ }
}
class b
{
public b(int i)
{ }
}
class c<t> where t : new()
{
t t;
public c()
{
t = new t();
}
}
class d
{
public void func()
{
c<a> c = new c<a>();
c<b> d = new c<b>();
}
}
d对象在编译时报错:the type b must have a public parameterless constructor in order to use it as parameter 't' in the generic type or method c<t>
注意:c#现在只支持无参的构造器约束
此时由于我们为b类型写入了一个有参构造器,使得系统不会再为b自动创建一个无参的构造器,但是如果我们将b类型中加一个无参构造器,那么对象d的实例化就不会报错了。b类型定义如下:
class b
{
public b()
{ }
public b(int i)
{ }
}
值类型/引用类型:
public struct a { }
public class b { }
public class c<t> where t : struct
{
}
c<a> c1 = new c<a>();
c<b> c2 = new c<b>();
c2对象在编译时报错:the type 'b' must be a non-nullable value type in order to use it as parameter 't' in the generic type or methor 'c<t>'
总结:
1、c#的泛型能力由clr在运行时支持,它既不同于c++在编译时所支持的静态模板,也不同于java在编译器层面使用“擦拭法”支持的简单的泛型。
2、c#的泛型支持包括类、结构、接口、委托四种泛型类型,以及方法成员。
3、c#的泛型采用“基类,接口,构造器,值类型/引用类型”的约束方式来实现对类型参数的“显式约束”,它不支持c++模板那样的基于签名的隐式约束。