深入C#字符串和享元(Flyweight)模式的使用分析
写这个文章,主要是因为网上对c#字符串和享元模式的误解比较多。
flyweight模式
先说这名字,fly呢,就是苍蝇,没错这里面不是飞的意思,是苍蝇的意思,weight大家都知道,就是重量,苍蝇的重量,就是非常非常轻的意思。所以flyweight模式就是处理非常非常轻量级对象的一个东西。
flyweight的目标是解决大量细粒度对象的内存消耗问题,当然,巧妇难为无米之炊,任何模式和手法都不能凭空造出内存来,所以享元模式针对的情况是这些细粒度对象的中数据有重复的情况。
flyweight的做法是,把对象的状态(通常用属性表示),分成两个部分,一部分是内部状态,另一部分是外部状态。内部状态外部状态是不易重复的(或者说必要的),外部状态 内部状态是易重复的。所以,flyweight把外部状态提取出来共享,这样就一定程度解决了内存占用问题。
c#中的字符串不是flyweight模式
在网上常常可以看到一个说法,说c#中的字符串使用了flyweight模式,开门见山地说,这个说法是错误的。
错在哪里呢?按照上文的介绍,错就错在字符串它没有所谓的“内部状态外部状态”。
通常讲字符串是享元的原因就是以下代码:
string a = "hello world";
console.writeline(object.referenceequals(a, "hello world")); //true
当使用字符串直接量的时候,不论你写了多少个"hello world",最终内存里面只有一个字符串对象。
运行时创建的字符串并不在此列,可以使些手段,强制在内存里面产生新的字符串。
string a = "hello world";
console.writeline(object.referenceequals(a, new string("hello world".tochararray()))); //false
因为我们强行调用了new,所以这个字符串跟内存中的直接量"hello world"对应的对象不是同一个。
有趣的是,c#还允许强制把一个字符串加入到(如果已经有了,就只是找出来)字符串池里面。
string a = "hello world";
string b = string.intern(new string("hello world".tochararray()));
console.writeline(object.referenceequals(a,b) );
或者
string a = string.intern(new string("hello world".tochararray()));
string b = string.intern(new string("hello world".tochararray()));
console.writeline(object.referenceequals(a,b) );
前面提到了,这个行为跟flyweight使用的内部状态和外部状态不同,是两个对象实实在在就是同一个对象。
c#中的字符串与flyweight模式
好吧,前面说了不少,c#中的字符串不是flyweight模式,但是是不是就意味着c#里面字符串跟flyweight没有关系呢?
当然不是,否则我写这么一篇文章岂不是太蛋疼了……
字符串池和intern方法简直是实现flyweight的神器啊!
考虑我们有某一类对象,可能会创建几百万个,对象里面恰巧有这么一个属性叫做颜色,它在对象构造的时候随机产生,颜色用的是rgb色,用rgb24来表示,于是颜色字符串类似#ccc这样子。
代码写起来就像下面的样子:
class element
{
static random rnd = new random();
static char[] table;
static element()
{
table = "0123456789abcdef".tochararray();
}
public string color;
public element()
{
color = "" + table[rnd.next() % 16] + table[rnd.next() % 16] + table[rnd.next() % 16];
}
}
接下来我们创建3千万个对象看看如何
element[] eles = new element[30000000];
for (var i = 0; i < 30000000; i++)
{
eles[i] = new element();
}
从任务管理器看到一大块内存被吃掉了
接下来我们使用string.intern来实现flyweight:
class element
{
static random rnd = new random();
static char[] table;
static element()
{
table = "0123456789abcdef".tochararray();
}
public string color;
public element()
{
color = string.intern("" + table[rnd.next() % 16] + table[rnd.next() % 16] + table[rnd.next() % 16]);
}
}
可以看到内存占用量的明显变化。
因为字符串对象的不可更改性质,使用了string.intern之后,我们完全看不出前后color的区别,也就是说,修改前后的element类是完全等效的,但是flyweight为我们节约了大量的内存。
更多思考
这个典型的使用flyweight场景为我们揭示了享元外部状态内部状态的特征:像字符串一样不可更改的对象。gof原书的例子中的字型对象glyph也是如此。
string.intern这种对象池的方式实现flyweight也值得借鉴,我们可以考虑自己设计flyweight的外部状态对象时使用类似的方式。