SQL Server误区30日谈 第18天 有关FileStream的存储,垃圾回收以及其它
误区 #18:如下多个有关filestream的误区
全部错误
18 a)filestream数据可以在远程存储
不能,由于filestream数据容器(指的是存放filestream文件的ntfs文件夹,杜撰出来的术语)必须像数据文件或日志文件那样符合本地存储策略-也就是说,这个数据容器必须放在对于运行sql server的windows server是本地存储(译者注:也就是在‘计算机'里能看到的存储,dac当然是了,其实san这类不直接连接服务器的也算是)访问filestream数据只要客户端连接到了sql server服务器并获取响应的事务上下文后,就可以通过unc路径进行访问了。
18 b)filestream的数据容器可以嵌套
不能,对于同一个数据库的两个不同的filestream容器可能在同一个目录下,但是却不能嵌套。而对于不同数据库的filestream容器无法在同一个目录下。我的一篇博文有一段代码能说明这一点:misconceptions around filestream storage。
18 c)对于filestream的更新可以部分更新
对于任何filestream的更新都会导致创建一个全新的filestream文件,这个操作会被日志原原本本的记录下来。这也就是为什么filestream不能被用于数据库镜像。这么多数据如果用于镜像的话那后果简直不可想象,只能希望未来的sql server版本可以修改这种机制以允许部分更新。
18 d)filestream会在不需要的时候立刻被垃圾回收
错误。filestream数据会在不再需要并且到了下一个checkpoint的时候进行垃圾回收。这点并不是那么直接以至于很多人对filestream的回收机制存在误区。
18 f)filestream存放的目录以及文件名是随机取得
其实不然,filestream的文件名其实代表的是创建其操作对应lsn号。表和列的guid目录名是可以在系统表中获取到。
我下面两篇博文对此有了更详细的解释:
-
filestream directory structure 解释了如何从一个filestream所在行来得知其名称
-
filestream directory structure - where do the guids come from? 可以望文生义的知道这篇文章所讲述的内容:-)