powershell玩转sqlite数据库详细介绍
脚本经常需要处理文本,有时候是行列整齐文本。那么powershell脚本处理行列文本有几种方法呢?一种是excel,另外的一些是?access?sqlite?
sqlite是一个很小巧的,很方便嵌入到脚本语言中的,关系型数据库。它给powershell提供了一个免费的,处理行列整齐数据,存储数据,统计数据的*神器。
只要你学会了它,上天入地皆可去得。而且以后学sql server,mysql,都类似,没有难度。
带着引号搜本文关键字: "^_^上天入地皆可去^_^"
发文初衷:世界上几乎没有讲powershell调用sqlite的帖子。
初稿,会更新。有错误欢迎指正,谢谢。
------------------【sqlite 字段类型】------------------
sqlite只有5种数据类型,用于存储。
数据类型 占用字节 描述
null
text ? 使用数据库编码(utf-8,utf-16be或者utf-16le)存放
integer 根据值的大小以1,2,3,4,6或8字节存放 值是有符号整形
real 以8字节ieee浮点数存放
blob 最多 1,000,000,000 字节 只是一个数据块,完全按照输入存放(即没有准换)存放。
使用时会将【内存数据类型】和【存储数据类型】之间进行转换。
如将布尔值,转换成inteeger存储。具体参见手册:
没有日期型,没有布尔型,这一点要注意。
------------------【应用场景,重要!】------------------
powershell 传教士 原创文章 始作于 2016-01-01 元旦, 改 允许转载,但必须保留名字和出处,否则追究法律责任
下为个人整理的应用场合,如有不妥,请斧正。
1 存储数据。中量数据。
这个中量数据是指,由于sqlite表不支持分区,所以应该在一亿条以下,或者更少。
excel表存储数据有个行数(记录条数)限制,104万左右。比如我有110万数据,只有一列,要统计列最大值。这时用excel就不方便了。
excel中每单元格最大存储32k字节,access2016中,每个text字段的容量存储为64k字节,行数倒是够用。
2 各种数据统计。
3 由于sqlite支持纯内存数据库,把所有库放在内存中。可以结合上述两种需求。即从大库查询(或导出)部分数据,在内存中进行统计。
4 缺点是:数据展示不好。不像excel、access那样(对业务人员)有表,图。
5 sqlite是关系型数据库,join,group by,order by这些基本功能和mysql,sql server比不逊色。单线程性能也很好。另外单机,绿色,软件1m以下,支持数据量极大,比access强。
------------------【图形管理工具】------------------
英文:
sqlitestudio http://sqlitestudio.pl/
sqlitemanager http://www.sqlabs.com/
sqlite expert http://www.sqliteexpert.com/
sqlite developer http://www.sqlitedeveloper.com/
sqlitespy http://www.yunqa.de/delphi/doku.php/products/sqlitespy/index
razorsql http://www.razorsql.com/
中文:
sqlite administrator http://sqliteadmin.orbmu2k.de/ 打不开3.x版本数据库
navicat for sqlite 推荐
database.net http://fishcodelib.com/database.htm 推荐
------------------【下载安装】------------------
ps调用sqlite的两种方法。这里我们主要介绍第二种
1 https://psqlite.codeplex.com/
2 https://github.com/ramblingcookiemonster/pssqlite
上述2种,都支持支持winxp,powershell2.0,及以上。
2.1 下载:
https://github.com/ramblingcookiemonster/pssqlite/archive/master.zip
2.2 建立【c:\users\你的用户名\documents\windowspowershell\modules】目录,并解压:
把 pssqlite-master\pssqlite 这个目录复制到,你的模块目录中。
即modules目录中,含有pssqlite这个目录。
2.3 查看模块中的所有命令:
import-module pssqlite
get-command * -module pssqlite
返回
commandtype name version source
----------- ---- ------- ------
function invoke-sqlitebulkcopy 1.0.1 pssqlite
function invoke-sqlitequery 1.0.1 pssqlite
function new-sqliteconnection 1.0.1 pssqlite
function out-datatable 1.0.1 pssqlite
2.4 一键安装命令:
#一键安装命令依赖.net 4.5 及以上。powershell 3.0 及以上。如果不满足条件,请用手动安装方法。
mkdir "$env:userprofile\documents\windowspowershell\modules"
invoke-webrequest https://github.com/ramblingcookiemonster/pssqlite/archive/master.zip -outfile .\master.zip
add-type -assemblyname 'system.io.compression.filesystem'
[system.io.compression.zipfile]::extracttodirectory("$pwd\master.zip","$pwd")
copy-item -recurse pssqlite-master\pssqlite "$env:userprofile\documents\windowspowershell\modules"
import-module pssqlite
get-command * -module pssqlite
------------------【命令帮助】------------------
invoke-sqlitequery -datasource $库文件名 -query $查询字符串 -as 输出格式(psobject,datarow,datatable,dataset,singlevalue)
$内存库 = new-sqliteconnection -datasource :memory:
invoke-sqlitequery -sqliteconnection $内存库 -query "create table orderstonames (orderid int primary key, fullname text);" #建表语句
invoke-sqlitequery -sqliteconnection $内存库 -query "insert into orderstonames (orderid, fullname) values (1,'cookie monster');" #插入语句
invoke-sqlitequery -sqliteconnection $内存库 -query "select xxx from yyy where mmm=nnn;" #你想要的统计语句
问:csv如何入库?
答:
最好用图形工具搞,也可以用下列类似命令。
$dt1 = get-process | out-datatable
invoke-sqlitebulkcopy -datatable $st1 -datasource $datasource -table 表名
具体参见例子2
------------------【powershell操作sqlite经验】------------------
1 不外乎查询出行,查询出列, 或查询出表,然后foreach。
2 不外乎去重,合并结果,统计最大,列中数字合计。
问:乍开始我不熟悉sql语句咋办?
答:
用拐棍!完全使用图形程序(找传教士要navicat for sqlite)来建表,导入数据,在图形软件中运行sql。
问:现在我已经会用【常用sql语句】+【图形程序】来处理数据了。为啥还要用脚本呢?
答:
图形程序毕竟只是根拐杖。你要处理的数据有可能要先取到一行,(比如用"_"先拆分,分成n列)预先用ps处理后再入库。
库里输出的行列,也很容易(用out-gridview进行展示等。)所以说还是要ps+sqlite共同处理的。
---------------【根据官网手册,增减的sql教程】----------------
sqlite官网,手册位置:
问:什么是(关系型)数据库索引,索引有什么好处坏处?
答:
索引是把无序的每条数据,添加了一个从小到大的顺序,变成了有序的数据。
每个字段都可以添加一个索引。或者n个字段公用一个索引。
索引加速了查询速度,降低了插入速度。
问:如何快速插入数据?
答:
1 较少并发写入,最好只有一个线程在读写。
2 尽量减少索引。
3 使用事务。事务是由类似【start transaction】,【commit】sql关键字包含的命令。
事务的作用是,在所有数据插入后,即【commit】后,才一次性修改所有索引,而不是插入一条,修改一次索引。
4 使用.net连接器封装的事务。即类似sql bulkcopy 之类的方法。
问:事务相关的sql语句是?
答:
begin transaction; 事务开始
commit transaction; 显示事务被提交,数据表中的数据也发生了变化。
rollback transaction; 回滚
问:为什么传教士也很爱sqlite?
答:
pragma encoding; # 这个命令将返回库编码默认值,utf-8
用 中文表名,字段名毫无问题!!!
问:打开库文件名后,列出所有《库名》的sql语句是?
答:
pragma database_list;
问:打开sqlite库文件后,默认的数据库名是?
答:
main
问:列出所有表名的sql语句是?
答:
select name from sqlite_master where type='table' order by name;
问:测试表是否存在的sql语句是?
答:
select name from sqlite_master where name='表名' ;
问:列出某个表的所有索引,要用的sql语句是?
答:
pragma index_list(表名);
问:建立表的sql语句是?
答:
create table if not exists '表名' ('自增' integer primary key autoincrement, '字段名2' real)
create table if not exists '表名' ('字段名1' integer autoincrement, '字段名2' real, '字段名3' text, '字段名4' blob,primary key ('字段名1'))
create temp table #建临时表
primary key #主键
autoincrement #自增
问:建立,删除索引的sql语句是?
答:
create index if not exists 索引名 on 表名(字段名)
create index if not exists 索引名 on 表名(字段名 asc,字段名2 desc)
create unique index if not exists 索引名 on 表名(字段名 desc)#唯一索引
删除索引:
drop index if exists 索引名
传教士问:
我搜遍了全世界,包括官方,也搞不清楚为啥不是drop index if exists 索引名 on 表名?而是drop index if exists 数据库名.索引名
一个库里,可以有多个表啊,请问谁能答?
问:什么是sqlite数据清理?有什么好处?
答:
删除一条记录时只是打上删除标记。数据清理是彻底删除数据。
大量的插入、更新和删除等操作后,清理下数据,有助于读取性能。还会归还空间给操作系统。
sqlite的数据清理,只能对整个数据库来操作。
问:数据清理命令是?
答:
attached 数据库名 连接数据库。
vacuum 删除已经打上删除标记的表,记录。
reindex 重生成索引
问:查看表结构的sql语句是?
答:
pragma table_info(表名);
问:清空表的sql语句是?
答:
delete from 表名;
update sqlite_sequence set seq = 0 where name ='表名'; #自增字段归零。sqlite_sequence是main库中的特殊表。
问:插入数据的sql语句是?
答:
insert into 表名 values(null,21.5,'this is a texttest.','blob wer@#$@$%^^')
问:空值是?
答:
null
问:查询数据的sql语句是?
答:
select '字段名' from '表名' where 条件
问:查询结果去重的sql语句是?
答:
select distinct '字段名'
select distinct '字段名1','字段名2','字段名3','字段名4' #所有字段的值完全相同,才算重复。
问:集合去重的sql语句是?
答:
select 返回的集合1
union
select 返回的集合2
问:查询结果按 '字段名' 分组输出的sql语句是?
答:
select '字段名' from '表名' where 条件 group by '字段名' ;
group by 一定要放在where之后,group by 一定要放在order by之前。
问:查询结果按 '字段名' 排序输出的sql语句是?
答:
select '字段名' from '表名' where 条件 order by '字段名' asc ;
select '字段名' from '表名' where 条件 order by '字段名' desc ;
问:隐藏的自增列叫什么?
答:
rowid或_rowid_
在没有integer类型的主键时,存在这个隐藏字段。
问:sqlite有个叫sqlite3.exe的客户端软件。我可以用这个sqlite.exe + cmd + bat 玩转sqlite数据库么?
答:
基本不行。
简单来说powershell有内置的值类型,如小数数值,和表datetable。而bat中没有。
powershell字符串对象长度大,bat数据超过8000左右字母不行。
------------------【例子】------------------
# 例子1 :专门给菜鸟编写的 powershell 操作sqlite的例子。大量硬编码,快速上手。win10测试通过。
例子2:专门给菜鸟编写的 powershell 操作sqlite bulkcopy的例子。大量硬编码,快速上手。win10测试通过。
文章到这就结束了,需要的朋友可以多看看实例。
上一篇: php双向队列实例讲解
下一篇: 如何解决php-fpm启动不了问题