一、文件扩展名
数据文件 .dta
命令文件.do
程序文件.ado
二、不同统计软件的对比
三、使用wbopendata(世界银行公开数据)模块获取数据,减轻数据下载管理的工作量
例1:用wbopendata获得“每百人手机订购量“指标的元数据并制作地图
. wbopendata, language (en -English) indicator (it.cel.sets.p2) long clear latest
. use Mobile, clear
. spmap it cel sets p2 using "world-c.dta", id(id)
1 //‚线性变换可以用矩阵的形式表示,即x=Sy,y=Qz, 则x=S*Q*z.其中x,y,z•为列向量
2 mat S=(2,0,1\-2,3,2\4,1,5)
3 mat Q=(-3,1,0\2,0,1\0,-1,3)
4 mat b1=S*Q
5 mat l b1 //下面用方程形式表示出来
6 dis "x1="b1[1,1] "*z1+"b1[1,2] "*z2+"b1[1,3] "*z3"
7 dis "x2="b1[2,1] "*z1+"b1[2,2] "*z2+"b1[2,3] "*z3"
8 dis "x3="b1[3,1] "*z1+"b1[3,2] "*z2+"b1[3,3] "*z3"
9 //求解矩阵,先试探系数矩阵是否可逆
10 mat A=(2,1,-1\2,1,0\1,-1,1)p
11 dis det(A) //行列式不为零,可以求逆
12 mat b=(1,-1,3\4,3,2)
13 mat X=b*inv(A)
14 mat l X
.sysuse auto,clear //使用sysuse打开系统示例数据,使用clear命令来清除已打开的数据
.use D:\Stata12.0\ado\base\a\auto //使用use命令来打开用户自己的数据
.cd”D:\abc“ //打开其他位置的数据文件,或者使用file--open来打开指定数据
.webuse nlswork,clear //webuse 命令默认从http://www.stata-press.com/data 这一路径获取数据,欲获取其他网络数据则只能使用use + 完整的网络地址来获取.
.use http://fmwww.bc.edu/RePEc/bocode/c/CardKrueger1994.dta, clear /* 从波士顿大学的Stata 数据库中获取数据*/
.
1 sysuse auto
2
3 list /* 陈列文件的全部数据*/
4 list make price mpg rep78 /* 陈列变量make price mpg rep78 的数据*/
5 list make price mpg rep78 in 1/10 /* 陈列变量make price mpg rep78 的前10 个数据*/
6 list make price mpg rep78 if mpg>20 /* 陈列变量make price mpg rep78 的满足mpg 大于20 的数据*/
7
8 list make price mpg rep78 ,table /* 强制按图标形式陈列变量。list 陈列数据的默认形式依赖屏幕窗口的宽度, 9 list make price mpg rep78 ,display /* 强制按display 陈列变量*/
10 list make price mpg rep78 ,table header /* 陈列时带变量名,实际上这也是list 默认的形式*/
11 list make price mpg rep78 ,table noheader /* 陈列时不带变量名*/
12
13 list make price mpg rep78 ,table header(4) /* 每四次观测为一组陈列每一组陈列时都有变量名*/
14 list make price mpg rep78 in 1/10,clean /* 陈列时不带表格线*/
15 list make price mpg rep78 in 1/10,divider /* 陈列时每列数据间有竖线*/
16 list make price mpg rep78 in 1/20, divider separator(10)
17 /* 陈列时每列数据间有竖线,并且每10 行有横线,list 的默认值为5*/
18
19 sort headroom /* 数据按headroom 从小到大的顺序排列*/
20 list make price mpg rep78 in 1/20, sepby(headroom) /* 陈列数据时,当headroom 的数据改变时,有横线隔开*/
21 list make price mpg rep78 ,table sum mean N /* 陈列数据后,计算变量观测值的和,平均值和总样本数*/
22 list make price mpg rep78 , sum(price mpg rep78) labvar(make) /* 陈列数据后,计算变量price mpg rep78 的观测值的和*/
23
24 by rep78, sort: list make price mpg rep78
25 /* 数据先按rep78 从小到大的顺序排列,再按rep78 的值陈列make price mpg rep78 的数据*/
26 by rep78, sort: list make price mpg rep78, constant /* 和上述相同,陈列时,单独列出rep78 的值*/
. save auto1,replace/*另存为auto1.dta, 如果已经有这个文件名的文件,那么覆盖保存*/
file auto1.dta saved
.g num = _n //generate或gen都可以
.replace //+条件语句:剔除缺失值、异常值、批量修改数据
.edit //慎用,避免无意间修改了原始数据
. su //summarize或sum都可以
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
make | 0
price | 74 6165.257 2949.496 3291 15906
mpg | 74 21.2973 5.785503 12 41
rep78 | 69 3.405797 .9899323 1 5
headroom | 74 2.993243 .8459948 1.5 5
-------------+--------------------------------------------------------
trunk | 74 13.75676 4.277404 5 23
weight | 74 3019.459 777.1936 1760 4840
length | 74 187.9324 22.26634 142 233
turn | 74 39.64865 4.399354 31 51
displacement | 74 197.2973 91.83722 79 425
-------------+--------------------------------------------------------
gear_ratio | 74 3.014865 .4562871 2.19 3.89
foreign | 74 .2972973 .4601885 0 1