python geopandas读取、创建shapefile文件的方法
shapefile
是gis中非常重要的一种数据类型,在arcgis中被称为要素类(feature class),主要包括点(point)、线(polyline)和多边形(polygon)。作为一种十分常见的矢量文件格式,geopandas
对shapefile
提供了很好的读取和写出支持,其dataframe结构相当于gis数据中的一张属性表,使得可以直接操作矢量数据属性表,使得在python中操作地理数据更方便。本文给大家介绍下用python脚本中对shapefile文件(.shp,.shx,.dbf等格式)进行读写操作。
开发准备
由于geopandas有好几个依赖库,推荐大家使用 miniconda或是 anaconda来安装geopandas。
安装命令:
conda install -c conda-forge geopandas
国内镜像:
conda install -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge geopandas
使用导入:import geopandas
我这里用的是geopandas
0.7的版本,版本间差异是不太大,最新0.8版本新增了一些查询、入库方面的特性。
shapefile文件信息的读取
相比pyshp
库,geopandas
库的数据读取、展示、分析、拓展的效果要更好。它可以读取zip中的shapefile
,还可以读取geojson、arcgis中地理数据库gdb
,以及qgis
中geopackage
存放的矢量数据。
import geopandas as gpd from matplotlib import pyplot as plt data = gpd.read_file(r'e:\gisdata\行政区划数据2019\省.shp')#读取磁盘上的矢量文件 #data = gpd.read_file('shapefile/china.gdb', layer='province')#读取gdb中的矢量数据 print(data.crs) # 查看数据对应的投影信息 print(data.head()) # 查看前5行数据 data.plot() plt.show()#简单展示
显示效果:
shapefile文件的创建
要素类的创建效率很高,既能创建要素实体,也能写入属性信息和定义投影。下面先简单介绍下三种要素类的创建方法。
点状要素类的创建
核心代码:
# 对应shapely.geometry中的point,用于表示单个点,下面我们创建一个由若干point对象组成 cq = geopandas.geoseries([geometry.point(110, 60), geometry.point(110.5, 50.4), geometry.point(120, 55), geometry.point(107.8, 54.6), geometry.point(114.6, 50)], crs='epsg:4326', # 指定坐标系为wgs 1984 index=['一号', '二号', '三号', '四号', '五号'], # 相关的索引 ) # 导出数据为shapefile文件 cq.to_file('./output/{}.shp'.format(os.path.basename(__file__).replace('.py', '')), driver='esri shapefile', encoding='utf-8')
线状要素类的创建
核心代码:
# 这里shapely.geometry.linestring([(x1, y1), (x2, y2), ...])用于创建多点按顺序连接而成的线段 cq = geopandas.geoseries([geometry.linestring([(0, 0), (1, 1), (1, 0)]), geometry.linestring([(0.5, 2), (0, 1), (-1, 0)])], crs='epsg:4326', index=['一号线', 'b']) cq.to_file('./output/{}.shp'.format(os.path.basename(__file__).replace('.py', '')), driver='esri shapefile', encoding='utf-8')
面状要素类的创建
核心代码:
# 对应shapely.geometry中的polygon,用于表示面,下面我们创建一个由若干polygon对象组成 cq = geopandas.geoseries([geometry.polygon([(14, 14), (13, 18), (20, 11), (18, 10)]), geometry.polygon([(0, 0), (10, 0), (10, 10), (0, 10)], [((1, 3), (5, 3), (5, 1), (1, 1)), ((9, 9), (9, 8), (8, 8), (8, 9))]), geometry.polygon([(11, 2), (11, 10), (12, 10), (12, 2)]) ], index=['简单面', '复杂面', 'c区'], # 构建一个索引字段 crs='epsg:4326', # 坐标系是:wgs 1984 ) cq.to_file('./output/{}.shp'.format(os.path.basename(__file__).replace('.py', '')), driver='esri shapefile', encoding='utf-8')
拓展应用实例
展高程点
高程点文件存储格式与cass中读取的dat格式一致,示例:【1,zdh ,450000.000,4100000,20002,dyg,450000.000,4100000,2000 】其中,“1”代表的是“点号”,“zdh”代表的是“代码”,之后的分别是“东坐标、北坐标、高程值”即“y、x、h ”或者是“x、y、h ”
autocad中展点效果
geopandas中展点效果
实现代码
# -*- coding: utf-8 -*- import pandas as pd import geopandas as gpd from shapely.geometry import point from matplotlib import pyplot as plt from matplotlib.ticker import funcformatter # 读取数据 file_path = './data-use/高程数据.csv' rankings_colname = ['name', 'mark', 'longitude', 'latitude', 'height']; df = pd.read_csv(file_path, header=none, names=rankings_colname) # print(df.head(5))#输出前五行数据查看 xy = [point(xy) for xy in zip(df['longitude'], df['latitude'])] pts = gpd.geoseries(xy) # 创建点要素数据集 #保存为shp文件 pts.to_file('./output/展高程点.shp', driver='esri shapefile', encoding='utf-8') """fig是用来设置图像大小参数,ax是行列有多少个点""" fig, ax = plt.subplots(figsize=(8, 6)) # 返回一个包含figure和axes对象的元组 ax = pts.plot(ax=ax, facecolor='white', edgecolor='black', marker='x', linewidth=0.5, # 内外符号比例系数 markersize=12, label='高程点') # 地图标注 new_texts = [plt.text(x_ + 1, y_ + 1, text, fontsize=8) for x_, y_, text in zip(df['longitude'], df['latitude'], df['name'])] # 设置坐标轴 def formatnum(x, pos): # return '$%.1f$x$10^{4}$' % (x / 10000)#科学计数法显示 return int(x) # 取整显示 formatter = funcformatter(formatnum) ax.yaxis.set_major_formatter(formatter) # 美观起见隐藏顶部与右侧边框线 ax.spines['right'].set_visible(false) ax.spines['top'].set_visible(false) plt.grid(true, alpha=0.4) # 显示网格,透明度为50% ax.legend(title="图例", loc='lower right', ncol=1, shadow=true) # 添加图例 plt.title('展高程点', fontdict={'weight': 'normal', 'size': 20}) # 设置图名&改变图标题字体 # 保存图片 plt.savefig('images/展高程点.png', dpi=300, bbox_inches='tight', pad_inches=0) plt.show()
点集转面
将一系列点的集合转为面状要素类,下面以甘肃省的地震带为例(字段对应:名称,面索引,点索引,经度,纬度)。
数据预览
效果预览
实现代码
import geopandas as gpd import pandas as pd from shapely.geometry import polygon from matplotlib import pyplot as plt raw = pd.read_excel('./data-use/甘肃省地震带.xls') # 原始数据 # 转换为面要素 output = raw.groupby('id') \ .apply(lambda df: polygon([(x, y) for x, y in zip(df['longitude'], df['latitude'])])) \ .to_frame(name='geometry') # 转换为geodataframe output = gpd.geodataframe(output, crs='epsg:4326') output.plot() # 地图标注 new_longitude = raw.groupby('name', as_index=false,)['longitude'].mean() new_latitude = raw.groupby('name', as_index=false)['latitude'].mean() new_df = pd.merge(pd.dataframe(new_longitude),pd.dataframe(new_latitude)) new_texts = [plt.text(x_ , y_ , text, fontsize=8) for x_, y_, text in zip(new_df['longitude'], new_df['latitude'], new_df['name'])] # 导出shapefile output.to_file('output/地震带.shp') plt.show()
创建缓冲区、多环缓冲区
实现代码:
import os import shapely import geopandas as gpd import matplotlib.pyplot as plt polygon = shapely.geometry.polygon([(0, 0), (1, 0), (1, 1), (0, 1)]) # 分别绘制多边形、多边形正向缓冲区,坐标系是wgs1984,单位是度 cq = gpd.geoseries([polygon, polygon.buffer(distance=1), polygon.buffer(distance=3)], crs='epsg:4326') # 导出数据为shapefile文件 cq.to_file('./output/{}.shp'.format(os.path.basename(__file__).replace('.py', '')), driver='esri shapefile', encoding='utf-8') ax = cq.plot(alpha=0.2) ax.axis('off') # 取消坐标轴的显示 plt.show()
写在最后
附相关完整代码的下载,还有更多有趣的内容,感兴趣的朋友们可以自行实践。喜欢的朋友们可以点个关注,后续将持续更新,精彩无限^ - ^
链接: https://pan.baidu.com/s/1g7g8sq17-9xihojyq1m7ww
提取码: 59vz
最后给大家强烈安利一个geopandas学习博客:
以上就是python geopandas读取、创建shapefile文件的方法的详细内容,更多关于python读取shapefile文件的资料请关注其它相关文章!
推荐阅读
-
使用python读取.text文件特定行的数据方法
-
C#简单读取、改变文件的创建、修改及访问时间的方法
-
Python读取txt文件数据的方法(用于接口自动化参数化数据)
-
python 读取dicom文件,生成info.txt和raw文件的方法
-
python使用xlrd模块读取xlsx文件中的ip方法
-
python读取json文件并将数据插入到mongodb的方法
-
Python解析并读取PDF文件内容的方法
-
python+opencv 读取文件夹下的所有图像并批量保存ROI的方法
-
python opencv 读取本地视频文件 修改ffmpeg的方法
-
python 读取文件并把矩阵转成numpy的两种方法