Python可视化工具Plotly的应用教程

程序员文章站 2022-06-25 08:02:18

目录一.简介二.各图运用1.柱状图2.散点图3.冒泡散点图4.旭日图5.地图图形三.实战案例一.简介发展由来：随着信息技术的发展和硬件设备成本的降低，当今的互联网存在海量的数据，要想快速从这些数据中获...

一.简介

发展由来：

随着信息技术的发展和硬件设备成本的降低，当今的互联网存在海量的数据，要想快速从这些数据中获取更多有效的信息，数据可视化是重要的一环。对于python语言来说，比较传统的数据可视化模块是matplotlib，但它存在不够美观、静态性、不易分享等缺点，限制了python在数据可视化方面的发展。

为了解决这个问题，新型的动态可视化开源模块plotly应运而生。由于plotly具有动态、美观、易用、种类丰富等特性，所以一经问世就受到开发人员的喜爱。

简要说明

plotly是python 库中一种互动，开源绘图库，也是基于javascript的绘图库，支持 40 多种独特的图表类型，效果美观，其中涵盖各种统计、财务、地理、科学和三维用例。

有在线和离线模式，易于保存与分享plotly的绘图结果，并且可以与web无缝集成；

ploty默认的绘图结果，是一个html网页文件，通过浏览器可以直接查看；

Python可视化工具Plotly的应用教程

二.各图运用

安装：

pip install plotly

下面均在jupyter notebook中运行

数据源：

import plotly
import plotly.express as px
import plotly.graph_objects as go
import plotly.io as pio
import pandas as pd
import numpy as np

# plotly内置了数据集，方便大家不受数据分析思路的背景下，练手用
df=px.data.gapminder()
df.head()

运行结果：

Python可视化工具Plotly的应用教程

1.柱状图

# 绘制中国历年人口变化图
# df_country=df.query('country=="china"')
df_country=df[df['country']=='china'] 
# 柱状图展示
fig=px.bar(df_country,  # 数据源
           x='year',  # 横坐标：年份
           y='pop',  # 纵坐标：人口
           text='pop',  # 说明：人口
           color='lifeexp',  # 颜色取值：根据平均寿命的值来取
           hover_name='year', #控制点名称：年份
          )
fig

运行结果：

Python可视化工具Plotly的应用教程

# 注释标题
fig.update_layout(title_text='中国人口变迁史',
                  title_x=.5,
                  font=dict(family='simsun',
                           size=14,
                           color='#1d39c4')
                 )
# 注释坐标轴
fig.update_layout(xaxis_title='年份',
                 yaxis_title='人口数量')

fig

运行结果：

Python可视化工具Plotly的应用教程

#柱形图文字格式
fig.update_traces(
                 textposition='outside',
                 texttemplate='%{text:,.2s}')

fig

运行结果：

Python可视化工具Plotly的应用教程

#利用customdata增加数据集
fig.update_traces(customdata=df[['lifeexp','gdppercap']])
fig.update_traces(hovertemplate='year: %{x}<br><br> population: %{y}<br> life expectation: %{customdata[0]:,.2f}<br>gdp per capital: %{customdata[1]:,.2f}')
# 坐标轴tick设置
fig.update_xaxes(tickangle=-45,tickfont=dict(family='arial',size=12))
        
fig

运行结果：

Python可视化工具Plotly的应用教程

# 设置间隙大小及文本大小
fig.update_layout(bargap=.4,
                 uniformtext_minsize=8,
                 uniformtext_mode='show')
# 设置注释
fig.add_annotation(x='1982',
                   y=1000281000,
                   text='突破10亿',
                  font=dict(color='red'))
fig.update_annotations(dict(xref='x',
                           yref='y',
                           showarrow=true),
                      arrowcolor='red',
                      arrowhead=4)
fig.show()

运行结果：

Python可视化工具Plotly的应用教程

2.散点图

df_2007 = df[df["year"] == 2007]
df_2007

运行结果：

Python可视化工具Plotly的应用教程

# 散点图
px.scatter(df_2007,   # 数据集
           x="gdppercap",  # 横坐标:人均gdp
           y="lifeexp",  # 纵坐标:平均寿命
           color="continent"  # 颜色取值：根据洲的值来取
          )

运行结果：

Python可视化工具Plotly的应用教程

选择一个区域，能将其放大

Python可视化工具Plotly的应用教程

3.冒泡散点图

# 冒泡散点图
px.scatter(df_2007,   # 绘图dataframe数据集
           x="gdppercap",  # 横坐标
           y="lifeexp",  # 纵坐标
           color="continent",  # 区分颜色
           size="pop",  # 区分圆的大小
           size_max=60,  # 散点大小
           hover_name="country"  # 控制点名称
          )

运行结果：

Python可视化工具Plotly的应用教程

4.旭日图

# 旭日图
px.sunburst(df_2007,   # 绘图数据
            path=['continent', 'country'],  # 指定路径：从洲到国家
            values='pop', # 数据大小：人口数
            color='lifeexp',  # 颜色
            hover_data=['iso_alpha'] # 显示数据
           )

运行结果：

Python可视化工具Plotly的应用教程

5.地图图形

# 设置地图的图形
px.choropleth(
  df,  # 数据
  locations="iso_alpha",  # 简称
  color="lifeexp",  # 颜色取值
  hover_name="country",  # 悬停数据
  animation_frame="year",  # 播放按钮设置
  color_continuous_scale=px.colors.sequential.plasma,  # 颜色变化取值
  projection="natural earth"  # 使用的地图设置
)

运行结果：

Python可视化工具Plotly的应用教程

三.实战案例

使用泰坦里克号生存为例

import plotly
import plotly.express as px
import plotly.graph_objects as go
import plotly.io as pio
import pandas as pd
import numpy as np

#数据读取
path1='./dataset/test.csv'
path2='./dataset/train.csv'
test=pd.read_csv(path1)
train=pd.read_csv(path2)
#数据合并
data=pd.concat([test,train])

运行结果：

Python可视化工具Plotly的应用教程

# 展示数据中survived分布情况
df1=pd.dataframe(data=data['survived'].value_counts())
df1

运行结果：

Python可视化工具Plotly的应用教程

fig1=px.bar(df1,y='survived',text='survived',color_discrete_sequence=[['#b4c7ec','#14a577']])
fig1.update_layout(title='survival status in titanic',
                   title_x=.5,
                  xaxis_title='passenger survival status',
                  yaxis_title='numbers',
                  font=dict(family='arial',color='#000000',size=12),
                  bargap=.5)
fig1.update_xaxes(tick0=0,  #设置x轴起点，防止从负数开始
                  dtick=1,   #设置间隔，防止出现0.5间隔
                  tickvals=[0,1], #设置tick数值，为了重命名
                 ticktext=['drowned','suvived'],#重命名系列index
                 tickfont=dict(family='arial',color='#000000',size=14)) 
fig1.update_yaxes(range=[0,650]) #设置y轴区间,使图形不至于视觉上压迫
fig1.update_traces(textposition='outside',
                   textfont_size=16,
                  textfont_color=['#8c1004','#007046'])
fig1.show()

运行结果：

Python可视化工具Plotly的应用教程

# 以survived 与sex为例，展示各性别下，生存与死亡的相对关系。
df_sex=pd.dataframe(data=data.groupby(['survived','sex'])['passengerid'].count())
df_sex=df_sex.reset_index()
df_sex

运行结果：

Python可视化工具Plotly的应用教程

fig_sex1=px.bar(df_sex,x='survived',y='passengerid',color='sex',barmode='group',text='passengerid',
                 color_discrete_map={'female':'#f17f0b','male':'#0072e5'})

fig_sex1.update_traces(textposition='outside',
                   textfont_size=14,
                      textfont_color=['#8c1004','#007046'])

fig_sex1.update_xaxes(
                  tickvals=[0,1], #设置tick数值，为了重命名
                 ticktext=['drowned','suvived'],#重命名系列index
                 tickfont=dict(family='arial',
                           color='#000000',
                           size=14)) 

fig_sex1.update_layout(title='overall suvival in terms of sex',
                       title_x=.5,
                       bargap=.35,  
                       xaxis_title='',
                      yaxis_title='numbers of passengers',
                      font=dict(family='arial',
                           color='#000000',
                           size=13))

fig_sex1.update_yaxes(range=[0,500],
                     dtick=100)

fig_sex1.show()

运行结果：

Python可视化工具Plotly的应用教程

fig_sex2=px.bar(df_sex,x='sex',y='passengerid',facet_col='survived',text='passengerid',
               color_discrete_sequence=[['#f17f0b','#0072e5']])

fig_sex2.update_traces(textposition='outside',
                      textfont_size=14,)

fig_sex2.update_layout(title='overall suvival in terms of sex',
                       title_x=.5,
                       bargap=.35,  
                      yaxis_title='numbers of passengers',
                      font=dict(family='arial',
                           color='#000000',
                           size=13),
                      )
#取消自带sex标题
fig_sex2.update_layout(xaxis=dict(title=''),
                      xaxis2=dict(title=''))
fig_sex2.update_yaxes(range=[0,500],
                     dtick=100)

fig_sex2.for_each_annotation(lambda a:a.update(text=a.text.replace('survived=0.0','drowned')))
fig_sex2.for_each_annotation(lambda a:a.update(text=a.text.replace('survived=1.0','suvived')))

fig_sex2.update_layout(annotations=[dict(font=dict(size=16,
                                                  color='#002cb2'))])
fig_sex2.show()

运行结果：

Python可视化工具Plotly的应用教程

# 以survived 与pclass为例，展示各舱位等级下，生存与死亡的相对关系。
df_pclass=pd.dataframe(data=data.groupby(['survived','pclass'])['passengerid'].count())
df_pclass=df_pclass.reset_index()
df_pclass

运行结果：

Python可视化工具Plotly的应用教程

fig_sex1=px.bar(df_pclass,x='survived',y='passengerid',color='pclass',barmode='group',text='passengerid',
                 color_discrete_map={'1':'#f17f0b','2':'#0072e5','3':'#8c1004'})

fig_sex1.update_traces(textposition='outside',
                   textfont_size=14,
                      textfont_color=['#8c1004','#007046'])

fig_sex1.update_xaxes(
                  tickvals=[0,1], #设置tick数值，为了重命名
                 ticktext=['drowned','suvived'],#重命名系列index
                 tickfont=dict(family='arial',
                           color='#000000',
                           size=14)) 

fig_sex1.update_layout(title='overall suvival in terms of pclass',
                       title_x=.5,
                       bargap=.35,  
                       xaxis_title='',
                      yaxis_title='numbers of passengers',
                      font=dict(family='arial',
                           color='#000000',
                           size=13))

fig_sex1.update_yaxes(range=[0,500],
                     dtick=100)

fig_sex1.show()

运行结果：

Python可视化工具Plotly的应用教程

以上就是python可视化工具plotly的应用教程的详细内容，更多关于python plotly的资料请关注其它相关文章！

Python可视化工具Plotly的应用教程

目录

一.简介

二.各图运用

1.柱状图

2.散点图

3.冒泡散点图

4.旭日图

5.地图图形

三.实战案例

用Python编写分析Python程序性能的工具的教程

Google开源的Python格式化工具YAPF的安装和使用教程

在Docker上开始部署Python应用的教程

Windows 64位下安装Redis和可视化工具Redis Desktop Manager的图文教程

在服务器端实现无间断部署Python应用的教程

以911新闻为例演示Python实现数据可视化的教程

用Python制作检测Linux运行信息的工具的教程

使用Python编写类UNIX系统的命令行工具的教程

python教程：用简单的Python编写Web应用程序

Python数据分析:手把手教你用Pandas生成可视化图表的教程