看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gr99123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
一图胜千言,人是一个视觉敏感的动物,大多数人对数字无法在较短的时间内找到规律和业务意义,可视化就势在必行。
视觉化效应 (Visual effects) 是指人类认知过程中,只要将非视觉性信息转化成视觉信息,可以大大增强海马体的记忆与前额叶皮质的思维反应速度。
Pandas 的样式(Styling)和可视化图表(Charts)都可以让数据直达我们的大脑,让数据自己说话。
Pandas的数据可视化依赖于matplotlib模块的pyplot类,matplotlib在安装Pandas会自动安装。Matplotlib可以对图形做细节控制,绘制出出版质量级别的图形,通过Matplotlib,可以简单地绘制出常用的统计图形。
以下是约定俗的引入方法:
# 约定简写为 plt
import matplotlib.pyplot as plt
其他的可视化库有 Altair、Bokeh、seaborn、plotnine、IPython Vega、Plotly 等,样式比较现代、美观,本教程会分别做相关介绍。
在可视化中颜色与 CSS 表示方法相同,可以用 CSS 颜色名和 CSS 合法颜色值表示。
17 种标准色颜色名为: aqua, black, blue, fuchsia, gray, green, lime, maroon, navy, olive, orange, purple, red, silver, teal, white, yellow。
颜色值的概念、表达方式、常见配色可参考 网页常用颜色及颜色代码
在绘制图形时,图形中的文由于matplotlib未加载中文字体页显示乱码,可以通过 matplotlib pyplot 绘图功能 查看解决方案。
以下是可视化过程中 jupyter notebooks 一些问题的解决方案:
图形大小及正确显示中文:
# jupyter notebooks plt 图表配置
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = (15.0, 8.0) # 固定显示大小
plt.rcParams['font.family'] = ['sans-serif'] # 显示中文问题
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文问题
plt.rcParams['axes.unicode_minus'] = False # 显示负号
plt.style.use('seaborn-whitegrid') # 设置图形样式
plt.style.available # 可以得到所有可用的样式
页面大小控制:
# jupyter notebooks 页面自适应宽度
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:100% !important; }</style>"))
# 背景白色 <style>#notebook_panel {background: #ffffff;}</style>
嵌入页面:
# jupyter notebooks 嵌入页面内容
from IPython.display import IFrame
IFrame('https://arxiv.org/pdf/1406.2661.pdf', width=800, height=450)
在邮件中不能直接引用图片,可使用以下方法使用图片的 base64 编码,再用 html 引用:
import base64
f = open('john-lennon.jpg', 'rb')
bs64 = base64.b64encode(f.read()).decode()
img_by_html = f"<img src='data:image/png;base64,{bs64}'/>"
# 在 notebook 中查看
from IPython.core.display import display, HTML
display(HTML(img_by_html))
参考:
更新时间:2023-05-25 18:14:00 标签:pandas 可视化