网站建设资讯详细

Python数据导入&日期处理&dataframe作图

发表日期:2023-07-01 15:08:03   作者来源:shuimu   浏览:2345       
导入数据:

import pandas as pd
import numpy as np

data=pd.read_excel("/Users/liuyali/Desktop/饿了么流量分析-离线数据下载5-10月格式已经调整.xls")
print(data)


分组求和:使用data.groupby函数

单个
t=data.groupby(data['日期'])['总曝光人数'].sum()

data=df.groupby('A')
data.agg({'B':'mean','C':'sum'})
df.groupby('A').apply(np.mean)

对多列求和,放在dataframe里
df.groupby(['A','B']).mean()


as_index=False


dataframe 
横坐标指定:
纵坐标指定:
在 Python 中使用 Pandas 和 Matplotlib 库,您可以按如下步骤将 DataFrame 的两列数据提取出来,制作线性图:
1.导入所需的库:
import pandas as pd
import matplotlib.pyplot as plt
2.读取数据并创建 DataFrame:
假设数据文件名为 "data.csv",其中包含两列数据 "x" 和 "y",您可以使用以下代码读取数据并创建 DataFrame:
df = pd.read_csv("data.csv")
3.提取所需的两列数据:
假设您要提取的两列数据分别为 "x" 和 "y",您可以使用以下代码将它们提取出来:
x = df["x"]
y = df["y"]
4.绘制线性图:
使用以下代码,您可以使用提取的数据绘制线性图:
plt.plot(x, y, 'o')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Linear Plot')
plt.show()
这将绘制一个以 "x" 为横坐标,"y" 为纵坐标的线性图。如果您要更改线条的颜色或样式,可以在 plot() 方法的第三个参数中指定。例如,plt.plot(x, y, 'r--') 将绘制红色虚线的线性图。

plt.plot(t['date_column'],t['总曝光人数'])


日期作为横坐标要变化下
data['date_column']=pd.to_datetime(data['日期'],format='%Y%m%d')

要将 DataFrame 的日期数据作为横坐标,需要先确保日期数据已被正确解析为 pandas 中的日期时间对象。可以通过下面的方式将字符串格式的日期时间数据解析为 pandas 的日期时间对象:
import pandas as pd

# 假设日期字符串的格式为 "%Y-%m-%d %H:%M:%S"
df['date_column'] = pd.to_datetime(df['date_column'], format='%Y-%m-%d %H:%M:%S')

import matplotlib.pyplot as plt

plt.plot(df['date_column'], df['data_column'])
plt.xlabel('Date')
plt.ylabel('Data')
plt.show()

Python数据导入&日期处理&dataframe作图