带有Plotly Express的Python交互式多线图需要基于列中类似值的每条线

2024-04-23 13:54:33 发布

您现在位置:Python中文网/ 问答频道 /正文

需要使用Plotly Express在交互式二维线图上绘制多条线(大型数据集-将产生约4500条线)

问题是我的变量(x轴和y轴)位于两个单独的列中,并且每行的数据点数量不同。每条线的数据点数量将基于“API/UWI”列——“API/UWI”值为常量的行将代表一条线的所有数据点

即,“API/UWI”列中的值更改时,新行开始

为了清楚起见,下面是我的数据集的一小部分示例

Example dataset

在我的第一次尝试中,我根据“API/UWI”列中的唯一值将数据帧分为多个数据帧,并将所有这些数据帧绘制成图形。成功了!然而,它生成了4500个图形,而不是一个包含4500行的图形

有没有更好的方法来实现这一点并生成一个包含4500行的单一图形

我在下面发布了我在上面所做尝试的代码,以及一个生成的图形示例(用一行)

请尽可能详细地介绍您的解决方案。这是我第一次尝试编写任何类型的代码。我是个初学者。请&;谢谢

    import plotly.express as px
    import pandas as pd
    import numpy as np

    excel_file = r"C:\Users\kevin\Desktop\Bone_Spring_Data_2.xlsx"

    df = pd.read_excel(excel_file)

    split_values_API = df['API/UWI'].unique()

    for API in split_values_API:
        df1 = df[df['API/UWI'] == API]
        df1 = df1.sort_values(by="Monthly Production Date")
        GOR_data = px.line(df1, x='Monthly Production Date' , y='MONTHLY GOR')
        GOR_data.show()

Example plot with 1 line

*根据评论进行编辑:

df.head(21).to_dict()的输出如下:

{'API/UWI': {0: 30015209400000,
  1: 30015209400000,
  2: 30015209400000,
  3: 30015209400000,
  4: 30015209400000,
  5: 30015209400000,
  6: 30015209400000,
  7: 30015209400000,
  8: 30015221570000,
  9: 30015221570000,
  10: 30015221570000,
  11: 30015221570000,
  12: 30015221620000,
  13: 30015221620000,
  14: 30015221620000,
  15: 30015221620000,
  16: 30015221620000,
  17: 30015221620000,
  18: 30015221620000,
  19: 30015221620000,
  20: 30015221620000},
 'Monthly Production Date': {0: Timestamp('2002-04-01 00:00:00'),
  1: Timestamp('2002-05-01 00:00:00'),
  2: Timestamp('2002-06-01 00:00:00'),
  3: Timestamp('2002-07-01 00:00:00'),
  4: Timestamp('2002-08-01 00:00:00'),
  5: Timestamp('2002-09-01 00:00:00'),
  6: Timestamp('2002-10-01 00:00:00'),
  7: Timestamp('2006-07-01 00:00:00'),
  8: Timestamp('2008-08-01 00:00:00'),
  9: Timestamp('2008-09-01 00:00:00'),
  10: Timestamp('2008-10-01 00:00:00'),
  11: Timestamp('2008-11-01 00:00:00'),
  12: Timestamp('2016-10-01 00:00:00'),
  13: Timestamp('2016-11-01 00:00:00'),
  14: Timestamp('2016-12-01 00:00:00'),
  15: Timestamp('2017-01-01 00:00:00'),
  16: Timestamp('2017-02-01 00:00:00'),
  17: Timestamp('2017-03-01 00:00:00'),
  18: Timestamp('2017-04-01 00:00:00'),
  19: Timestamp('2017-05-01 00:00:00'),
  20: Timestamp('2017-06-01 00:00:00')},
 'MONTHLY GOR': {0: 1.278688524590164,
  1: 0.8455284552845529,
  2: 1.8529411764705883,
  3: 0.736,
  4: 1.6818181818181819,
  5: 0.9795918367346939,
  6: 0.5303030303030303,
  7: 0.0,
  8: 14.523809523809524,
  9: 17.07622203811102,
  10: 16.334231805929917,
  11: 14.918367346938776,
  12: 1.4124008651766402,
  13: 1.8545081967213115,
  14: 1.2862351868732909,
  15: 1.4340557275541796,
  16: 2.2898674647285167,
  17: 2.7108673978065805,
  18: 14.311827956989248,
  19: 2.871877001921845,
  20: 2.8629370629370627}}

这是一个与我的示例相匹配的示例数据集(附图)


Tags: 数据importapi图形示例dfasexcel
1条回答
网友
1楼 · 发布于 2024-04-23 13:54:33

首先,如果您想使用plotly.express,您可以使用

px.line(df,
        x='Monthly Production Date',
        y='MONTHLY GOR',
        color='API/UWI')

参数color允许在df中为每个不同的“API/UWI”设置一行

如果您想使用plotly.graph_objs,您可以这样做

import plotly.graph_objs as go
fig = go.Figure()
for ts in df.groupby("API/UWI"):
    ts = ts[1]
    fig.add_trace(go.Scatter(x=ts['Monthly Production Date'],
                             y=ts['MONTHLY GOR']))
fig.show()

在这种情况下,您将为每个“API/UWI”添加一个跟踪

相关问题 更多 >