pandas/matplotlib:刻面条形图

## first try--plain vanilla import pandas as pd import numpy as np N = 100 ## generate toy data ind = np.random.choice(['a','b','c'], N) cty = np.random.choice(['x','y','z'], N) jobs = np.random.randint(low=1,high=250,size=N) ## prep data frame df_city = pd.DataFrame({'industry':ind,'city':cty,'jobs':jobs}) df_city_grouped = df_city.groupby(['city','industry']).jobs.sum().unstack() df_city_grouped.plot(kind='bar',stacked=True,figsize=(9, 6))

## R code library(plyr) df_city<-read.csv('/home/aksel/Downloads/mockcity.csv',sep='\t') ## summarize df_city_grouped <- ddply(df_city, .(city,industry), summarise, jobstot = sum(jobs)) ## plot ggplot(df_city_grouped, aes(x=industry, y=jobstot)) + geom_bar(stat='identity') + facet_wrap(~city)

cols =df_city.city.value_counts().shape[0] fig, axes = plt.subplots(1, cols, figsize=(8, 8)) for x, city in enumerate(df_city.city.value_counts().index.values): data = df_city[(df_city['city'] == city)] data = data.groupby(['industry']).jobs.sum() axes[x].plot(data)

2条回答

网友

1楼 · 编辑于 2024-05-23 15:06:58

这里的第二个例子：http://pandas-docs.github.io/pandas-docs-travis/visualization.html#bar-plots

不管怎样，你可以像你自己一样，用手来做。

编辑：顺便说一句，您可以在python中始终使用rpy2，这样您就可以做与R中相同的事情

还有，看看这个：http://pandas.pydata.org/pandas-docs/stable/rplot.html 我不确定，但它应该有助于在许多面板上创建绘图，尽管可能需要进一步阅读。

网友

2楼 · 编辑于 2024-05-23 15:06:58

@tcasell建议在循环中调用bar。这是一个工作，如果不是优雅的例子。

## second try--facet by county

N = 100
industry = ['a','b','c']
city = ['x','y','z']
ind = np.random.choice(industry, N)
cty = np.random.choice(city, N)
jobs = np.random.randint(low=1,high=250,size=N)
df_city =pd.DataFrame({'industry':ind,'city':cty,'jobs':jobs})

## how many panels do we need?
cols =df_city.city.value_counts().shape[0]
fig, axes = plt.subplots(1, cols, figsize=(8, 8))

for x, city in enumerate(df_city.city.value_counts().index.values):
    data = df_city[(df_city['city'] == city)]
    data = data.groupby(['industry']).jobs.sum()
    print (data)
    print type(data.index)
    left=  [k[0] for k in enumerate(data)]
    right=  [k[1] for k in enumerate(data)]

    axes[x].bar(left,right,label="%s" % (city))
    axes[x].set_xticks(left, minor=False)
    axes[x].set_xticklabels(data.index.values)

    axes[x].legend(loc='best')
    axes[x].grid(True)
    fig.suptitle('Employment By Industry By City', fontsize=20)

enter image description here

相关问题更多 >

编程相关推荐

热门问题

热门文章