如何将python数据分析代码分解为模块?

2024-05-29 10:14:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我是一名商业智能分析师,从使用python进行数据分析开始。你知道吗

我在编写一个内部使用的营销分析应用程序(营销分析师)的早期阶段,而不需要使用MS Excel进行计算。你知道吗

主要目标是:

  1. 提示要求选择原始文件

  2. 读取csv/xlsx数据

  3. 清除(删除空值、删除总行、格式化数字和日期等)

  4. 转换(创建诸如每次点击成本、每千次 印象,每线索,广告支出回报,在每个渠道如 facebook、youtube、谷歌搜索等等)

  5. 分析(按通道、类型突出显示最佳和最差性能 加载(在屏幕上打印并在xlsx上写入) 文件)

目前,我已将项目分为两个文件:主.py(主要功能和打印)和数据_准备(与数据清理和转换相关的功能)。你知道吗

我认为必须有一个框架或某种模型,以逻辑和有组织的方式破坏文件,我希望在早期阶段应用这个框架或模型,以避免返工,并构建一个更可靠、更易于维护的应用程序。你知道吗

PS:在这个线程中,我关心的是文件/目录结构,而不是我需要使用的库。


Tags: 文件csv数据模型功能框架应用程序目标
1条回答
网友
1楼 · 发布于 2024-05-29 10:14:29

只要文件位置是一致的(共享文件夹、群集文件夹、web服务API派生位置),我认为没有“最佳”方法来组织文件或目录。在你的标签上要清楚,你应该能够把所有的数据放在一个地方。文件结构如下:

/Marketing/Analysis/dev/
  ./source <- for csv files to be kept
  ./prog <- for your .py files (actual code)
  ./result <- output from your process
  ./notes <- for anything non-functional (ie, release notes or project requests)

你的代码有隐藏或比特桶回购吗?如果是这样的话,请将其用于scratchwork,并且只保留当前代码。/prog。你知道吗

如果您正在使用GoogleAnalytics,您可能希望尝试直接从Python进行API调用,而不是将csv文件下载到./source。它只会把变量的数量减少一个。你知道吗

相关问题 更多 >

    热门问题