我是一名商业智能分析师,从使用python进行数据分析开始。你知道吗
我在编写一个内部使用的营销分析应用程序(营销分析师)的早期阶段,而不需要使用MS Excel进行计算。你知道吗
主要目标是:
提示要求选择原始文件
读取csv/xlsx数据
清除(删除空值、删除总行、格式化数字和日期等)
转换(创建诸如每次点击成本、每千次 印象,每线索,广告支出回报,在每个渠道如 facebook、youtube、谷歌搜索等等)
分析(按通道、类型突出显示最佳和最差性能 加载(在屏幕上打印并在xlsx上写入) 文件)
目前,我已将项目分为两个文件:主.py(主要功能和打印)和数据_准备(与数据清理和转换相关的功能)。你知道吗
我认为必须有一个框架或某种模型,以逻辑和有组织的方式破坏文件,我希望在早期阶段应用这个框架或模型,以避免返工,并构建一个更可靠、更易于维护的应用程序。你知道吗
PS:在这个线程中,我关心的是文件/目录结构,而不是我需要使用的库。
只要文件位置是一致的(共享文件夹、群集文件夹、web服务API派生位置),我认为没有“最佳”方法来组织文件或目录。在你的标签上要清楚,你应该能够把所有的数据放在一个地方。文件结构如下:
你的代码有隐藏或比特桶回购吗?如果是这样的话,请将其用于scratchwork,并且只保留当前代码。/prog。你知道吗
如果您正在使用GoogleAnalytics,您可能希望尝试直接从Python进行API调用,而不是将csv文件下载到./source。它只会把变量的数量减少一个。你知道吗
相关问题 更多 >
编程相关推荐