插入并播放机器学习

2024-06-16 12:10:37 发布

您现在位置:Python中文网/ 问答频道 /正文

开始机器学习最简单的方法是什么?在

我有一个非常实际的应用。在

一些经理把一个数据仓库的“东西”扔到我的大腿上,让我告诉他们是什么推动了销售。

数据包括:

sales by client (clients being doctors offices)
sales by doctor
products they bought
client demographics
all kinds of different date information

汇总数据,基本上是公司与所有客户进行的每一笔交易的完整数据和每一笔交易的详细信息。在

所有数据都存储在SQLServer2008中。在

问题:在c#/python中,是否有任何工具可以连接到数据库,以开始分析趋势/模式/关系?在

更具体地说: 如何将使用python或c的机器学习算法应用到我的数据中,以便提取某种有意义的信息?在


Tags: 数据方法client机器by交易经理数据仓库
3条回答

我不知道从何处着手处理这个问题。首先,这里的问题不是“机器学习”。目前还没有一个软件可以接收一堆数据库表,并回答诸如“是什么推动了销售”这样的问题。天哪,人们连这方面的工作都做不好,所以对无人监督的计算机要求太高了。在

我不清楚这些数据是否包含问题的答案。这些数据确实包含了销售情况和其他各种因素的描述。是否这些“带动”销售是相当主观的。在

其他人对编程工具提出了宝贵的建议。我强烈建议您关注数据挖掘工具,而不是编程工具。SQL Server有一个内置工具。我不确定这是否有用。您可以找到工具列表here。其中一些是免费软件。如果通过编程访问它们,您将面临两个问题。第一,你只关注问题的“编程”方面,而不是结果。第二,即使你找到了好的结果,你也无法与他人沟通。在

最后,我猜测他们真正想要的是一个工具,它可以沿着sqlserver中提供的各种维度对数据进行切片和切分。您可以按照事实表结构组合一组表(正如RalphKimball在其著作《数据仓库工具包》(DataWarehouseToolkit)中所描述的那样)。这听起来像是报告问题,而不是机器学习问题。在

数据挖掘工具捆绑在SQLServer2008中。您应该从google上搜索类似“sqlserver2008中的数据挖掘简介”之类的东西来获取实际示例。在

Google有一个预测/机器学习API,如果你对结果更感兴趣而不是对理解更感兴趣的话,这是非常棒的(尽管有一些背景知识肯定会很有帮助,这样你就可以知道你想做的事情是否有意义)。在

https://developers.google.com/prediction/

相关问题 更多 >