Orange3使用Spark ML的一系列小部件

Orange3-spark的Python项目详细描述


Orange数据挖掘套件的一组小部件,用于ApacheSparkMLAPI。

要求

  • Python >= 3.4
  • Pandas
  • Orange 3

请按照说明先安装Orange 3。

主要的橙色项目位于:https://github.com/biolab/orange3 下载位置:http://orange.biolab.si

功能

  • A Spark Context.
  • A Hive Table.
  • A Dataframe from an SQL Query.
  • A Dataset Builder, basically a call to VectorAssembler, this is usefull before sending data to Estimators.
  • Transformers from the feature module.
  • Estimators from classification module.
  • Estimators from regression module.
  • Estimators from clustering module.
  • Evaluation from evaluator module.
  • A PySpark script executor + PySpark console.
  • DataFrame transformes for Pandas and Orangle Tables

…很快就会有更多!

安装

首先,您需要安装apache spark。请按照以下说明操作: http://spark.apache.org/docs/latest/

然后您可以:

pip install Orange3-spark

或者从orange的options add-on s菜单安装插件。注意,如果 从“加载项”菜单安装,如果不是所有要求,安装可能会失败 是可以满足的。

如果需要ODBC连接,则需要安装pyodbc (如果使用pip构建,则需要sql.h可用。” 这是Linux上的unixodbc dev包)。

如果安装正常,您应该会看到一个橙色的新部分,其中包含来自spark ml api的一系列小部件。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Play Framework 2.1中的简单搜索?   java:Springbeans的真正工作原理   java不能从字符串中提取数字   不同管道中的java共享ExecutionHandler   在Java中,如何为扩展comparator的类实现多个comparator方法?   通用混沌Java   java问题:从自定义类获取要添加到驱动程序类的形状   java如何利用HikariCP和Hibernate?   eclipse如何执行Java应用程序?   用户界面Java Swing:如何将JLabel的文本绑定到JTable选定行中的列?   java替换JPanel元素而不添加到面板的末尾?   java Sets根据action命令在按钮组中选择了特定的jradiobutton   在java中如何将从控制台添加的字符串中的元素添加到列表中   处理未在浏览器上运行的Java签名小程序   java如何在我的安卓应用程序中单击任意按钮时禁用音频音调?   编码如何在Java中将十六进制转换为utf8编码的字符串   java JSF Spring安全集成问题   java如何更正Oracle for Windows中的字符?   java Spark结构化流媒体:当前批次落后   java Hibernate根据最匹配的条件排序结果