如何创建一个同时使用R和Python访问文件的数据库?

2024-05-14 17:48:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我对数据库几乎一无所知,所以请容忍我。在

工作流程

下图说明了我想要实现的目标:

enter image description here

  1. 我们在实验室的驾驶模拟器上进行驾驶实验,模拟器将结果保存在“DAQ”(数据采集)文件中。每天大约会生成8个文件。每个文件预计至少有一百万行和大约250列。在
  2. 我想把这些数据文件存储在数据库中。我不知道该怎么做,也不知道该用什么。到目前为止,我的搜索结果显示了SQL、MySQL、NoSQL、MS-Access、Hadoop等,但我仍然无法确定如何将我的文件简单地存储在数据库中,以及在这种情况下,哪种系统会更好。在
  3. DAQ文件不能直接分析,所以Python库'Undaq Tools'可以将DAQ转换成HDF5格式,这种格式可以在Python和R中进行分析。我想从数据库访问存储的数据,并使用Python将所有文件转换为HDF5,然后再次将它们保存在数据库中,保留原始的DAQ文件。在
  4. 最后,我想访问HDF5数据文件,在R中创建一个闪亮的仪表板

我的主要问题是:在这种情况下什么类型的数据库是有用的?有什么教程可以帮助我学习在这种情况下存储和访问数据库吗?请帮忙。在发布这个问题之前,我已经尽我所能搜索,但仍然不知道如何开始。在


Tags: 文件数据数据库目标sql数据文件格式mysql
1条回答
网友
1楼 · 发布于 2024-05-14 17:48:31

So far my search revealed SQL, MySQL, NoSQL, MS Access, Hadoop, etc. but I still can't figure out how to simply store my files in a database and which one of the mentioned systems will be better in this case.

SQL是一种语言,MySQL是一种免费的关系数据库,MS Access是MSOffice套件中关系数据库的一部分,NoSQL是经常用于大数据的非关系数据库,Hadoop用于分布式处理。数据库的类型有很多很多种。在

如果你想要自由和简单,也许可以从MySQL开始。它通常提供PHPMyAdmin接口,与SQL相比,它可能更容易查看结构。您需要花一些时间研究数据库的结构以及如何规范化数据。它不是一个服务器文件系统,所以您不需要简单地将文件上传到其中。当您能够规范化数据并将它们存储在关系中时,它的性能最好。如果您操作这些数据并想在数据库中更新它,那么您也需要一个策略。大部分时间不是花在SQL上,也不是想知道如何将数据放入数据库,而是花在如何规范化数据和构建模式上。在

您可以从Python程序和R程序中连接api。在

回答您关于资源的问题:

什么是数据库规范化? https://en.wikipedia.org/wiki/Database_normalization

SQL:http://www.w3schools.com/sql/ (注意,SQL语法可能因数据库而异)

MySQL社区服务器下载(免费版本):http://dev.mysql.com/downloads/mysql/

MySQL文档:http://dev.mysql.com/doc/

Python MySQL API:https://github.com/farcepest/MySQLdb1

R MySQL API:https://github.com/rstats-db/rmysql

有很多API,这些并不是唯一的,我只是在google上找到了这些API。在

相关问题 更多 >

    热门问题