数据科学LSTM项目反馈

2024-05-14 07:10:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我意识到这有点超出了这里通常被问到的问题范围,所以请原谅。我的任务是为一份数据科学家的工作进行不限成员名额的技术筛选。这是我的第一份工作,要求像这样的东西,所以我想确保我提交了非常好的工作。他们给了我一个数据集,让我确定问题以及如何使用机器学习来解决问题,给出目标特征的统计信息,对数据进行预处理,对数据进行建模,并解释结果。你知道吗

我正在寻找反馈,如果我错过了任何重大的我的结果。高水平的反馈是好的。希望你们中的一些人是数据科学家,或者已经完成了这样的技术筛选,或者已经审查了一个,可以提供一些有价值的反馈给一个未来的数据科学家。你知道吗

谢谢你!你知道吗

Github Link to Project


Tags: 数据github机器信息目标link成员特征
2条回答

如果我是评估者,我会问这样的问题

1)研究/业务问题是什么? 建议:报告开始时要明确说明问题

2)现有的解决方案是什么? 建议:添加一个关于类似问题的现有解决方案及其结果的简要文献综述,最好采用表格形式。你知道吗

3)简要阐述数据的描述性和多元性。 建议:增加描述性和推断性统计数据,包括一些可以从变量相关性中得出的初步假设。你知道吗

4)为什么选择这种特殊的方法来解决问题? 建议:给出可信的理由,并辅以有利于所提议方法的定量假设示例解决方案。你知道吗

5)如果是分类任务,我会问这样的问题,“模型的基线精度是多少?”如果是聚类任务,“聚类纯度的基准是什么?” 建议:从目标变量分布中找出这个精度。你知道吗

最后,你需要明白,为什么会提出这样一个开放式的问题。有两种可能

(a)公司在数据科学方面是新的,不确定他们在寻找什么,也就是说,他们既不具备评估候选人技能所需的专业知识,也不确定他们的要求是什么。如果是这样的话,那么报告必须尽可能的简单和详细。别乱说行话。你知道吗

或者

(b)公司在数据科学方面经验丰富,这是一项过滤测试。为了筛选出自称是数据科学家的笨蛋,他们认为将一些现成的解决方案步骤(如预处理、降维、建模)链接起来解决了一个问题。其基本思想是找出候选人的分析能力。你知道吗

因此,明智地撰写报告,确保没有任何虚假的东西。你知道吗

祝你好运。你知道吗

看一看桌子

Mars Express Power Challenge Get the data, model and predict the thermal power consumption

这里https://kelvins.esa.int/mars-express-power-challenge/

挑战是获得数据并预测未来轨道器的消耗,以计划如何节约能源(当在太阳场存在过热的风险时,以及在太阳夜晚存在变冷的风险时)

团队使用了不同的方法,我可能会选择LSTM。但胜出的团队对“特征工程与选择”进行了非常详细的讲解,重点是重要的不是所使用的工具,而是特征提取与选择的正确选择。 https://arc.aiaa.org/doi/pdf/10.2514/6.2018-2561

我读了获奖论文和你的作品。我真的更喜欢你的方式。 如你所见,如果你读了这篇论文,你的方法是相当可比的,但他们把特征提取研究放在了研究的中心。你知道吗

你可以通过提供更多的证据来保证你的工作,证明你为FE选择了正确的方法。例如,你可以提供两种有限元方法,并比较给出的方法的结果,或者,你解释你选择了一个知道目前的技术状况,这一特定的文件证明布拉布拉布拉。。。你知道吗

您可以添加ARIMA-VAR-VARMA和您的比较结果来说明过去3年在该领域的最新研究论文中的“优于”和参考,以及最近在LSTM上发表的其他关于能源消耗预测的参考文献。你知道吗

你的文件结尾突然,人们会等待一个装饰性的结论,因为我们习惯于在一篇普通的论文中发现。你知道吗

就是这样。你知道吗

(请不要考虑我唯一的意见,因为我不觉得自己是数据科学家:)有一天我会为自己感到非常自豪,我会缩写出你所做的;)谢谢分享,很高兴读到它)

相关问题 更多 >

    热门问题