假设我有一个数据集S,其中包含不同作业的服务时间,比如S={t1,t2,t3,...,tn}
,其中ti是第I个作业的服务时间;n是数据集中的总数。这只是一个群体的样本。这里是30万。我想研究长服务时间的影响,因为有些工作需要很长时间,而有些则不需要。我的直觉是基于从真实系统收集的数据来研究这种影响。研究中的系统有成千上万的工作岗位,而这个数字每几秒钟就增加100个新的工作岗位。此外,服务时间是通过在本地机器上对作业进行基准测试来衡量的。所以实际上,不断扩展数据集是非常昂贵的。因此,我决定随机挑选30万
我正在进行模拟实验,在那里我必须产生大量的工作与他们的服务时间(说数百万),然后做一些其他的计算。你知道吗
如何在我的模拟中使用S作为总体,我遇到了以下问题:
1-使用S本身。我可以使用“带替换的样本”或“不带替换的样本”引导。你知道吗
2-将理论分布模型拟合到S,然后从中得出。你知道吗
我说的对吗?哪种方法最好(利弊)?第一种方法似乎很简单,每次从S中随机选取一个服务时间?它可靠吗?任何建议都是感激的,因为我在统计中没有得到。你知道吗
引用2007年冬季模拟会议this tutorial:
总之,分布拟合需要更多的前期工作,但从长远来看通常更有用。你知道吗
相关问题 更多 >
编程相关推荐