如何设计一个有趣的数字猜谜游戏算法？

Question

更新（2020年7月）：这个问题已经有9年了，但我仍然对此非常感兴趣。在这段时间里，机器学习（如RNN、CNN、GAN等）、新方法和便宜的GPU出现了，这使得新的解决方案成为可能。我觉得重新审视这个问题会很有趣，看看有没有新的方法。

我正在学习编程（Python和算法），并试图做一个我觉得有趣的项目。我已经创建了一些基本的Python脚本，但我不太确定如何解决我想要构建的游戏。

游戏的工作原理如下：

用户会得到一些有价值的物品。例如，

Apple = 1
Pears = 2
Oranges  = 3

然后他们可以选择任何他们喜欢的组合（比如100个苹果、20个梨和一个橙子）。计算机得到的唯一输出是总价值（在这个例子中，目前是143美元）。计算机会尝试猜测他们拥有的物品。显然，它在第一轮时不会猜对。

         Value    quantity(day1)    value(day1)
Apple      1        100                100
Pears      2         20                 40
Orange     3          1                  3
Total               121                143

在下一轮中，用户可以修改他们的数量，但不能超过总数量的5%（或者我们可以选择的其他百分比。我这里用5%作为例子）。水果的价格可以随机变化，因此总价值也可能会因此变化（为了简单起见，我在这个例子中不改变水果价格）。在游戏的第二天，用户返回的价值是152美元，第三天是164美元。以下是一个例子：

Quantity (day2)   %change (day2)    Value (day2)   Quantity (day3)   %change (day3)   Value(day3)
 104                                 104            106                                106
  21                                  42             23                                 46
   2                                   6              4                                 12
 127               4.96%             152            133               4.72%            164

*(我希望表格能正确显示，我手动调整了间距，希望这不仅仅是在我的屏幕上显示，如果不行请告诉我，我会尝试上传截图。)

我试图看看能否随着时间的推移找出数量（假设用户会有耐心不断输入数字）。我现在知道的唯一限制是总价值不能超过5%，所以我现在无法在5%的准确度内，所以用户会一直输入下去。

我到目前为止做了什么

这是我到目前为止的解决方案（不多）。基本上，我把所有的价值都拿出来，找出所有可能的组合（这部分我已经完成）。然后我把所有可能的组合放入一个数据库，作为字典（例如，对于143美元，可能有一个字典条目{苹果:143，梨:0，橙子:0}，一直到{苹果:0，梨:1，橙子:47}。每次我得到一个新数字时，我都会这样做，所以我有一个所有可能性的列表。

这是我卡住的地方。根据上述规则，我该如何找出最佳解决方案？我觉得我需要一个适应度函数，自动比较两天的数据，并去除与前一天数据差异超过5%的可能性。

问题：

所以我想问的是，用户改变总数，而我有所有概率的列表，我该如何处理？我需要学习什么？有没有适用的算法或理论可以使用？或者，为了帮助我理解我的错误，你能建议我可以添加什么规则来使这个目标可行（如果它在当前状态下不可行。我在想增加更多水果，并要求他们至少选择3种等等）？另外，我对遗传算法只有模糊的理解，但我觉得我可以在这里使用它们，有没有什么可以用的？

我非常渴望学习，所以任何建议或提示都将非常感激（请不要告诉我这个游戏是不可能的）。

更新：收到反馈说这个问题很难解决。所以我想在游戏中添加另一个条件，这不会干扰玩家的操作（对他们来说游戏保持不变），但每天水果的价格会随机变化。这会让解决问题变得更容易吗？因为在5%的波动和某些水果价格变化下，随着时间的推移，只有少数组合是可能的。

第一天，任何组合都是可能的，得到一个足够接近的范围几乎是不可能的，但随着水果价格的变化，用户只能选择5%的变化，那么（随着时间的推移）范围应该会越来越窄。在上面的例子中，如果价格波动足够，我觉得我可以通过暴力破解找到一个范围来猜测，但我在试图找出是否有更优雅的解决方案或其他解决方案来不断缩小这个范围。

更新2：在阅读和询问后，我相信这是一个隐藏的马尔可夫/Viterbi问题，它跟踪水果价格的变化以及总和（加重最近的数据点）。但我不确定如何应用这个关系。我认为是这样，但可能错了，但至少我开始怀疑这是一种机器学习问题。

更新3：我创建了一个测试案例（使用较小的数字）和一个生成器，以帮助自动化用户生成的数据，并试图从中创建一个图表，以查看哪些更可能。

这是代码，以及总值和用户实际水果数量的注释。

#!/usr/bin/env python
import itertools

# Fruit price data
fruitPriceDay1 = {'Apple':1, 'Pears':2, 'Oranges':3}
fruitPriceDay2 = {'Apple':2, 'Pears':3, 'Oranges':4}
fruitPriceDay3 = {'Apple':2, 'Pears':4, 'Oranges':5}

# Generate possibilities for testing (warning...will not scale with large numbers)
def possibilityGenerator(target_sum, apple, pears, oranges):
    allDayPossible = {}
    counter = 1
    apple_range = range(0, target_sum + 1, apple)
    pears_range = range(0, target_sum + 1, pears)
    oranges_range = range(0, target_sum + 1, oranges)
    for i, j, k in itertools.product(apple_range, pears_range, oranges_range):
        if i + j + k == target_sum:
            currentPossible = {}

            #print counter
            #print 'Apple', ':', i/apple, ',', 'Pears', ':', j/pears, ',', 'Oranges', ':', k/oranges
            currentPossible['apple'] = i/apple
            currentPossible['pears'] = j/pears
            currentPossible['oranges'] = k/oranges

            #print currentPossible
            allDayPossible[counter] = currentPossible
            counter = counter +1
    return allDayPossible

# Total sum being returned by user for value of fruits
totalSumDay1=26 # Computer does not know this but users quantities are apple: 20, pears 3, oranges 0 at the current prices of the day
totalSumDay2=51 # Computer does not know this but users quantities are apple: 21, pears 3, oranges 0 at the current prices of the day
totalSumDay3=61 # Computer does not know this but users quantities are apple: 20, pears 4, oranges 1 at the current prices of the day
graph = {}
graph['day1'] = possibilityGenerator(totalSumDay1, fruitPriceDay1['Apple'], fruitPriceDay1['Pears'], fruitPriceDay1['Oranges'] )
graph['day2'] = possibilityGenerator(totalSumDay2, fruitPriceDay2['Apple'], fruitPriceDay2['Pears'], fruitPriceDay2['Oranges'] )
graph['day3'] = possibilityGenerator(totalSumDay3, fruitPriceDay3['Apple'], fruitPriceDay3['Pears'], fruitPriceDay3['Oranges'] )

# Sample of dict = 1 : {'oranges': 0, 'apple': 0, 'pears': 0}..70 : {'oranges': 8, 'apple': 26, 'pears': 13}
print graph

数据分析算法设计机器学习组合优化遗传算法隐马尔可夫模型适应度函数数字猜谜游戏

如何设计一个有趣的数字猜谜游戏算法？

7 个回答

好莱坞版

原版

问题1：寻找潜在解决方案

问题2：限制潜在解决方案的集合

撰写回答