『冲刺』活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”( 三 )


『冲刺』活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”
图片

考虑一个简单的例子 。 在第5轮 , 你知道如果此时冲刺将获得10个单位的收益 , 然而处理器必须冷却几个回合才能再次冲刺 。 假设现在你冲刺了 , 那么在第6轮 , 你会发现冲刺可以获得20个单位的收益 。 另一种情况是 , 你将冲刺权保存到了下一轮但所有其他用户都决定在第5轮时冲刺 , 这导致电力紧急情况 , 使你无法在后续几轮中冲刺 。 更糟的是 , 到那时你的收益就不会那么高了 。
短跑游戏中的“平均场博弈分析”
『冲刺』活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”
图片

玩家们使用一个数据中心来共享信息 。 如果其中一个玩家选择在第5轮冲刺 , 他们将获得一定的收益 , 但他们必须要等处理器冷却一段时间才能再次加速 。 如果他们等到第6轮或者之后再冲刺 , 他们会获得更多收益 。
『冲刺』活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”
图片

如果太多的玩家同时冲刺 , 电流大幅度增加会导致断电 。 在计算机集群的不间断电源电池充电之前 , 任何人都不能再冲刺 , 即使是没有冲刺的玩家4也不行 。
所有用户都必须权衡他们获得的效用的多少和其他用户的冲刺策略 , 之后再做出相应的决定 。 虽然少数用户竞争的例子可能很有趣 , 但随着竞争对手的数量增长到数据中心的规模 , 做出这些决定就变得非常棘手 。
幸运的是 , 我们找到了这种叫做“平均场博弈分析”的方法 , 可以在在大型系统中优化每个用户的策略 。 这种方法将所有用户策略考虑为一个整体 , 避免了考虑每个竞争对手策略的复杂性 。 这种统计方法的关键在于假设任何单个用户行为都不会显著地改变系统的平均行为 。 正是由于这一假设 , 我们可以用单个平均效应来近似所有其他用户对任何给定用户的影响 。
这有点类似于数百万上班族试图优化他们的日常出行 。 我们以文摘菌这样一个上班族为例 。 虽然不能用她以一概全 。 但是 , 文摘菌的行为模式可以推断出上班族这一总体在特定一天中希望到达的时间 , 以及他们的出行计划会如何加剧道路拥堵等 。
平均场分析允许我们找到冲刺游戏的“平均场平衡” 。 用户会优化他们对群体的响应 。 这也意味着 , 在平衡状态下 , 偏离他们对整体的最佳响应将没有任何好处 。
在交通情况中 , 文摘菌会根据对通勤人群平均行为的理解来优化通勤 。 如果优化后的计划没有产生预期的交通模式 , 她就会修正自己的预期并重新考虑自己的计划 。 随着每一个通勤者在几天内的一次优化 , 交通收敛到一些重复的模式 , 通勤者的独立行动产生一个平衡 。
通过平均场平衡 , 我们制定了冲刺游戏的最优策略:当性能收益超过某个阈值时 , 用户应该冲刺 。
该阈值根据用户的不同而不同 。 我们可以使用数据中心的工作负载及其物理特性来计算这个阈值 。
当每个人都在平均场平衡下以他们的最优阈值运行时 , 系统将会受益良多 。 首先 , 数据中心的电源管理可以是分布式的 , 因为用户可以实现他们自己的策略 , 而不需要向中心管理员请求加速许可 。 这种独立性使得功率控制更加灵敏、节能 。 用户可以在微秒或更少的时间内调节处理器的功耗 。 而如果他们必须等待几十毫秒来获得许可 , 才能通过数据中心 , 那么这种效果将难以实现 。 其次 , 用户可以根据自己的工作负载需求来及时优化加速策略 , 使得均衡条件下可以完成更多计算工作 。 最后 , 当增益超过阈值时 , 用户的策略就变成了简单的冲刺 。 这是非常容易执行的 。
『冲刺』活捉那只抢算力的谷歌员工!挤占计算资源?博弈论或可破解数据中心“囚徒困境”
图片

贪得无厌必自毙:在冲刺游戏中 , 与“贪心”策略相比 , 使用平均场均衡策略可以用更少的力完成更多的功 。


推荐阅读