Google Cloud ML预测是在多个设备上运行还是在单个设备上运行?
我发现我的Google ML预制版运行时间约为7秒,但是当在4核计算机上使用Flask服务器在本地运行我的模型时,需要大约1.8-2.1秒。
有没有办法增加我在Google Cloud ML上使用的设备/资源数量?
是的,您可以使用更多资源来提供预测。但是,该功能仍处于alpha阶段,并且仅适用于选择“受信任的测试人员”的所选帐户列表。如果您需要有关使用多核设置预测服务的帮助,请联系[email protected]。