目前我正在研究张量流模型。此模型基于2个字符串和数字对情境进行分类。所以我的占位符如下所示:
Input1 = tf.placeholder("string", shape=None, name="string1")
Input2 = tf.placeholder("string", shape=None, name="string2")
Input3 = tf.placeholder("float", shape=None, name="distance")
label = tf.placeholder("int64", shape=None, name="output")
我想通过以下代码使用Tensorflow服务来提供此模型:
signature_definition = tf.saved_model.signature_def_utils.build_signature_def(
inputs={'input1': model_input1, 'input2': model_input2, 'input3': model_input3},
outputs={'outputs': model_output},
method_name=tf.saved_model.signature_constants.PREDICT_METHOD_NAME)
builder = tf.saved_model.builder.SavedModelBuilder(SERVE_PATH)
builder.add_meta_graph_and_variables(
sess, [tf.saved_model.tag_constants.SERVING],
signature_def_map={
tf.saved_model.signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY:
signature_definition
})
但我写的模型希望字符串作为one_hot编码输入。有人知道如何将输入张量转换为one_hot编码的张量,并将它们提供给我的模型吗?在训练我的模型时,我只是在喂它们之前用功能对它们进行了改造。这在服务时似乎是不可能的,因为我只能定义输入函数,而不是输入数据的流。
tf.one_hot提供了一个热门编码。
但是,更广泛地说,您需要协调培训和服务以使用相同的索引。 Tensorflow Transform提供了在训练数据处理阶段进行多次转换(单热,缩放,bucketize)的方法,包括单热编码,并将转换保存为模型图的一部分,因此自动重新应用相同的转换在服务时间,为您节省手工工作。通过以下链接查看他们的示例:
示例:https://www.tensorflow.org/tfx/transform/tutorials/TFT_simple_example
例2:https://github.com/tensorflow/transform/blob/master/examples/sentiment_example.py
完整的Python API:https://www.tensorflow.org/tfx/transform/api_docs/python/tft
你在那里寻找的功能是tft.compute_and_apply_vocabulary。