cnxk: support quantize and dequantize callback

Srikanth Yalavarthi Wed, 20 Sep 2023 00:29:36 -0700

From: Prince Takkar <ptak...@marvell.com>

Added support for quantize and dequantize callback
functions for TVM models.


Signed-off-by: Prince Takkar <ptak...@marvell.com>
---
 drivers/ml/cnxk/mvtvm_ml_model.h |   2 +
 drivers/ml/cnxk/mvtvm_ml_ops.c   | 127 +++++++++++++++++++++++++++++++
 drivers/ml/cnxk/mvtvm_ml_ops.h   |   4 +
 3 files changed, 133 insertions(+)

diff --git a/drivers/ml/cnxk/mvtvm_ml_model.h b/drivers/ml/cnxk/mvtvm_ml_model.h
index d71df36f5a..57a6ce0bb1 100644
--- a/drivers/ml/cnxk/mvtvm_ml_model.h
+++ b/drivers/ml/cnxk/mvtvm_ml_model.h
@@ -5,6 +5,8 @@
 #ifndef _MVTVM_ML_MODEL_H_
 #define _MVTVM_ML_MODEL_H_
 
+#include <dlpack/dlpack.h>
+
 #include <tvmdp.h>
 
 #include <rte_mldev.h>
diff --git a/drivers/ml/cnxk/mvtvm_ml_ops.c b/drivers/ml/cnxk/mvtvm_ml_ops.c
index 95238d43d8..5292ac97fe 100644
--- a/drivers/ml/cnxk/mvtvm_ml_ops.c
+++ b/drivers/ml/cnxk/mvtvm_ml_ops.c
@@ -7,6 +7,8 @@
 #include <rte_mldev.h>
 #include <rte_mldev_pmd.h>
 
+#include <mldev_utils.h>
+
 #include "cn10k_ml_ops.h"
 
 #include "mvtvm_ml_model.h"
@@ -168,6 +170,8 @@ mvtvm_ml_model_load(struct cnxk_ml_dev *cnxk_mldev, struct 
rte_ml_model_params *
                callback->tvmrt_io_free = cn10k_ml_io_free;
                callback->tvmrt_malloc = cn10k_ml_malloc;
                callback->tvmrt_free = cn10k_ml_free;
+               callback->tvmrt_quantize = mvtvm_ml_io_quantize;
+               callback->tvmrt_dequantize = mvtvm_ml_io_dequantize;
        } else {
                callback = NULL;
        }
@@ -298,3 +302,126 @@ mvtvm_ml_model_stop(struct cnxk_ml_dev *cnxk_mldev, 
struct cnxk_ml_model *model)
 
        return 0;
 }
+
+int
+mvtvm_ml_io_quantize(void *device, uint16_t model_id, const char *layer_name,
+                    const DLTensor **deq_tensor, void *qbuffer)
+{
+       struct cnxk_ml_io_info *info = NULL;
+       struct cnxk_ml_dev *cnxk_mldev;
+       struct cnxk_ml_model *model;
+       uint16_t layer_id = 0;
+       uint8_t *lcl_dbuffer;
+       uint8_t *lcl_qbuffer;
+       uint32_t i;
+       int ret;
+
+#ifdef CNXK_ML_DEV_DEBUG
+       if ((device == NULL) || (deq_tensor == NULL) || (qbuffer == NULL))
+               return -EINVAL;
+#endif
+
+       cnxk_mldev = (struct cnxk_ml_dev *)device;
+
+       model = cnxk_mldev->mldev->data->models[model_id];
+#ifdef CNXK_ML_DEV_DEBUG
+       if (model == NULL) {
+               plt_err("Invalid model_id = %u", model_id);
+               return -EINVAL;
+       }
+#endif
+
+       /* Get layer id */
+       for (layer_id = 0; layer_id < model->mvtvm.metadata.model.nb_layers; 
layer_id++) {
+               if (strcmp(model->layer[layer_id].name, layer_name) == 0)
+                       break;
+       }
+
+#ifdef CNXK_ML_DEV_DEBUG
+       if (layer_id == model->mvtvm.metadata.model.nb_layers) {
+               plt_err("Invalid layer name: %s", layer_name);
+               return -EINVAL;
+       }
+
+       if (model->layer[layer_id].type != ML_CNXK_LAYER_TYPE_MRVL) {
+               plt_err("Invalid layer name / type: %s", layer_name);
+               return -EINVAL;
+       }
+#endif
+
+       info = &model->layer[layer_id].info;
+       lcl_qbuffer = (uint8_t *)qbuffer;
+
+       for (i = 0; i < info->nb_inputs; i++) {
+               lcl_dbuffer = PLT_PTR_ADD(deq_tensor[i]->data, 
deq_tensor[i]->byte_offset);
+
+               ret = cnxk_ml_io_quantize_single(&info->input[i], lcl_dbuffer, 
lcl_qbuffer);
+               if (ret < 0)
+                       return ret;
+
+               lcl_qbuffer += info->input[i].sz_q;
+       }
+
+       return 0;
+}
+
+int
+mvtvm_ml_io_dequantize(void *device, uint16_t model_id, const char 
*layer_name, void *qbuffer,
+                      const DLTensor **deq_tensor)
+{
+       struct cnxk_ml_io_info *info = NULL;
+       struct cnxk_ml_dev *cnxk_mldev;
+       struct cnxk_ml_model *model;
+       uint16_t layer_id = 0;
+       uint8_t *lcl_dbuffer;
+       uint8_t *lcl_qbuffer;
+       uint32_t i;
+       int ret;
+
+#ifdef CNXK_ML_DEV_DEBUG
+       if ((device == NULL) || (deq_tensor == NULL) || (qbuffer == NULL))
+               return -EINVAL;
+#endif
+
+       cnxk_mldev = (struct cnxk_ml_dev *)device;
+
+       model = cnxk_mldev->mldev->data->models[model_id];
+#ifdef CNXK_ML_DEV_DEBUG
+       if (model == NULL) {
+               plt_err("Invalid model_id = %u", model_id);
+               return -EINVAL;
+       }
+#endif
+
+       for (layer_id = 0; layer_id < model->mvtvm.metadata.model.nb_layers; 
layer_id++) {
+               if (strcmp(model->layer[layer_id].name, layer_name) == 0)
+                       break;
+       }
+
+#ifdef CNXK_ML_DEV_DEBUG
+       if (layer_id == model->mvtvm.metadata.model.nb_layers) {
+               plt_err("Invalid layer name: %s", layer_name);
+               return -EINVAL;
+       }
+
+       if (model->layer[layer_id].type != ML_CNXK_LAYER_TYPE_MRVL) {
+               plt_err("Invalid layer name / type: %s", layer_name);
+               return -EINVAL;
+       }
+#endif
+
+       info = &model->layer[layer_id].info;
+       lcl_qbuffer = (uint8_t *)qbuffer;
+
+       for (i = 0; i < info->nb_outputs; i++) {
+               lcl_dbuffer = PLT_PTR_ADD(deq_tensor[i]->data, 
deq_tensor[i]->byte_offset);
+
+               ret = cnxk_ml_io_dequantize_single(&info->output[i], 
lcl_qbuffer, lcl_dbuffer);
+               if (ret < 0)
+                       return ret;
+
+               lcl_qbuffer += info->output[i].sz_q;
+       }
+
+       return 0;
+}
diff --git a/drivers/ml/cnxk/mvtvm_ml_ops.h b/drivers/ml/cnxk/mvtvm_ml_ops.h
index 55459f9f7f..a1a868ef4b 100644
--- a/drivers/ml/cnxk/mvtvm_ml_ops.h
+++ b/drivers/ml/cnxk/mvtvm_ml_ops.h
@@ -21,5 +21,9 @@ int mvtvm_ml_model_load(struct cnxk_ml_dev *cnxk_mldev, 
struct rte_ml_model_para
 int mvtvm_ml_model_unload(struct cnxk_ml_dev *cnxk_mldev, struct cnxk_ml_model 
*model);
 int mvtvm_ml_model_start(struct cnxk_ml_dev *cnxk_mldev, struct cnxk_ml_model 
*model);
 int mvtvm_ml_model_stop(struct cnxk_ml_dev *cnxk_mldev, struct cnxk_ml_model 
*model);
+int mvtvm_ml_io_quantize(void *device, uint16_t model_id, const char 
*layer_name,
+                        const DLTensor **deq_tensor, void *qbuffer);
+int mvtvm_ml_io_dequantize(void *device, uint16_t model_id, const char 
*layer_name, void *qbuffer,
+                          const DLTensor **deq_tensor);
 
 #endif /* _MVTVM_ML_OPS_H_ */
-- 
2.41.0

[PATCH v2 32/34] ml/cnxk: support quantize and dequantize callback

Reply via email to