rmccorm4 · May 11, 2020 18:22 · May 11, 2020 · May 10, 2020
diff --git a/setup_binding_shapes.py b/setup_binding_shapes.py
@@ -12,13 +12,14 @@ def setup_binding_shapes(
 
     assert context.all_binding_shapes_specified
 
-    host_outputs = [None] * len(output_binding_idxs)
-    device_outputs = [None] * len(output_binding_idxs)
-    for i, binding_index in enumerate(output_binding_idxs):
+    host_outputs = []
+    device_outputs = []
+    for binding_index in output_binding_idxs:
         output_shape = context.get_binding_shape(binding_index)
         # Allocate buffers to hold output results after copying back to host
-        host_outputs[i] = np.empty(output_shape, dtype=np.float32)
+        buffer = np.empty(output_shape, dtype=np.float32)
+        host_outputs.append(buffer)
         # Allocate output buffers on device
-        device_outputs[i] = cuda.mem_alloc(host_outputs[i].nbytes)
+        device_outputs.append(cuda.mem_alloc(buffer.nbytes))
 
     return host_outputs, device_outputs
diff --git a/setup_binding_shapes.py b/setup_binding_shapes.py
@@ -0,0 +1,24 @@
+def setup_binding_shapes(
+    engine: trt.ICudaEngine,
+    context: trt.IExecutionContext,
+    host_inputs: List[np.ndarray],
+    input_binding_idxs: List[int],
+    output_binding_idxs: List[int],
+):
+    # Explicitly set the dynamic input shapes, so the dynamic output
+    # shapes can be computed internally
+    for host_input, binding_index in zip(host_inputs, input_binding_idxs):
+        context.set_binding_shape(binding_index, host_input.shape)
+
+    assert context.all_binding_shapes_specified
+
+    host_outputs = [None] * len(output_binding_idxs)
+    device_outputs = [None] * len(output_binding_idxs)
+    for i, binding_index in enumerate(output_binding_idxs):
+        output_shape = context.get_binding_shape(binding_index)
+        # Allocate buffers to hold output results after copying back to host
+        host_outputs[i] = np.empty(output_shape, dtype=np.float32)
+        # Allocate output buffers on device
+        device_outputs[i] = cuda.mem_alloc(host_outputs[i].nbytes)
+
+    return host_outputs, device_outputs
No results found