OnnxRuntimeSessionOptions
Inheritance: java.lang.Object
public class OnnxRuntimeSessionOptions
Параметры конфигурации для создания ONNX InferenceSession. Мы рекомендуем оставлять оптимизированные значения по умолчанию, если вы не полностью уверены в изменениях. Для технических деталей см. документацию ONNX Runtime.
Конструкторы
| Конструктор | Описание |
|---|---|
| OnnxRuntimeSessionOptions() |
Поля
| Поле | Описание |
|---|---|
| enableCpuMemArena | Включает или отключает аллокатор арены памяти CPU, используемый ONNX Runtime. |
| enableMemoryPattern | Включает или отключает оптимизацию шаблона памяти для входных тензоров. |
| executionMode | Режим выполнения для сессии. |
| graphOptimizationLevel | Уровень оптимизации графа для сессии. |
| interOpNumThreads | Количество потоков для выполнения нескольких операций параллельно. |
| intraOpNumThreads | Количество потоков для одной операции. |
OnnxRuntimeSessionOptions()
public OnnxRuntimeSessionOptions()
enableCpuMemArena
public static boolean enableCpuMemArena
Включает или отключает аллокатор арены памяти CPU, используемый ONNX Runtime. При включении память собирается в пул и переиспользуется для повышения производительности, но может привести к увеличенному потреблению памяти в многопоточных сценариях. Отключите, чтобы снизить пиковое использование памяти за счёт производительности.
enableMemoryPattern
public static boolean enableMemoryPattern
Включает или отключает оптимизацию шаблонов памяти для входных тензоров. При включении ONNX Runtime кэширует шаблоны выделения памяти для более быстрой работы, но может увеличить использование памяти при динамических формах входных данных. Отключите, если входы сильно различаются или чтобы уменьшить объём памяти.
executionMode
public static ExecutionModeOnnx executionMode
Режим выполнения для сеанса. По умолчанию операторы выполняются параллельно, когда это возможно.
graphOptimizationLevel
public static GraphOptimizationLevelOnnx graphOptimizationLevel
Уровень оптимизации графа для сеанса. По умолчанию все доступные оптимизации включены для максимальной производительности.
interOpNumThreads
public static int interOpNumThreads
Количество потоков для параллельного выполнения нескольких операций. Если включено последовательное выполнение, это значение игнорируется.
intraOpNumThreads
public static int intraOpNumThreads
Количество потоков для одной операции.