OnnxRuntimeSessionOptions

Inheritance: java.lang.Object

public class OnnxRuntimeSessionOptions

Opzioni di configurazione per la creazione di ONNX InferenceSession. Si consiglia di mantenere le impostazioni predefinite ottimizzate a meno che non si sia assolutamente certi delle modifiche. Per dettagli tecnici, consultare la documentazione di ONNX Runtime.

Costruttori

CostruttoreDescrizione
OnnxRuntimeSessionOptions()

Campi

CampoDescrizione
enableCpuMemArenaAbilita o disabilita l’allocatore di arena di memoria CPU utilizzato da ONNX Runtime.
enableMemoryPatternAbilita o disabilita l’ottimizzazione del pattern di memoria per i tensori di input.
executionModeModalità di esecuzione per la sessione.
graphOptimizationLevelLivello di ottimizzazione del grafo per la sessione.
interOpNumThreadsNumero di thread per eseguire più operazioni in parallelo.
intraOpNumThreadsNumero di thread per un’operazione singola.

OnnxRuntimeSessionOptions()

public OnnxRuntimeSessionOptions()

enableCpuMemArena

public static boolean enableCpuMemArena

Abilita o disabilita l’allocatore di arena di memoria CPU utilizzato da ONNX Runtime. Quando abilitato, la memoria è raggruppata e riutilizzata per migliori prestazioni, ma può comportare un aumento del consumo di memoria in scenari multithread. Disabilita per ridurre l’utilizzo di memoria di picco a scapito delle prestazioni.

enableMemoryPattern

public static boolean enableMemoryPattern

Abilita o disabilita l’ottimizzazione del modello di memoria per i tensori di input. Quando abilitato, ONNX Runtime memorizza nella cache i modelli di allocazione della memoria per un’esecuzione più rapida, ma può aumentare l’uso della memoria per forme di input dinamiche. Disabilita se gli input variano significativamente o per ridurre l’impronta di memoria.

executionMode

public static ExecutionModeOnnx executionMode

Modalità di esecuzione per la sessione. Per impostazione predefinita, gli operatori vengono eseguiti in modo concorrente, quando possibile.

graphOptimizationLevel

public static GraphOptimizationLevelOnnx graphOptimizationLevel

Livello di ottimizzazione del grafo per la sessione. Per impostazione predefinita, tutte le ottimizzazioni disponibili sono abilitate per massime prestazioni.

interOpNumThreads

public static int interOpNumThreads

Numero di thread per eseguire più operazioni in parallelo. Se l’esecuzione sequenziale è abilitata, questo valore viene ignorato.

intraOpNumThreads

public static int intraOpNumThreads

Numero di thread per un’operazione singola.