OnnxRuntimeSessionOptions

Inheritance: java.lang.Object

public class OnnxRuntimeSessionOptions

Konfigurationsalternativ för att skapa ONNX InferenceSession. Vi rekommenderar att behålla de optimerade standardinställningarna såvida du inte är helt säker på ändringarna. För tekniska detaljer, se ONNX Runtime-dokumentationen.

Konstruktörer

KonstruktorBeskrivning
OnnxRuntimeSessionOptions()

Fält

FältBeskrivning
enableCpuMemArenaAktiverar eller inaktiverar CPU‑minnesarenans allokerare som används av ONNX Runtime.
enableMemoryPatternAktiverar eller inaktiverar minnesmönsteroptimering för inmatningstensorer.
executionModeExekveringsläge för sessionen.
graphOptimizationLevelGrafoptimeringsnivå för sessionen.
interOpNumThreadsAntal trådar för att köra flera operationer parallellt.
intraOpNumThreadsAntal trådar för en enskild operation.

OnnxRuntimeSessionOptions()

public OnnxRuntimeSessionOptions()

enableCpuMemArena

public static boolean enableCpuMemArena

Aktiverar eller inaktiverar CPU‑minnesarenans allokerare som används av ONNX Runtime. När den är aktiverad poolas minnet och återanvänds för bättre prestanda, men kan leda till ökad minnesförbrukning i flertrådade scenarier. Inaktivera för att minska toppminnesanvändningen på bekostnad av prestanda.

enableMemoryPattern

public static boolean enableMemoryPattern

Aktiverar eller inaktiverar minnesmönsteroptimering för inmatningstensorer. När den är aktiverad cachar ONNX Runtime minnesallokeringsmönster för snabbare körning, men kan öka minnesanvändningen för dynamiska inmatningsformer. Inaktivera om indata varierar kraftigt eller för att minska minnesfotavtrycket.

executionMode

public static ExecutionModeOnnx executionMode

Exekveringsläge för sessionen. Som standard körs operatorer samtidigt, när det är möjligt.

graphOptimizationLevel

public static GraphOptimizationLevelOnnx graphOptimizationLevel

Grafoptimeringsnivå för sessionen. Som standard är alla tillgängliga optimeringar aktiverade för maximal prestanda.

interOpNumThreads

public static int interOpNumThreads

Antal trådar för att köra flera operationer parallellt. Om sekventiell exekvering är aktiverad ignoreras detta värde.

intraOpNumThreads

public static int intraOpNumThreads

Antal trådar för en enskild operation.