OnnxRuntimeSessionOptions

Inheritance: java.lang.Object

public class OnnxRuntimeSessionOptions

创建 ONNX InferenceSession 的配置选项。我们建议保留优化后的默认值,除非您对修改非常确定。有关技术细节,请参阅 ONNX Runtime 文档。

构造函数

构造函数描述
OnnxRuntimeSessionOptions()

字段

字段描述
enableCpuMemArena启用或禁用 ONNX Runtime 使用的 CPU 内存 arena 分配器。
enableMemoryPattern启用或禁用输入张量的内存模式优化。
executionMode会话的执行模式。
graphOptimizationLevel会话的图优化级别。
interOpNumThreads并行运行多个操作的线程数。
intraOpNumThreads单个操作的线程数。

OnnxRuntimeSessionOptions()

public OnnxRuntimeSessionOptions()

enableCpuMemArena

public static boolean enableCpuMemArena

启用或禁用 ONNX Runtime 使用的 CPU 内存 arena 分配器。启用时,内存会被池化并重复使用以提升性能,但在多线程场景下可能导致内存消耗增加。禁用可在牺牲性能的情况下降低峰值内存使用。

enableMemoryPattern

public static boolean enableMemoryPattern

启用或禁用输入张量的内存模式优化。启用时,ONNX Runtime 会缓存内存分配模式以加快执行,但可能会增加动态输入形状的内存使用。若输入差异显著或需要降低内存占用,请禁用。

executionMode

public static ExecutionModeOnnx executionMode

会话的执行模式。默认情况下,运算符会在可能时并发执行。

graphOptimizationLevel

public static GraphOptimizationLevelOnnx graphOptimizationLevel

会话的图优化级别。默认情况下,所有可用的优化均已启用,以获得最大性能。

interOpNumThreads

public static int interOpNumThreads

并行运行多个操作的线程数。如果已启用顺序执行,则此值将被忽略。

intraOpNumThreads

public static int intraOpNumThreads

单个操作的线程数。