OnnxRuntimeSessionOptions

Inheritance: java.lang.Object

public class OnnxRuntimeSessionOptions

Options de configuration pour créer une session d’inférence ONNX. Nous recommandons de conserver les valeurs par défaut optimisées sauf si vous êtes absolument certain des modifications. Pour les détails techniques, consultez la documentation d’ONNX Runtime.

Constructeurs

ConstructeurDescription
OnnxRuntimeSessionOptions()

Champs

ChampDescription
enableCpuMemArenaActive ou désactive l’allocateur d’arène mémoire CPU utilisé par ONNX Runtime.
enableMemoryPatternActive ou désactive l’optimisation du modèle de mémoire pour les tenseurs d’entrée.
executionModeMode d’exécution pour la session.
graphOptimizationLevelNiveau d’optimisation du graphe pour la session.
interOpNumThreadsNombre de threads pour exécuter plusieurs opérations en parallèle.
intraOpNumThreadsNombre de threads pour une opération unique.

OnnxRuntimeSessionOptions()

public OnnxRuntimeSessionOptions()

enableCpuMemArena

public static boolean enableCpuMemArena

Active ou désactive l’allocateur d’arène mémoire CPU utilisé par ONNX Runtime. Lorsqu’il est activé, la mémoire est regroupée et réutilisée pour de meilleures performances, mais cela peut entraîner une consommation de mémoire accrue dans les scénarios multithreads. Désactivez-le pour réduire l’utilisation maximale de la mémoire au détriment des performances.

enableMemoryPattern

public static boolean enableMemoryPattern

Active ou désactive l’optimisation du modèle de mémoire pour les tenseurs d’entrée. Lorsqu’elle est activée, ONNX Runtime met en cache les modèles d’allocation de mémoire pour une exécution plus rapide, mais cela peut augmenter l’utilisation de la mémoire pour les formes d’entrée dynamiques. Désactivez-la si les entrées varient considérablement ou pour réduire l’empreinte mémoire.

executionMode

public static ExecutionModeOnnx executionMode

Mode d’exécution pour la session. Par défaut, les opérateurs sont exécutés de manière concurrente, chaque fois que possible.

graphOptimizationLevel

public static GraphOptimizationLevelOnnx graphOptimizationLevel

Niveau d’optimisation du graphe pour la session. Par défaut, toutes les optimisations disponibles sont activées pour des performances maximales.

interOpNumThreads

public static int interOpNumThreads

Nombre de threads pour exécuter plusieurs opérations en parallèle. Si l’exécution séquentielle est activée, cette valeur est ignorée.

intraOpNumThreads

public static int intraOpNumThreads

Nombre de threads pour une opération unique.