Class RunThreadCreateRequest

Classe RunThreadCreateRequest

Représente une demande de création d’un thread et de son exécution en une seule demande.

public class RunThreadCreateRequest

Constructeurs

NomDescription
RunThreadCreateRequest()Le constructeur par défaut.

Propriétés

NomDescription
AssistantId { get; set; }Obtient ou définit l’ID de l’assistant à utiliser pour exécuter cette demande.
Instructions { get; set; }Obtient ou définit les instructions qui remplacent les instructions de l’assistant. Cela est utile pour modifier le comportement sur une base par demande.
MaxCompletionTokens { get; set; }Obtient ou définit le nombre maximum de jetons de complétion qui peuvent être utilisés au cours de l’exécution. L’exécution fera de son mieux pour n’utiliser que le nombre de jetons de complétion spécifié, sur plusieurs tours de l’exécution. Si l’exécution dépasse le nombre de jetons de complétion spécifié, l’exécution se terminera avec le statut incomplet. Voir incomplete_details pour plus d’infos.
MaxPromptTokens { get; set; }Obtient ou définit le nombre maximum de jetons d’invite qui peuvent être utilisés au cours de l’exécution. L’exécution fera de son mieux pour n’utiliser que le nombre de jetons d’invite spécifié, sur plusieurs tours de l’exécution. Si l’exécution dépasse le nombre de jetons d’invite spécifié, l’exécution se terminera avec le statut incomplet. Voir incomplete_details pour plus d’infos.
Metadata { get; set; }Obtient ou définit un ensemble de 16 paires clé-valeur qui peuvent être attachées à un objet. Cela peut être utile pour stocker des informations supplémentaires sur l’objet dans un format structuré. Les clés peuvent avoir une longueur maximale de 64 caractères et les valeurs peuvent avoir une longueur maximale de 512 caractères.
Model { get; set; }Obtient ou définit l’ID du modèle à utiliser pour exécuter cette demande. Si une valeur est fournie ici, elle remplacera le modèle associé à l’assistant. Sinon, le modèle associé à l’assistant sera utilisé.
ResponseFormat { get; set; }Obtient ou définit le format que le modèle doit produire. Compatible avec GPT-4o, GPT-4 Turbo et tous les modèles GPT-3.5 Turbo depuis gpt-3.5-turbo-1106. Définir sur { “type”: “json_object” } active le mode JSON, ce qui garantit que le message généré par le modèle est un JSON valide. Important : lors de l’utilisation du mode JSON, vous devez également demander au modèle de produire du JSON vous-même via un message système ou utilisateur. Sans cela, le modèle peut générer un flux interminable d’espaces jusqu’à ce que la génération atteigne la limite de jetons, entraînant une demande de longue durée et apparemment “bloquée”. Notez également que le contenu du message peut être partiellement coupé si finish_reason=“length”, ce qui indique que la génération a dépassé max_tokens ou que la conversation a dépassé la longueur maximale du contexte.
Stream { get; set; }Obtient ou définit si l’on doit utiliser le streaming. Si vrai, renvoie un flux d’événements qui se produisent pendant l’exécution en tant qu’événements envoyés par le serveur, se terminant lorsque l’exécution entre dans un état terminal avec un message data: [DONE].
Temperature { get; set; }Obtient ou définit quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0.8 rendront la sortie plus aléatoire, tandis que des valeurs plus basses comme 0.2 la rendront plus ciblée et déterministe.
Thread { get; set; }Obtient ou définit une demande de création d’un thread.
ToolChoice { get; set; }Obtient ou définit quel (le cas échéant) outil est appelé par le modèle. none signifie que le modèle n’appellera aucun outil et générera plutôt un message. auto est la valeur par défaut et signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils. required signifie que le modèle doit appeler un ou plusieurs outils avant de répondre à l’utilisateur. Spécifier un outil particulier comme {“type”: “file_search”} ou {“type”: “function”, “function”: {“name”: “my_function”}} oblige le modèle à appeler cet outil.
ToolResources { get; set; }Obtient ou définit un ensemble de ressources utilisées par les outils de l’assistant.
Tools { get; set; }Obtient ou définit les outils qui remplacent les outils que l’assistant peut utiliser pour cette exécution. Cela est utile pour modifier le comportement sur une base par demande.
TopP { get; set; }Obtient ou définit une valeur qui est une alternative à l’échantillonnage avec température, appelée échantillonnage par noyau, où le modèle considère les résultats des jetons avec une masse de probabilité top_p. Donc 0.1 signifie que seuls les jetons composant les 10 % supérieurs de la masse de probabilité sont considérés. Nous recommandons généralement de modifier cela ou la température mais pas les deux.
TruncationStrategy { get; set; }Obtient ou définit la stratégie de troncature qui contrôle comment un thread sera tronqué avant l’exécution. Utilisez ceci pour contrôler la fenêtre de contexte initiale de l’exécution.

Voir aussi