コンテンツにスキップ

Java API

注意: この API はプレビュー版であり、変更される可能性があります。

このドキュメントでは、ONNX Runtime GenAI の Java API について説明します。 以下に、主要なクラスとメソッド、およびそれぞれのコードスニペットと説明を示します。


Java API は ai.onnxruntime.genai Java パッケージによって提供されます。パッケージの公開は保留中です。ソースからパッケージをビルドするには、ソースからのビルドガイドを参照してください。

import ai.onnxruntime.genai.*;

指定されたモデルパスから新しいモデルを初期化します。

public Model(String modelPath) throws GenAIException

モデルを実行するための GeneratorParams インスタンスを作成します。

public GeneratorParams createGeneratorParams() throws GenAIException

このモデルの Tokenizer インスタンスを作成します。

public Tokenizer createTokenizer() throws GenAIException

指定されたジェネレータパラメータを使用して出力シーケンスを生成します。

public Sequences generate(GeneratorParams generatorParams) throws GenAIException

設定パスから新しい設定オブジェクトを初期化します。

public Config(String configPath) throws GenAIException

設定からすべてのプロバイダーをクリアします。

public void clearProviders() throws GenAIException

設定にプロバイダーを追加します。

public void appendProvider(String provider) throws GenAIException

設定でプロバイダーオプションを設定します。

public void setProviderOption(String provider, String name, String value) throws GenAIException

設定に JSON 文字列を重ね合わせます。

public void overlay(String json) throws GenAIException

指定されたモデルのトークナイザーを初期化します。

public Tokenizer(Model model) throws GenAIException

文字列をトークンIDのシーケンスにエンコードします。

public Sequences encode(String string) throws GenAIException

文字列の配列を、各入力のトークンIDのシーケンスにエンコードします。

public Sequences encodeBatch(String[] strings) throws GenAIException

トークンIDのシーケンスをテキストにデコードします。

public String decode(int[] sequence) throws GenAIException

トークンIDのシーケンスのバッチをテキストにデコードします。

public String[] decodeBatch(Sequences sequences) throws GenAIException

ストリーミングトークン化のための TokenizerStream オブジェクトを作成します。

public TokenizerStream createStream() throws GenAIException

ストリーム内の単一のトークンをデコードし、生成された文字列チャンクを返します。

public String decode(int token) throws GenAIException

指定されたモデルのジェネレータパラメータを初期化します。

public GeneratorParams(Model model) throws GenAIException

数値検索オプションを設定します。

public void setSearchOption(String optionName, double value) throws GenAIException

ブール値の検索オプションを設定します。

public void setSearchOption(String optionName, boolean value) throws GenAIException

シーケンスを使用してモデル実行のプロンプトを設定します。

public void setInput(Sequences sequences) throws GenAIException

モデル実行のプロンプトトークンIDを設定します。

public void setInput(int[] tokenIds, int sequenceLength, int batchSize) throws GenAIException

指定されたモデルとジェネレータパラメータで Generator オブジェクトを構築します。

public Generator(Model model, GeneratorParams generatorParams) throws GenAIException

生成プロセスが完了したかどうかを確認します。

public boolean isDone()

シーケンス内の次のトークンのロジットを計算します。

public void computeLogits() throws GenAIException

シーケンス内の次のトークンを生成します。

public void generateNextToken() throws GenAIException

指定されたシーケンスインデックスのトークンIDのシーケンスを取得します。

public int[] getSequence(long sequenceIndex) throws GenAIException

指定されたシーケンスインデックスのシーケンス内の最後のトークンを取得します。

public int getLastTokenInSequence(long sequenceIndex) throws GenAIException

コレクション内のシーケンスの数を取得します。

public long numSequences()

指定されたインデックスのシーケンスを取得します。

public int[] getSequence(long sequenceIndex)

指定されたデータ、形状、および要素タイプで Tensor を構築します。

public Tensor(ByteBuffer data, long[] shape, ElementType elementType) throws GenAIException

操作が成功したかどうかを示します。

public boolean isSuccess()

失敗した操作のエラーメッセージを取得します。

public String getError()

ブール値のログオプションを設定します。

public static void setLogBool(String name, boolean value)

文字列のログオプションを設定します。

public static void setLogString(String name, String value)

現在の GPU デバイス ID を設定します。

public static void setCurrentGpuDeviceId(int deviceId)

現在の GPU デバイス ID を取得します。

public static int getCurrentGpuDeviceId()