Oliveによるエンドツーエンドの最適化
Olive - ハードウェア対応モデル最適化ツール
Section titled “Olive - ハードウェア対応モデル最適化ツール”Oliveは、モデルの圧縮、最適化、コンパイルにわたる業界をリードする技術を組み合わせた、使いやすいハードウェア対応モデル最適化ツールです。ONNX Runtimeと連携して、E2E推論最適化ソリューションとして機能します。
モデルとターゲットハードウェアが与えられると、Oliveは精度やレイテンシなどの一連の制約を考慮しながら、ONNX Runtimeでの推論に最適なモデルとランタイム構成を出力するために、最適な最適化技術を組み合わせます。Oliveが統合した技術には、ONNX Runtime Transformerの最適化、ONNX Runtimeのパフォーマンスチューニング、HWに依存した調整可能なトレーニング後の量子化、量子化を意識したトレーニングなどが含まれます。Oliveは、ONNX Runtimeのモデル最適化に推奨されるツールです。
例:
詳細については、OliveリポジトリおよびOliveドキュメントを参照してください。