Cross-platform accelerated machine learning. Built-in optimizations speed up training and inferencing with your existing technology stack. ONNX Runtime AI (https://onnxruntime.ai/) 是一個由微軟開發的開源機器學習推理平台。它專注於優化和加速來自各種框架(例如 ONNX、PyTorch 和 TensorFlow)的機器學習模型的推論。

ONNX Runtime AI 提供:

  • 高性能: 高效的推論,利用多個後端(例如 CPU、GPU 和 FPGA)實現最佳性能。
  • 跨平台: 支援 Windows、Linux、MacOS 和雲端平台。
  • 易於使用: 簡單的 API 和工具,簡化模型部署和推論。
  • 客製化: 可擴充的架構,允許用戶自定義並整合自定義算子和後端。

ONNX Runtime AI 廣泛應用於:

  • 邊緣裝置: 低功耗裝置上的機器學習推論。
  • 雲端服務: 擴充雲端部署的機器學習推論。
  • 模型優化: 加速和優化機器學習模型的效能。
  • 研究與開發: 探索和評估機器學習模型的推論能力。