2025年5月19日(現地時間)- Microsoftは Windows 上での機械学習開発を革新する新しいランタイム「Windows ML」のパブリックプレビューを発表しました。
Windows ML とは?
機械学習は技術革新の最前線にあり、ユーザー体験を大きく変革しています。近年のクライアントシリコンの進化とモデルの小型化により、完全にローカルで実行可能な新しいシナリオが現実のものとなっています。
Windows ML は、このような複雑化する AI の状況において、開発者が製品レベルのエクスペリエンスを提供できるよう支援するために設計されたもので、エントリーレベルのラップトップから Copilot+ PC、そして最高級の AI ワークステーションに至るまで、Windows の多様なハードウェアエコシステムの力を活用し、開発者が AI を活用したアプリケーションを容易に作成できるようサポートします。
特に、特定のワークロードに対して最適なクライアントシリコン(低電力で持続的な推論に適した NPU、処理能力に優れた GPU、幅広い普及率と柔軟性を持つ CPU など)を、あらゆるデバイスで活用できるように構築されています。

Windows ML の主な特徴
Windows ML は、開発者が現在利用可能な Windows 11 PC を自信を持ってターゲットにできるように、統一されたフレームワークを提供します。
モデルのパフォーマンスと俊敏性を最適化し、モデルアーキテクチャ、オペレーター、スタック全体の最適化における技術革新のスピードに対応するために、ゼロから構築されました。
これは、過去1年間の DirectML (DML) からの学び、多くの開発者、シリコンパートナー、そして Copilot+ PC 向けの AI エクスペリエンスを開発しているマイクロソフト自身のチームからのフィードバックに基づいて進化させたものとなっています。
ONNX Runtime Engine (ORT) を活用
Windows ML は ONNX Runtime Engine (ORT) を搭載しており、開発者は使い慣れた ORT API を利用できます。
ネイティブモデル形式として ONNX を採用し、EP (Execution Provider) 向けの中間表現として PyTorch をサポートすることで、既存のモデルやワークフローとのシームレスな統合を保証します。
主要ハードウェアベンダーとの連携
重要な設計思想として、既存の ORT Execution Provider (EP) 契約を活用・強化し、様々なクライアントシリコン向けにワークロードを最適化することが挙げられます。
AMD、Intel、NVIDIA、Qualcomm といった独立系ハードウェアベンダー (IHV) とのパートナーシップのもと、これらの EP は既存および新興の AI プロセッサー上でモデル実行を最適化し、各社がその能力を最大限に発揮できるように設計されています。Windows ML には、初日から CPU、GPU、NPU のフルセットがサポートされています。
- AMD: Ryzen AI 製品向けに Windows ML を完全にサポート。AMD GPU および AMD NPU Execution Provider により、プラットフォーム内の GPU と NPU を最大限に活用できます。詳細はこちらをご覧ください。
- Intel: OpenVINO のパフォーマンスと効率性を CPU、GPU、NPU 全体で統合し、Windows ML が提供する開発と展開の簡便性と組み合わせることで、AI 開発者が Intel Core Ultra プロセッサー搭載製品全体でワークロードに最適な XPU をより簡単にターゲットできるようになります。 詳細はこちらをご覧ください。
- NVIDIA: 新しい TensorRT EP は、1億台以上の RTX AI PC において、NVIDIA RTX GPU 上で AI モデルを実行する最速の方法です。以前の DirectML 実装と比較して、RTX 向け TensorRT は AI ワークロードに対して最大2倍の高速パフォーマンスを実現します。詳細はこちらをご覧ください。
- Qualcomm: Qualcomm Technologies Inc. とマイクロソフトは、Qualcomm Neural Network Execution Provider (QNN EP) を使用して、Snapdragon X シリーズプロセッサーに搭載された NPU 向けに Windows ML ベースの AI モデルとアプリケーションを開発・最適化するために協力しました。 詳細はこちらをご覧ください。
開発者にとってのメリット
- 展開の簡素化: インフラストラクチャ API を活用することで、開発者は異なるシリコンをターゲットにするためにアプリの複数のビルドを作成する必要がなくなります。ONNX や EP をアプリケーションに直接バンドルする必要もありません。これらはデバイス上で利用可能になり、簡単な登録方法とデバイス上での事前 (AOT) モデルコンパイルが提供されます。
- 高度なシリコンターゲティング: デバイスポリシーを活用して、低電力、高性能向けに最適化したり、特定のモデルにどのシリコンを活用するかを正確に指定したりできます。将来的には、モデルの一部に CPU や GPU を、他の部分に NPU を活用するといった分割処理による最適なパフォーマンスが可能になります。
- パフォーマンス: Windows ML はパフォーマンスを重視して設計されており、ONNX と ONNX Runtime の基盤上に構築されているため、他のモデル形式と比較して最大20%の改善が見られます。将来的には、プログレッシブメモリーマッピング、部分的なモデルピニング、並列実行のための最適化されたスケジューラなど、さらなる最適化のための Windows 固有の機能が追加される予定です。
- 互換性: IHV パートナーとの協力により、Windows ML は適合性と互換性を保証するため、モデルの精度をビルドごとに保証しながら、継続的な改善を期待できます。
開発者向けツール「AI Toolkit for VS Code」
ランタイムだけでなく、モデルとアプリの準備をサポートするための堅牢なツールセット「AI Toolkit for VS Code (AI Toolkit)」も導入されます。
これには、PyTorch から ONNX への変換、量子化、最適化、コンパイル、プロファイリングが含まれ、開発者が独自モデルまたはオープンソースモデルを使用して本番アプリケーションをリリースするのを支援します。
これらのツールは、複数のビルドや複雑なロジックを作成することなく、Windows ML を介して高性能なモデルを準備・配布するプロセスを簡素化するように特別に設計されています。

主要開発者からの声
Microsoft は、Windows ML の構築にあたり、特に AI を活用した機能やエクスペリエンスの提供の最前線にいるアプリ開発者からのフィードバックと視点を得ることが重要だったとしています。
Windows ML の初期プレビューに対する主要な開発者の反応は以下のように非常に好意的なものとなっています。
- Adobe (Volker Rölke 氏 – Senior ML Computer Scientist):
「Adobe Premiere Pro と After Effects は、テラバイト単位の映像と重い ML ワークロードを扱います。異種デバイス間で一貫したパフォーマンスを提供する信頼性の高い Windows ML API は、大きな障害を取り除き、より優れた機能をより迅速に提供できるようになるでしょう。Windows ML は、はるかに少ない定型的なシステムチェックと低レベルの意思決定で、ハードウェアに依存しないアプローチをとるのに役立ちます。」 - Filmora (Luyan Zhang 氏 – AI Product Manager):
「そのシンプルさに驚いています。マイクロソフトのより簡単なアプローチに従い、ONNX モデルをアプリに追加しました。複雑な AI 機能をわずか3日間で Windows ML に変換できました。」 - McAfee (Carl Woodward 氏 – Sr. Principal Engineer):
「Windows ML が McAfee+ の新しい詐欺検出機能の開発と管理にもたらす効率性に期待しています。Windows ML により、モデルの精度やパフォーマンスといった影響の大きい領域に集中できるようになり、新しいハードウェアリビジョンを含むエコシステム全体で AI コンポーネントがうまく機能するという確信が得られます。」 - Topaz Labs (Dr. Suraj Raghuraman 氏 – Head of AI Engine):
「Windows ML はインストーラーのサイズを大幅に削減し、ギガバイトからメガバイトになります。これにより、モデルのストレージ要件も削減されるため、ユーザーはディスク上でより多くのことができるようになります。Windows ML は ONNX ランタイムに大きく依存しているため、統合は非常に簡単でした。API 全体を数日以内に統合でき、イノベーションの観点からはシームレスなエクスペリエンスでした。」
API の提供と利用開始方法
Windows MLは今年後半に一般提供開始予定です。
Windows ML は、本日より世界中のすべての Windows 11 マシンでパブリックプレビューとして利用可能になり、開発者はその機能を試したりフィードバックを提供したりする機会を得られます。
プレビューには、2つのレイヤーの API が含まれています。
- ML レイヤー: ランタイム初期化、依存関係管理のための高レベル API、および生成 AI ループを確立するためのヘルパー API。
- Runtime レイヤー: オンデバイス推論をきめ細かく制御するための低レベル ONNX Runtime API。
利用を開始するには、AI Toolkit をインストールし、変換および最適化テンプレートのいずれかを活用するか、独自に構築を開始します。
Microsoft Learn で利用可能なドキュメントやコードサンプル、デモやその他のサンプルについては AI Dev Gallery (インストール、ドキュメント) をご確認ください。
Introducing Windows ML: The future of machine learning development on Windows























コメント