aiWare™

車載 AI 向けハードウェア IP

 

主な機能

性能
2GHz で 1 コアあたり 256 TOPS
拡張性
1 TOPS から 1000 TOPS 超(複数コア使用時)
MAC/サイクル
最大 65,536 MAC/コア(FP16 または INT32 内部精度)
効率性
vgg16 や Yolo などの NN に対して最大 98%
幅広い車載 CNN に対して 85% 以上
畳込み処理対応
最大 100% の効率を達成可能。畳込みおよび逆畳込み処理用に最適化された MAC アレイ。
対応機能
活性化、プーリング、単項、二項、テンソル導入/整形、線形演算など、幅広い演算機能に対応しているため、ホスト CPU の介入なしで、aiWare NPU 内で NN 処理を 100% 実行可能
設定可能な要素
•    MAC の数
•    オンチップのローカル密結合型 SRAM および WFRAM の容量
•    安全機能(ASIL-B 規格)
•    ホスト CPU およびローカル LPDDR/共有メモリの両方に対応する汎用インターフェイス
CNN の深さ
無限
量子化
最先端かつ継続的に更新される量子化アルゴリズムを SDK に同梱。SDK により、独自の量子化方式/戦略の適用が可能。内部の演算方式により、精度劣化を極めて低く抑制。
データ型
INT8 または FP8 ネイティブ
32 ビットの内部精度と、レイヤーごとの動的スケーリング
 

ISO 26262 準拠の安全性

コンプライアンス
SEooC(Safety Element out of Context)およびインコンテキストの安全要素の両方に対して、ASIL-B 以上に対応。ISO 26262 コンプライアンス計画に合わせて、各お客様向けにコンプライアンス機能と関連文書をカスタマイズ。
ハードウェア
ASIL-D まで対応できる、設定可能な安全機構。シリコン オーバーヘッドと機能安全要件・目標とのバランスを調整可能。
ソフトウェア
ISO 26262 準拠プロセスを使用して開発されたツールおよびランタイム サポート
 

メモリ

コア SRAM
各コアあたり最大 16 MB(設定可能)
ウェーブフロント SRAM
各コアあたり 1 ~ 64 MB(設定可能)
外部メモリ
専用のオフチップ DRAM または共有 SOC メモリ 
帯域幅の削減
オンチップ圧縮
ウェーブフロントベースのスケジューリングにより、サイクル単位およびレイヤー単位でオンチップ メモリ使用量を最適化
主インターフェイス
LPDDR への AXI4
ホストへの AXI4
 

ニューラル ネットワーク開発フレームワーク

対応フレームワーク
Caffe/Caffe2、TensorFlow、PyTorch、ONNX、Khronos NNEF
推論展開
オフラインで aiWare Studio またはコマンド ライン ツールを使用してコンパイルされるバイナリ
1 つのバイナリに、1 つまたは複数の NN、重み、すべてのスケジューリング情報を含む
ソフトウェア ランタイム
実行中のホスト CPU による管理は最小限。シンプルで汎用的なポータブル ランタイム API は、任意の RTOS または HLOS 上で動作可能であり、主要 API とのラッパーは要望に応じて提供。
開発ツール
aiWare Studio が、あらゆる NN のインポート、解析、最適化のための包括的なツールを使いやすいインタラクティブな UI で提供
評価ツール
aiWare Studio が、最終シリコンの性能を誤差 5% 以内の精度で予測可能なオフライン予測機能を提供。
FPGA による実装も利用可能。
 

対象アプリケーション

自動運転向けの車載推論
高性能車載マルチカメラ認識
大規模カメラ向け NN 処理(入力解像度の上限なし)
高データ レート異種マルチセンサー融合

今すぐ、お問い合わせください

弊社のチームは刺激的で野心的なお客様とともに仕事をする機会を心待ちにしています。弊社のパートナーになると思い立ったら、今すぐご連絡を。

aiMotiveに問い合わせる
効率と拡張性

最大 1024 TOPS、最大 98% の効率

高い効率と特許取得済みのデータフローにより、同じ公称 TOPS でも、さまざまな負荷を 2 倍から 5 倍の性能で処理できるため、システムの消費電力が最小限に抑えられます。完全な AEC-Q100 グレード 2 の動作の場合、5nm で最大 2GHz の性能を発揮します。

ツールとソリューション

システム試作から量産の最適化まで対応したユニークな SDK

aiWare Studio のツールは、AI エンジニアによるニューラル ネットワーク(NN)の最適化に重点を置いたユニークなアプローチにより、OEM やティア 1 メーカーのお客様から広く支持されています。NPU の下位コードをソフトウェア エンジニアが手作業で最適化する必要がありません。すべて aiMotive の高度なオフライン コンパイラによって完結します。

車載グレード

最も要求の厳しい L2 ~ L4 の自動運転アプリケーションを駆動

ASIL-B 以上の認証ソリューションへの組込みを目指して一から設計された aiWare は、幅広い車載ユース ケースに対応します。超小型エッジ センサーの強化から、高性能中央処理装置まで、性能に対する要求が最も厳しい L2 から L4 の車載アプリケーションに最適のソリューションです。

技術の詳細に興味を抱かれましたか?

追加の NN 処理負荷ファイルを要求する

NPU の能力を評価する最善の指標は効率です。その他のベンチマーク データをダウンロードして、aiWare4 がどのようにして、さまざまな車載 CNN 処理負荷に対して最大 98% という業界トップの効率を実現しているのかをご確認ください。

その他のベンチマーク データを入手する
aiWare の革新的ハードウェアに興味を抱かれましたか?

今すぐ、お問い合わせください。

aiMotive のチームは刺激的で意欲的なお客様とともに仕事をする機会を心待ちにしています。aiMotive とのパートナーシップ開始の準備が出来ていましたら、今すぐご連絡を。

aiMotive に問い合わせる