在2025年,人工智慧 ( AI ) 與 邊緣運算 ( Edge Computing ) 將迎來一個嶄新的里程碑。DeepX 推出了一款革命性的產品 DeepX DX-M1 AI 推理加速卡,採用 PCIe Gen3 M.2 M-Key 介面,具備高達 25 TOPS 的卓越運算效能,以及高準確度、低功耗、低溫度等性能表現。
透過結合 Orange Pi 5 Plus ( Rockchip RK3588 ) 與 DeepX AI 加速卡,這套解決方案以極高性價比為基礎,能為工業電腦提供了隨插即用的便捷體驗,更以「平台升級,迎接 AI 智能時代」為設計理念,助力開發者輕鬆邁向人工智慧領域,為 AI 應用開啟了全新篇章。

圖1 基於 DeepX AI 加速卡結合 Rockchip RK3588 多路物件檢測解決方案優勢示意圖
同時,提供豐富的軟體資源與主流深度學習框架 ( 例如 TensorFlow、PyTorch 和 ONNX )的全面支援,無論是初學者還是專業人士,都能迅速掌握操作技巧,輕鬆完成 AI 模型的部署,讓更多人能夠參與到人工智慧的應用開發中,促使創新變得更加觸手可及。
其中 邊緣運算 ( Edge Computing ) 與 神經運算處理晶片 ( Neural Processing Unit, NPU ) 將是掀起這項浪潮的關鍵指標。得以將智慧裝置更貼近人們的日常生活。
AI 技術的進一步發展,更多的創新應用將逐步落地,徹底重塑我們的日常應用,於以下領域:
- 智能監控:透過即時目標偵測、行為分析與入侵預警,強化城市安全與監控系統。
- 智慧零售:藉由顧客行為分析與智能貨架管理,提升購物體驗,優化銷售策略。
- 醫療影像分析:運用 AI 協助醫生進行疾病診斷 ( 如腫瘤檢測 ),提高醫療準確性。
- 工業質檢:自動化檢測產品瑕疵,提高製造業品質管控與生產效率。
- 高級輔助駕駛系統 ( ADAS ):透過 AI 視覺技術,分析道路、行人等狀況,以達到行車安全的目標。
- 農業監測:監測作物健康狀況,檢測病蟲害,優化農業管理,提高產量和品質。
- 自動引導車 ( AGV ):透過感測器和 AI 演算法,自主導航並避開障礙物,應用於物流、巡檢等多種場景。
- 機械手臂:結合 AI 與視覺系統,能精確地執行組裝、焊接等任務,提高生產效率和產品品質。
- 自動送餐系統:外送平台如 Uber Eats,正在美國多個城市部署由 Serve Robotics 開發的送餐機器人,這些機器人配備 AI 技術,能自主導航至顧客所在地,提供高效的送餐服務。
無人機影像分析:AI 驅動的視覺系統使無人機能夠進行地形物體檢測、災害評估和基礎設施檢查,提供高效的數據收集和分析。
圖2 AI 應用方向示意圖 , 出處 ChatGPT 生成
另外,可以透過 DeepX 的卓越運算效能,可以輕鬆打造 多路 ( Multi-Streamer ) 物件偵測 ( Object Detection ) 應用。不論是使用一般 USB 攝影機,還是透過網路串流來源,皆能完美整合於各種智慧場景中。由於目前 Orange Pi 5 Plus 的鏡頭極限約莫為 16 路 480p 串流影像輸入,若是採用更高階的 NVR 作為主平台,更能發揮出 DX-M1 的極限。因此,更能適用於小型的商場、停車場、會展中心等等商品防盜、車輛安全控管、人流統計等等應用中。

圖3 多路物件檢測解決方案應用示意圖 , 出處 ChatGPT 生成
DeepX :引領智能新浪潮的造勢者
在邊緣運算浪潮中,DeepX 為韓國的新創公司,擁有約 240 多項智能專利 [link] ,並於 CES 2024 一次榮獲嵌入式、機器人 三項創新獎 [link]、電腦整合等等大獎。甚至被美國消費者技術協會 ( CTA ) 評為“必訪公司”,成為全球市場的焦點 [link]。
DeepX DX-M1 AI 加速卡強勢來襲,能夠提供每瓦 5 TOPS 的算力效能,擁有著強大的邊緣運算能力 ( 25TOPS ) 以及 IQ8™ ( Intelligent Quantization Integer 8 ) 獨家的量化技術,足夠媲美 GPU 的準確度,在擁有 INT8 的極致效率的同時也能享受到 FP32準確度,實現無與倫比的 AI 精度 [link]。
其內建搭配 4GB 的記憶體 ( DDR ) 用以存取模組,不會占用主系統的資源,大幅度減輕系統整合的負擔。其卓越的性能表現成為智慧監控、智慧醫療、智慧製造等邊緣 AI 應用的唯一首選。

圖4 DeepX AI晶片規格示意圖
軟體持續優化更新 :打造最佳使用者體驗
DeepX 不僅擁有強大的硬體性能,並且打造了一個完整且友善的軟體生態系統,為開發者提供全方位的支援。其生態系統包含詳細的快速入門指南 ( Quick Start Guide )、功能強大的軟體開發工具包 ( SDK )、豐富的模型資源庫 ( Model Zoo ),以及多樣化的範例應用程式。這些資源能有效協助開發者迅速整合並優化 AI 模型的運行,縮短開發時間,同時提升應用效能,讓 AI 創新變得更加輕鬆實現。
軟體由三大核心組件構成,分別是量化器 ( Quantizer )、編譯器 ( DX-COM Compiler ) 以及運行時環境 ( DX-RT Runtime ),共同驅動旗下的 DeepX AI SoC 系列產品。這些組件相互協作,形成一個高效的人工智慧運算平台,為各種應用場景提供強大的支援。以下圖示範說明其架構:

圖5 DeepX 開發環境示意圖,出處官方文件
卓越的 AI 效能
利用 DeepX DX-M1 晶片來運行當下最熱門的 YOLOv5s ( 640x640 ) 物件偵測算法,可輕鬆達到每秒 330 張左右。

圖6 DeepX DX-M1 晶片性能數據表
下列表格是 GPU 與 DX-M1 的準確度分析,其中綠字表示 Full Precision 代表 GPU ,藍字表示 IQ8 代表 DeepX NPU。

圖7 DeepX DX-M1 vs GPU 準確度比較表,出處官方文件
豐富的 AI 應用
DeepX 致力於推動人工智慧技術的普及,提供多樣化的 AI 範例與教學資源,循序漸進地引導開發者掌握 AI 應用的實現過程。透過範例,開發者不僅能深入了解人工智慧的核心技術,還能學習如何將其靈活運用於實際場景,從而加速創新與技術落地。

圖8 DeepX 實際應用示意圖
影片介紹 :
- AIoT Booster for AI NVR
- Yolov8 AI Accuracy Test: DEEPX DX-M1 vs GPGPU Showdown
- The coolest innovation in AI hardware!🧊
- Embedded World 2025: Interview with DeepX CEO Lok Won Kim
參考網站 :
- DeepX官網
- DeepX DX-M1 產品介紹
- DeepX 開發網站
- Orange Pi 5 Plus網站
- 如何取得 DeepX DX-M1,請聯絡 WPI 窗口
►場景應用圖

►展示板照片

►方案方塊圖

►核心技術優勢
1. 採用 IQ8™ ( Intelligent Quantization Integer 8 ) 量化技術,媲美 GPU 的準確度: DeepX 的 IQ8™技術需要配合 資料集 ( DataSet ) 校正,即可輕鬆擁有 INT8 的極致效率的同時也能享受到 FP32準確度,實現媲美 GPU 的 AI 準確度。 2. 不占用系統記憶體: 模組採用獨立記憶體架構進行運作,其內建 4GB 存取容量,完全不依賴主系統的 RAM 資源,成功減輕了對系統整體效能的負擔。 3. 最佳資料流優化,最大限度減少資料移動: 採用資料傳輸流優化設計,將記憶體設計於加速卡中,能夠大幅度減少資料在主系統傳輸次數,從而顯著提升處理速度並大幅降低延遲。 4. 高性價比與低耗電解決方案: 將主平台 Orange Pi 5 Plus 搭配 DeepX DX-M1 的 AI 晶片,即可無痛升級為更高階的 AI 平台每秒能夠運行約 480 禎 ( YOLOv5s ) 的物件偵測 ; 且 DX-M1 擁有 5 TOPS/W 的效能表現,整套多路物件偵測解決方案僅耗電約 14 W 。 5. 多路應用的新概念: 隨著邊緣運算技術的快速發展,若將其結合區域化的應用場景,或許能開創出一種創新且具成本效益的解決方案。透過使用易於取得的攝影鏡頭,搭配一台智慧型工業主機以及 DeepX M.2 加速卡,便能實現多樣化的應用需求。 此外,前端的鏡頭還可根據實際需求進行靈活更換與配置,進一步提升系統的適應性與彈性,為各種產業提供了更多可能性。
►方案規格
1. 主平台開發板採用 RockChip RK3588 平台為基礎,搭載四顆 Cortex-A76 處理器與 4 顆 Cortex-A55 處理器,並提供高性能圖像處理器 Arm Mali-G610 與神經運算處理器 NPU 等強大核心架構。 2. I/O Board 開發板提供強大的周邊配置,如 Gigabit Ethernet 乙太網路、HDMI 高畫質多媒體介面、USB Type A/C 3.0 通用序列匯流排接口、M.2 E-Key 傳輸介面、M.2 M-Key傳輸介面、並能夠透過延伸的 40 pin 針腳來模擬常用的 UART 、I2C、SPI、CAN 等訊號。 3. DeepX DX-M1 晶片提供強大的 AI 運算能力 ( 25 TOPS ),採用 PCIe Gen3 M.2 2280 M-Key 接口設計,搭載高效能的 DX-M1 晶片,展現出每瓦高達 5 TOPS 的卓越低功耗運算能力。此外,內建 4GB 動態隨機存取記憶體(DRAM),確保模組存取的高效性與穩定性。該加速卡全面支援 Linux 與 Windows 作業系統,並為開發者提供豐富的軟體資源,方便快速整合與應用。