瑞芯微 RV1126B 處理器:邊緣 AI 規(guī)?;渴鸺夹g(shù)選型與性能解析

原創(chuàng) 作者 飛凌嵌入式 2026-01-09 15:48:00 RV1126B 瑞芯微 RV1126B 邊緣 AI

當(dāng)邊緣Al已從概念驗(yàn)證邁向規(guī)?;渴饡r(shí),一場關(guān)于"效率與平衡"的競賽已然打響。尤其是在工業(yè)視覺、智能安防、輕量級機(jī)器人等關(guān)鍵賽道上,一個(gè)共識已然形成:僅靠算法的加持和硬件的堆砌無法贏得市場??蛻舻男枨笃鋵?shí)很具體,是一個(gè)能夠在嚴(yán)苛的功耗與成本約束下穩(wěn)定處理1200萬像素視頻流,能在0.01Lux的黑暗場中捕捉細(xì)節(jié),能快速將技術(shù)方案轉(zhuǎn)化為產(chǎn)品的解決方案

正是這種產(chǎn)業(yè)與應(yīng)用層面的真實(shí)需求,定義了芯片的勝負(fù)準(zhǔn)則。

就像瑞芯微RV1126B處理器的走紅,它沒有提供"遙遙領(lǐng)先"的參數(shù),而是精準(zhǔn)匹配了多種端側(cè)AI場景的剛需,打開了一個(gè)更高效、更均衡的產(chǎn)業(yè)化通道。

3TOPS NPU 賦能端側(cè)AI推理

瑞芯微RV1126B處理器內(nèi)置獨(dú)立的NPU,提供高達(dá)3TOPS@INT8的AI算力,較前代RV1126提升了50%,支持INT8/INT16混合精度運(yùn)算,支持W4A16/W8A16混合精度量化與Transformer模型優(yōu)化,可流暢運(yùn)行2B參數(shù)級大語言模型和多模態(tài)模型。

這意味著,RV1126B可高效運(yùn)行人臉檢測、安全帽識別、煙火告警、區(qū)域入侵等多種典型的邊緣AI目標(biāo)識別模型,實(shí)現(xiàn)本地實(shí)時(shí)決策,無需依賴云端。

這里我們用飛凌嵌入式OK1126B-S開發(fā)板來運(yùn)行不同的模型,通過實(shí)際的運(yùn)行數(shù)據(jù),展示RV1126B處理器的NPU性能表現(xiàn)。

大語言模型和多模態(tài)模型

Model Model Size Dtype Seqlen New_tokens TTFT(ms) Tokens/s Memory(MB)
大語言模型 Qwen2 0.5B w8a8 128 64 655.78 14.95 655.3
大語言模型 Qwen2 0.5B fp 128 64 381.12 8.59 1104
大語言模型 Qwen2.5 1.5B w8a8 128 64 669.94 5.55 1660
大語言模型 DeepSeek-Distill-Qwen1.5B 1.5B w8a8 128 64 838.75 5.57 1692.8
多模態(tài)模型 Lllava-onevision-Qwen2-0.5B 0.5B w8a8 128 64 969.68 14.89 619
多模態(tài)模型 Qwen2-VL 2B w8a8 128 64 692.73 5.14 16360
大語言模型測試指標(biāo)說明:
Dtype:數(shù)據(jù)類型, 表示模型在推理過程中使用的數(shù)值精度(w8a8指Weights和Activations都使用8-bit整數(shù)表示的量化方法)
Seqlen:輸入序列長度,即輸入文本被分詞后的token數(shù)量。
New_tokens:生成的新token數(shù)量,也就是模型輸出內(nèi)容的長度。
TTFT(ms):首token時(shí)間(Time To First Token), 單位是毫秒(ms)
Tokens/s:每秒生成的token數(shù)量(Token Generation Throughput)
Memory(MB):推理過程中占用的最大運(yùn)行內(nèi)存大小,單位為MB(兆字節(jié))

目標(biāo)檢測

Demo Model_name Inputs_shape Dtype RV1126 RV1126B
yolov6 yolov6n [1,3,640,640] INT8 56.8 68.68
yolov6 yolov6s [1,3,640,640] INT8 16.3 25.43
yolov6 yolov6m [1,3,640,640] INT8 8.3 12.84
yolov8 yolov8n [1,3,640,640] INT8 35.4 50.24
yolov8 yolov8s [1,3,640,640] INT8 13.1 25.96
yolov8 yolov8m [1,3,640,640] INT8 5.8 11.8
yolov10 yolov10n [1,3,640,640] INT8 / 45.1
yolov10 yolov10s [1,3,640,640] INT8 / 24.84
yolo11 yolo1n [1,3,640,640] INT8 17 42.84
yolo11 yolo11s [1,3,640,640] INT8 7.3 23.72
yolo11 yolo11m [1,3,640,640] INT8 4 10.59

圖像分割

Demo Model_name Inputs_shape Dtype RV1126 RV1126B
yolov5_seg yolov5n-seg [1,3,640,640] INT8 42.2 51.67
yolov5_seg yolov5s-seg [1,3,640,640] INT8 14 27.22
yolov8_seg yolov8n-seg [1,3,640,640] INT8 27.6 39.79
yolov8_seg yolov8s-seg [1,3,640,640] INT8 9.8 19.71
mobilesam mobilesam_encoder_tiny [1,3,448,448] FP16 / 8.66
mobilesam mobilesam_decoder [1,1,112,112] FP16 / 61.76

人體&人臉關(guān)鍵點(diǎn)識別

Demo Model_name Inputs_shape Dtype RV1126 RV1126B
yolov8_pose yolov8n-pose [1,3,640,640] INT8 / 43.16
RetinaFace RetinaFace_mobile320 [1,3,320,320] INT8 212.5 295.26
RetinaFace RetinaFace_resnet50_320 [1,3,320,320] INT8 20.8 42.52

通過以上實(shí)測數(shù)據(jù)不難看出,搭載RV1126B處理器的飛凌嵌入式OK1126B-S開發(fā)板在多種模型的運(yùn)行方面都有著卓越的表現(xiàn),尤其是對比前代RV1126,NPU性能提升十分明顯。

AI-ISP 更高效的視覺智慧引擎

在邊緣AI領(lǐng)域,獲取高質(zhì)量的圖像輸入是提升智能感知能力的基石。傳統(tǒng)方案的瓶頸在于,ISP輸出的圖像已是經(jīng)過壓縮和損失的數(shù)字信號,NPU在此基礎(chǔ)上的分析猶如"霧里看花"。而RV1126B的專用AI-ISP,將先進(jìn)的AI算法直接注入ISP的原始數(shù)據(jù)處理鏈路中,實(shí)現(xiàn)了"在提升畫質(zhì)的同時(shí),為AI理解預(yù)先優(yōu)化" 的雙重目標(biāo)。

AI模型實(shí)時(shí)處理3DNR(三維數(shù)字降噪) 、HDR合成、畸變校正、去霧處理等關(guān)鍵環(huán)節(jié),使得最終輸出的圖像,結(jié)合Al Remosaic技術(shù)實(shí)現(xiàn)"日夜雙模自適應(yīng)"。不僅是人眼觀感更佳的圖像,更是"AI友好型"的圖像,為后端NPU的精準(zhǔn)、高效推理奠定了最優(yōu)基礎(chǔ)。

值得注意的是,RV1126B在運(yùn)行AI-ISP時(shí)無需占用NPU資源,較傳統(tǒng)的ISP+NPU共同處理的方案更加節(jié)省帶寬與功耗。

多場景適用為智能化升級賦能

瑞芯微RV1126B憑借均衡的性能精準(zhǔn)適配多元端側(cè)AI場景——

  • 智慧工地場景可實(shí)現(xiàn)安全帽/反光衣佩戴檢測、高空拋物識別、違規(guī)動火告警等安全監(jiān)管功能;
  • 智能倉儲場景能高效完成貨物條碼識別、貨架盤點(diǎn)、人員軌跡追蹤與越界預(yù)警;
  • 工業(yè)視覺場景能高效完成光伏/鋰電池缺陷識別;
  • 車載場景適配DMS駕駛員監(jiān)測;
  • 輕量級機(jī)器人可依托其實(shí)現(xiàn)動態(tài)避障與路徑規(guī)劃等等。

要將芯片的能力轉(zhuǎn)化為穩(wěn)定可靠的產(chǎn)品,離不開一套穩(wěn)定可靠的硬件載體與服務(wù)體系——飛凌嵌入式基于RV1126B系列處理器設(shè)計(jì)開發(fā)的FET1126B-S/FET1126BJ-S核心板,正是為此而生。

飛凌嵌入式FET1126BJ-S核心板(工業(yè)級)支持-40℃~+85℃環(huán)境溫度下工作,具備出色的可靠性和環(huán)境適應(yīng)能力;同時(shí),FET1126B-S核心板(寬溫級)相較同類產(chǎn)品更具優(yōu)勢,商業(yè)級配置即可滿足-20℃~+85℃工作環(huán)境需求。它搭載高帶寬LPDDR4內(nèi)存,相較于DDR4商業(yè)級0℃~+70℃的溫寬限制,LPDDR4商業(yè)級芯片即可覆蓋-20℃~+85℃,實(shí)現(xiàn)低成本與寬溫性能的兼顧。

此外,飛凌嵌入式還提供了從硬件設(shè)計(jì)到軟件部署的豐富資料與高效全面的技術(shù)支持服務(wù),結(jié)合穩(wěn)定供貨體系,大幅縮短項(xiàng)目開發(fā)周期,穩(wěn)定可靠地助力各行業(yè)客戶的方案快速落地和批量交付。

總結(jié):為智能化升級賦能

在邊緣AI從概念邁向規(guī)?;涞氐漠?dāng)下,瑞芯微RV1126B處理器以精準(zhǔn)契合場景剛需的技術(shù)優(yōu)勢,為端側(cè)智能提供了強(qiáng)大算力支撐。而飛凌嵌入式FET1126B-S/FET1126BJ-S系列核心板,則成為落地的關(guān)鍵"橋梁"。

從硬件性能到算法優(yōu)勢,從可靠品質(zhì)到技術(shù)支持,FET1126B-S/FET1126BJ-S核心板都能可靠便捷地將RV1126B系列芯片的能力轉(zhuǎn)化為實(shí)際產(chǎn)品效能,助力各行業(yè)客戶快速實(shí)現(xiàn)智能化升級,是邊緣AI規(guī)模化部署中值得信賴的核心硬件選擇。

如果RV1126B處理器非常符合您的項(xiàng)目需求,歡迎聯(lián)系左側(cè)在線客服,我們將為您提供選型支持服務(wù)!

相關(guān)產(chǎn)品 >

  • FET1126BJ-S核心板

    FET1126BJ-S核心板是飛凌嵌入式基于瑞芯微RV1126BJ處理器開發(fā)的國產(chǎn)化邊緣AI計(jì)算平臺。該處理器專為端側(cè)及邊緣側(cè)AI應(yīng)用場景打造,集成4核ARM Cortex-A53架構(gòu),提供高達(dá)3TOPS@INT8的AI算力,是智慧工業(yè)、智慧園區(qū)、智慧工地等場景實(shí)現(xiàn)視頻分析與目標(biāo)識別的優(yōu)選方案 了解詳情
    FET1126BJ-S核心板
  • OK1126BJ-S開發(fā)板

    RV1126B開發(fā)板(型號:OK1126B-S)是飛凌嵌入式基于瑞芯微RV1126B處理器打造的國產(chǎn)化邊緣AI計(jì)算平臺。集成4核A53 CPU與3TOPS@INT8獨(dú)立NPU,支持Linux 6.1系統(tǒng),提供完整BSP與RKNN工具鏈,兼容TensorFlow/PyTorch主流框架。核心板采用郵票孔+LGA設(shè)計(jì),支持-40℃~+85℃工業(yè)級寬溫,配備MIPI-DSI、雙網(wǎng)口、CAN-FD及樹莓派兼容40Pin GPIO接口。尺寸僅120mm×75mm,專為智慧工業(yè)質(zhì)檢、園區(qū)安防、工地安全監(jiān)測等端側(cè)AI場景設(shè)計(jì),提供10年供應(yīng)保障與7×24小時(shí)技術(shù)支持。 了解詳情
    OK1126BJ-S開發(fā)板

推薦閱讀 換一批 換一批