瑞芯微 RV1126B 處理器:邊緣 AI 規(guī)?;渴鸺夹g(shù)選型與性能解析
飛凌嵌入式
2026-01-09 15:48:00
RV1126B
瑞芯微 RV1126B
邊緣 AI
當(dāng)邊緣Al已從概念驗(yàn)證邁向規(guī)?;渴饡r(shí),一場關(guān)于"效率與平衡"的競賽已然打響。尤其是在工業(yè)視覺、智能安防、輕量級機(jī)器人等關(guān)鍵賽道上,一個(gè)共識已然形成:僅靠算法的加持和硬件的堆砌無法贏得市場??蛻舻男枨笃鋵?shí)很具體,是一個(gè)能夠在嚴(yán)苛的功耗與成本約束下穩(wěn)定處理1200萬像素視頻流,能在0.01Lux的黑暗場中捕捉細(xì)節(jié),能快速將技術(shù)方案轉(zhuǎn)化為產(chǎn)品的解決方案。
正是這種產(chǎn)業(yè)與應(yīng)用層面的真實(shí)需求,定義了芯片的勝負(fù)準(zhǔn)則。
3TOPS NPU 賦能端側(cè)AI推理
瑞芯微RV1126B處理器內(nèi)置獨(dú)立的NPU,提供高達(dá)3TOPS@INT8的AI算力,較前代RV1126提升了50%,支持INT8/INT16混合精度運(yùn)算,支持W4A16/W8A16混合精度量化與Transformer模型優(yōu)化,可流暢運(yùn)行2B參數(shù)級大語言模型和多模態(tài)模型。
這意味著,RV1126B可高效運(yùn)行人臉檢測、安全帽識別、煙火告警、區(qū)域入侵等多種典型的邊緣AI目標(biāo)識別模型,實(shí)現(xiàn)本地實(shí)時(shí)決策,無需依賴云端。
這里我們用飛凌嵌入式OK1126B-S開發(fā)板來運(yùn)行不同的模型,通過實(shí)際的運(yùn)行數(shù)據(jù),展示RV1126B處理器的NPU性能表現(xiàn)。
大語言模型和多模態(tài)模型
| Model | Model Size | Dtype | Seqlen | New_tokens | TTFT(ms) | Tokens/s | Memory(MB) | |
|---|---|---|---|---|---|---|---|---|
| 大語言模型 | Qwen2 | 0.5B | w8a8 | 128 | 64 | 655.78 | 14.95 | 655.3 |
| 大語言模型 | Qwen2 | 0.5B | fp | 128 | 64 | 381.12 | 8.59 | 1104 |
| 大語言模型 | Qwen2.5 | 1.5B | w8a8 | 128 | 64 | 669.94 | 5.55 | 1660 |
| 大語言模型 | DeepSeek-Distill-Qwen1.5B | 1.5B | w8a8 | 128 | 64 | 838.75 | 5.57 | 1692.8 |
| 多模態(tài)模型 | Lllava-onevision-Qwen2-0.5B | 0.5B | w8a8 | 128 | 64 | 969.68 | 14.89 | 619 |
| 多模態(tài)模型 | Qwen2-VL | 2B | w8a8 | 128 | 64 | 692.73 | 5.14 | 16360 |
Dtype:數(shù)據(jù)類型, 表示模型在推理過程中使用的數(shù)值精度(w8a8指Weights和Activations都使用8-bit整數(shù)表示的量化方法)
Seqlen:輸入序列長度,即輸入文本被分詞后的token數(shù)量。
New_tokens:生成的新token數(shù)量,也就是模型輸出內(nèi)容的長度。
TTFT(ms):首token時(shí)間(Time To First Token), 單位是毫秒(ms)
Tokens/s:每秒生成的token數(shù)量(Token Generation Throughput)
Memory(MB):推理過程中占用的最大運(yùn)行內(nèi)存大小,單位為MB(兆字節(jié))
目標(biāo)檢測
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov6 | yolov6n | [1,3,640,640] | INT8 | 56.8 | 68.68 |
| yolov6 | yolov6s | [1,3,640,640] | INT8 | 16.3 | 25.43 |
| yolov6 | yolov6m | [1,3,640,640] | INT8 | 8.3 | 12.84 |
| yolov8 | yolov8n | [1,3,640,640] | INT8 | 35.4 | 50.24 |
| yolov8 | yolov8s | [1,3,640,640] | INT8 | 13.1 | 25.96 |
| yolov8 | yolov8m | [1,3,640,640] | INT8 | 5.8 | 11.8 |
| yolov10 | yolov10n | [1,3,640,640] | INT8 | / | 45.1 |
| yolov10 | yolov10s | [1,3,640,640] | INT8 | / | 24.84 |
| yolo11 | yolo1n | [1,3,640,640] | INT8 | 17 | 42.84 |
| yolo11 | yolo11s | [1,3,640,640] | INT8 | 7.3 | 23.72 |
| yolo11 | yolo11m | [1,3,640,640] | INT8 | 4 | 10.59 |
圖像分割
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov5_seg | yolov5n-seg | [1,3,640,640] | INT8 | 42.2 | 51.67 |
| yolov5_seg | yolov5s-seg | [1,3,640,640] | INT8 | 14 | 27.22 |
| yolov8_seg | yolov8n-seg | [1,3,640,640] | INT8 | 27.6 | 39.79 |
| yolov8_seg | yolov8s-seg | [1,3,640,640] | INT8 | 9.8 | 19.71 |
| mobilesam | mobilesam_encoder_tiny | [1,3,448,448] | FP16 | / | 8.66 |
| mobilesam | mobilesam_decoder | [1,1,112,112] | FP16 | / | 61.76 |
人體&人臉關(guān)鍵點(diǎn)識別
| Demo | Model_name | Inputs_shape | Dtype | RV1126 | RV1126B |
|---|---|---|---|---|---|
| yolov8_pose | yolov8n-pose | [1,3,640,640] | INT8 | / | 43.16 |
| RetinaFace | RetinaFace_mobile320 | [1,3,320,320] | INT8 | 212.5 | 295.26 |
| RetinaFace | RetinaFace_resnet50_320 | [1,3,320,320] | INT8 | 20.8 | 42.52 |
通過以上實(shí)測數(shù)據(jù)不難看出,搭載RV1126B處理器的飛凌嵌入式OK1126B-S開發(fā)板在多種模型的運(yùn)行方面都有著卓越的表現(xiàn),尤其是對比前代RV1126,NPU性能提升十分明顯。
AI-ISP 更高效的視覺智慧引擎
在邊緣AI領(lǐng)域,獲取高質(zhì)量的圖像輸入是提升智能感知能力的基石。傳統(tǒng)方案的瓶頸在于,ISP輸出的圖像已是經(jīng)過壓縮和損失的數(shù)字信號,NPU在此基礎(chǔ)上的分析猶如"霧里看花"。而RV1126B的專用AI-ISP,將先進(jìn)的AI算法直接注入ISP的原始數(shù)據(jù)處理鏈路中,實(shí)現(xiàn)了"在提升畫質(zhì)的同時(shí),為AI理解預(yù)先優(yōu)化" 的雙重目標(biāo)。
AI模型實(shí)時(shí)處理3DNR(三維數(shù)字降噪) 、HDR合成、畸變校正、去霧處理等關(guān)鍵環(huán)節(jié),使得最終輸出的圖像,結(jié)合Al Remosaic技術(shù)實(shí)現(xiàn)"日夜雙模自適應(yīng)"。不僅是人眼觀感更佳的圖像,更是"AI友好型"的圖像,為后端NPU的精準(zhǔn)、高效推理奠定了最優(yōu)基礎(chǔ)。
多場景適用為智能化升級賦能
瑞芯微RV1126B憑借均衡的性能精準(zhǔn)適配多元端側(cè)AI場景——
- 智慧工地場景可實(shí)現(xiàn)安全帽/反光衣佩戴檢測、高空拋物識別、違規(guī)動火告警等安全監(jiān)管功能;
- 智能倉儲場景能高效完成貨物條碼識別、貨架盤點(diǎn)、人員軌跡追蹤與越界預(yù)警;
- 工業(yè)視覺場景能高效完成光伏/鋰電池缺陷識別;
- 車載場景適配DMS駕駛員監(jiān)測;
- 輕量級機(jī)器人可依托其實(shí)現(xiàn)動態(tài)避障與路徑規(guī)劃等等。
要將芯片的能力轉(zhuǎn)化為穩(wěn)定可靠的產(chǎn)品,離不開一套穩(wěn)定可靠的硬件載體與服務(wù)體系——飛凌嵌入式基于RV1126B系列處理器設(shè)計(jì)開發(fā)的FET1126B-S/FET1126BJ-S核心板,正是為此而生。
飛凌嵌入式FET1126BJ-S核心板(工業(yè)級)支持-40℃~+85℃環(huán)境溫度下工作,具備出色的可靠性和環(huán)境適應(yīng)能力;同時(shí),FET1126B-S核心板(寬溫級)相較同類產(chǎn)品更具優(yōu)勢,商業(yè)級配置即可滿足-20℃~+85℃工作環(huán)境需求。它搭載高帶寬LPDDR4內(nèi)存,相較于DDR4商業(yè)級0℃~+70℃的溫寬限制,LPDDR4商業(yè)級芯片即可覆蓋-20℃~+85℃,實(shí)現(xiàn)低成本與寬溫性能的兼顧。
總結(jié):為智能化升級賦能
在邊緣AI從概念邁向規(guī)?;涞氐漠?dāng)下,瑞芯微RV1126B處理器以精準(zhǔn)契合場景剛需的技術(shù)優(yōu)勢,為端側(cè)智能提供了強(qiáng)大算力支撐。而飛凌嵌入式FET1126B-S/FET1126BJ-S系列核心板,則成為落地的關(guān)鍵"橋梁"。
從硬件性能到算法優(yōu)勢,從可靠品質(zhì)到技術(shù)支持,FET1126B-S/FET1126BJ-S核心板都能可靠便捷地將RV1126B系列芯片的能力轉(zhuǎn)化為實(shí)際產(chǎn)品效能,助力各行業(yè)客戶快速實(shí)現(xiàn)智能化升級,是邊緣AI規(guī)模化部署中值得信賴的核心硬件選擇。
相關(guān)產(chǎn)品 >
-
FET1126BJ-S核心板
FET1126BJ-S核心板是飛凌嵌入式基于瑞芯微RV1126BJ處理器開發(fā)的國產(chǎn)化邊緣AI計(jì)算平臺。該處理器專為端側(cè)及邊緣側(cè)AI應(yīng)用場景打造,集成4核ARM Cortex-A53架構(gòu),提供高達(dá)3TOPS@INT8的AI算力,是智慧工業(yè)、智慧園區(qū)、智慧工地等場景實(shí)現(xiàn)視頻分析與目標(biāo)識別的優(yōu)選方案 了解詳情
-
OK1126BJ-S開發(fā)板
RV1126B開發(fā)板(型號:OK1126B-S)是飛凌嵌入式基于瑞芯微RV1126B處理器打造的國產(chǎn)化邊緣AI計(jì)算平臺。集成4核A53 CPU與3TOPS@INT8獨(dú)立NPU,支持Linux 6.1系統(tǒng),提供完整BSP與RKNN工具鏈,兼容TensorFlow/PyTorch主流框架。核心板采用郵票孔+LGA設(shè)計(jì),支持-40℃~+85℃工業(yè)級寬溫,配備MIPI-DSI、雙網(wǎng)口、CAN-FD及樹莓派兼容40Pin GPIO接口。尺寸僅120mm×75mm,專為智慧工業(yè)質(zhì)檢、園區(qū)安防、工地安全監(jiān)測等端側(cè)AI場景設(shè)計(jì),提供10年供應(yīng)保障與7×24小時(shí)技術(shù)支持。 了解詳情

