SKU:D062-M12
AtomS3R-M12 火山引擎语音视觉套件 是一款将 M5Stack 硬件与火山引擎云端 AIGC 一站式解决方案深度融合的物联网视觉+语音开发套件,核心由两部分组成,高性能图像采集单元 AtomS3R‑M12 与 AI 智能语音处理底座 Atomic Echo Base。AtomS3R‑M12 提供 3MP 级别的广角视频采集与边缘计算能力,扩展接口适配多种传感。Atomic Echo Base 集成高保真音频解码,麦克风与扬声器驱动,支持全双工语音唤醒,识别与交互。火山引擎 RTC 与 M5Stack 合作内置一站式解决方案,通过在芯片侧集成先进的音频处理(包括自动唤醒功能、音频 3A 等),在云侧深度整合大模型,语音识别,语音合成,Function calling,知识库等技术,快速实现用户与硬件之间流畅,自然,真人感觉的实时通话功能,广泛应用于智能安防,远程教育,智能家居和工业监测,AI 机器人等领域。
规格 | 参数 |
---|---|
SoC | ESP32‑S3‑PICO‑1‑N8R8,双核 Xtensa LX7 @240 MHz,USB‑OTG |
存储 | 8 MB Flash + 8 MB PSRAM |
无线 | Wi‑Fi 2.4 GHz |
云端流处理 | Volcengine Stream 实时流接入 |
云端识别能力 | 人脸检测,目标跟踪,OCR 文本识别,ASR 语音转文字 |
摄像头 | OV3660,3 MP,F2.4,120° FOV,30 FPS |
红外 IR | 180° 发射角,无遮挡最远 12.46 m |
传感系统 | 九轴 (BMI270 + BMM150) |
接口 | USB‑C (供电),HY2.0‑4P 扩展 |
音频编解码 | ES8311,24‑bit I2S,16 kHz–64 kHz |
麦克风 | MEMS 数字麦克风,SNR ≥ 65 dB |
功放 | NS4150B D 类功放,最大输出功率 3W |
扬声器 | 1 W @ 8 Ω ,接口规格 JST 1.25-2P |
通信模式 | I2S 全双工 |
工作温度 | 0 ~ 40 °C |
产品尺寸 | AtomS3R-M12: 26.4 x 24.0 x 22.5mm Atomic Echo Base: 26.4 x 24.0 x 22.5mm |
产品重量 | AtomS3R-M12: 10.8g Atomic Echo Base: 10.8g |
如需烧录固件,请长按复位按键(大约 2 秒)直到内部绿色 LED 灯亮起,便可松开,此时设备已进入下载模式,等待烧录。
ESP32-S3-PICO-1-N8R8 | G0 | G45 | G47 |
---|---|---|---|
BMI270 | SYS_SCL | SYS_SDA | |
IR | IR_LED_DRV |
BMI270 | BMI270_ASDx | BMI270_ASCx |
---|---|---|
BMM150 | A_SDA | A_SCL |
OV3360(M12) | ESP32-S3-PICO-1-N8R8 |
---|---|
CAM_SDA | G12 |
CAM_SCL | G9 |
VSYNC | G10 |
HREF | G14 |
Y9 | G13 |
XCLK | G21 |
Y8 | G11 |
Y7 | G17 |
PCLK | G40 |
Y6 | G4 |
Y2 | G3 |
Y5 | G48 |
Y3 | G42 |
Y4 | G46 |
POWER_N | G18 |
Atomic Echo Base | SCL | SDA | SD/DSDIN | WS/LRCK | ASDOUT | SCK/SCLK |
---|---|---|---|---|---|---|
AtomS3R M12 | G39 | G38 | G5 | G6 | G7 | G8 |
HY2.0-4P | Black | Red | Yellow | White |
---|---|---|---|---|
PORT.CUSTOM | GND | 5V | G2 | G1 |