豆丁机器人

豆丁是一款面向桌面场景、集具身智能、AI 大模型、双足运动、语音交互、视觉感知于一体的多模态智能机器人。采用双足四舵机仿生结构,支持流畅行走与丰富拟人动作;搭载高清屏幕、AI 摄像头、双麦阵列与 RGB 氛围灯环,实现表情、语音、灯光、动作四维交互;内置全方位悬崖检测,使用更安全;原生适配千机赋能平台,零门槛二次开发,是学习 AI、机器人开发与创意互动的理想桌面智能伙伴。

核心优势:双足四舵机设计、2.2寸高清屏幕、双麦克风阵列、智能灯环、WiFi配网、原生适配千机赋能平台
快速入门 了解更多
豆丁机器人

视频演示

观看以下视频演示,了解豆丁机器人的使用流程和结构展示

豆丁机器人演示

视频内容:本视频全面展示了豆丁机器人的各项核心功能,包括语音交互、动作控制、表情互动等特性,帮助您快速了解豆丁机器人的完整使用体验。

装配体爆炸动画仿真

视频内容:本视频通过爆炸动画仿真,详细展示了豆丁机器人的装配体结构,包括各个部件的组成、装配关系和设计细节,帮助您深入了解机器人的机械构造和工程设计。

产品特性

强大的硬件配置和丰富的功能模块,为智能桌面机器人提供全方位支持

2.2寸高清屏幕

正面配备2.2寸屏幕,用于显示状态、表情、图像、对话字幕。屏幕顶部显示"聆听中..."等机器人状态指示,包括聆听、说话、配网、时间等信息;左侧是WIFI信号强度指示;右侧为电量与充电状态指示;中间是表情显示,增添互动趣味;底部则是对话字幕显示,方便同步查看交流内容,助力交互体验。

双麦克风阵列

屏幕上方有两个麦克风,可实现语音交互。设备预置唤醒词为:"豆丁豆丁"、"你好豆丁"。单击背后按键,可实现免唤醒词唤醒机器人进入聆听状态。支持语音打断和重新唤醒功能。

视觉摄像头

头顶摄像头,支持图像识别与视觉交互。可进行拍照、人脸识别等视觉功能,为用户提供更丰富的交互体验。

智能灯环

两侧设有灯环,能通过灯光变化呈现不同状态。待机状态:两侧灯环熄灭;聆听状态:两侧灯环为红色;说话状态:两侧灯环为绿色。直观展示机器人运行状态。

双腿结构

双腿结构可进行简单的动作展示,支持行走(前进、后退)、转身(左转、右转)、左右摇摆、太空步、上下运动等丰富动作。可通过组织语言控制方向、步数、行走速度、摇摆次数、摇摆速度、摇摆幅度、太空步次数、太空步方向、上下运动次数、运动速度、运动幅度等参数。

WiFi配网

支持WiFi配网,轻松接入千机阁智能体平台。在无记忆WiFi环境下开机,等待1-2分钟左右自动进入配网模式;或在屏幕显示"扫描 Wi-Fi"或"连接 xxxx.."时,快速单击机器人背后按键,即可手动进入配网模式。

技术规格

豆丁机器人完整技术参数,涵盖整机信息、结构与运动、核心硬件、屏幕显示、感知与安全、灯效系统、语音交互系统等七大类详细配置

分类 详细规格
整机信息 产品外观:100.8MM×72MM×113.5MM
电池规格:7.4V 35C高倍率放电系数锂电池(2S)
电池保护:电池保护 IC,过充/过放/过流/短路保护
输入电压:TypeC 5V 输入
低功耗特性:支持低功耗模式,可控电源域,支持深度休眠
开关机方式:按键长按3S开机、长按3S关机
结构与运动 舵机:数码金属齿舵机:4个
运动结构:双足四舵机独立驱动
内置动作组:前进、后退、左转、右转、跳舞、踮脚等动作
舵机供电:独立DCDC 5V供电,最大连续输出5A电流
遥控与校准:支持通过WIFI手动控制运动以及舵机角度校准
核心硬件 主处理器:ESP32-S3
协处理器:STM32
摄像头:OV2640,DCMI 接口,200 万像素,支持 DVP 并行输出与硬件 JPEG 压缩
传感器:6 轴超低功耗IMU、四路TOF悬崖检测、一路挥手传感器
主协处理器通信方式:UART
通信方式:2.4 GHz WIFI:支持 / Bluetooth 5 (LE):支持 / Bluetooth Mesh:支持
屏幕显示 显示单元:2.2 寸 TFT 高清彩屏,分辨率 240×320
显示内容:动态表情、系统状态、开/关机动画、信号强弱、对话文字内容
控制方式:SPI 接口驱动
表情系统:内置丰富表情图片,可随交互动态切换
感知与安全 安全功能:桌面边缘实时检测,主动防跌落
灯效系统 灯环配置:双侧 RGB 智能灯环
控制方式:WS2812 可编程 RGB
灯效场景:开机、唤醒、配网等场景
语音交互系统 麦克风配置:双硅麦阵列、支持声源定位
音频 ADC:ES7210 四通道音频 ADC
音频编解码:ES8311 低功耗 Codec
功放:3W 单声道 D 类功放
音频处理:AEC 回声消除、降噪、远场拾音
离线语音唤醒:支持,无需联网即可唤醒
流式语音对话:支持 WebSocket / UDP 协议的实时对话
多语言识别:支持国语、粤语、英语、日语、韩语五种语言(SenseVoice)
声纹识别:支持 3D Speaker,可区分说话人
语音合成 TTS:火山引擎 / CosyVoice 大模型 TTS
大模型支持:通义千问、DeepSeek、豆包等 LLM
个性化:自定义提示词、音色、角色
记忆功能:具备短期记忆,对话自动总结
MCP 服务:支持

应用场景

智能体开发套件支持丰富的应用场景,涵盖语音交互、物联网、机器视觉、教学科研等多个领域

01

AI 大模型语音问答与对话陪伴

02

双足机器人步态学习与动作开发

03

计算机视觉入门与图像识别实验

04

传感器、嵌入式、单片机编程学习

05

创客教育、机构教学、个人 DIY 创作

06

桌面智能互动、科技展示与礼品

注意事项

使用豆丁机器人时请注意以下事项,以确保最佳使用体验和设备安全

重要提示

需根据coze接口需求文档,千机阁平台——coze接口需求文档,提供扣子的机器人id和个人访问令牌,默认配置为测试例程,需根据实际使用情况进行更换。智能体管理中的语音识别以及语音合成为试用api,调用资源有限,如需正式使用请自行购买。

电量管理

电量过低时屏幕会弹窗警告,请及时充电,防止电池损坏。

使用环境

避免强光直射、高温等复杂环境,3D打印材质需妥善保护。

屏幕保护

严禁按压屏幕面板,避免损坏显示组件。

动作控制

如动作不停,可在聆听状态说"停止动作"。

设备绑定

同一设备不可注册在多个智能体下,切换需先解绑再绑定。

网络环境

请在安静环境使用,网络不佳或智能体速度慢会导致回话卡顿。

×