Skip to content

Glass3 SDK 概览

Glass3 SDK 是面向 Rokid Glass3 AI 眼镜Android 手机应用的终端开发套件,主要用于构建设备连接、消息传输、远程控制、媒体采集、语音交互和 AI 能力调用等双端协同场景。

如果你正在开发一个需要“手机 + 眼镜”配合工作的业务应用,这套 SDK 可以帮助你快速完成设备连接、数据通道建立和常见能力调用。

适用场景

Glass3 SDK 适合以下类型的应用:

场景能力说明
手机控制眼镜手机端扫描、连接、管理眼镜,并远程触发拍照、录像、音视频预览等能力。
双端消息传输手机与眼镜之间发送文本、文件、图片、视频和业务指令。
眼镜端独立应用在眼镜上开发 Android 应用,调用摄像头、语音、识别、消息等能力。
AI 与语音交互使用 ASR、TTS、AI Chat、离线语音指令等能力构建语音交互体验。
视觉识别业务接入人脸检测、车牌识别等视觉能力。

双端架构

Glass3 SDK 分为手机端和眼镜端两部分:

端侧主要职责
手机端 SDK负责扫描和连接眼镜、建立蓝牙/P2P 通道、转发网络请求、收发消息和文件、控制眼镜能力。
眼镜端 SDK负责注册眼镜端应用、接收手机端指令、调用眼镜硬件和系统能力、返回执行结果。

典型链路如下:

text
手机应用
  ↓ 蓝牙扫描 / 配对
Glass3 眼镜
  ↓ 建立 P2P 通道
手机应用 ⇄ 眼镜应用

消息、文件、音视频流、远程控制、AI/语音能力

核心能力

设备连接

  • 蓝牙扫描、配对与连接
  • Wi-Fi P2P 直连
  • 设备状态同步
  • 远程控制和连接状态监听

消息与文件传输

  • 手机端向眼镜端发送消息和文件
  • 眼镜端向手机端发送消息和文件
  • 通知同步
  • 实时视频预览数据传输

媒体能力

  • 眼镜端拍照
  • 眼镜端录像
  • 录音与音视频流采集
  • 手机端相册预览和媒体同步

语音与 AI

  • ASR 语音转文本
  • TTS 文本转语音
  • 离线语音指令
  • AI Chat 链路集成

在线 ASR/TTS 通常需要 AK/SK 等鉴权信息;私有化语音能力请参考 ASR/TTS 私有化部署 SDK

视觉识别

  • 人脸检测
  • 车牌识别
  • 在线和离线识别能力组合

接入路径

如果你是第一次接入,建议按下面顺序阅读:

  1. 先看 快速开始,完成环境准备、Maven 仓库和 SDK 依赖配置。
  2. 如果需要跑通官方 Demo,进入 Demo 运行指南,完成 Demo 获取、构建、运行和基础能力验证。
  3. 再看 代码示例,按设备连接、消息传输、媒体、语音与 AI、视觉识别等能力逐步接入。
  4. 开发时查阅 手机端 SDK API眼镜端 SDK API
  5. 遇到连接、蓝牙、P2P 或权限问题时,查看 常见问题

Demo 工程

Demo 工程包含手机端和眼镜端两个应用,用于展示 SDK 的完整调用链路。

Demo主要能力
手机端 Demo蓝牙扫描与连接、Wi-Fi P2P、消息和文件收发、通知同步、眼镜端音视频流预览。
眼镜端 DemoSDK 初始化、消息收发、拍照录像、离线语音指令、ASR/TTS、AI Chat、人脸检测、车牌识别。

Demo 工程地址:

https://gitee.com/as_pixar/glass3sdkdemo

如果需要具体的下载、构建和运行步骤,请查看 Demo 运行指南。如果想先看演示,可以查看 五分钟快速构建应用 视频。

P2P 通信说明

P2P 是手机与眼镜之间的点对点通信通道,适合低延迟的数据传输场景,例如消息、文件、实时音视频流和远程控制。

建立 P2P 通常包括:

  1. 手机端获取蓝牙、Wi-Fi 等必要权限。
  2. 手机端通过蓝牙发现并连接眼镜。
  3. 双端协商并建立 P2P 通道。
  4. 通过 P2P 通道传输消息、文件或音视频数据。

需要注意的是,眼镜在 P2P 连接后并不是直接访问互联网。典型网络路径是:

text
眼镜 → P2P → 手机 → 蜂窝网络或 Wi-Fi → 业务服务器

服务端返回数据时,链路反向返回:

text
业务服务器 → 手机 → P2P → 眼镜

因此,如果业务需要访问公网服务,通常由手机端承担网络转发、鉴权和数据中转角色。

接入前准备

开始开发前,请确认:

  • 已具备 Android 开发环境。
  • Android Studio 使用 JDK 17 或更高版本。
  • 手机端和眼镜端 Demo 可以正常编译。
  • 已根据目标能力准备好蓝牙、Wi-Fi、录音、相机、存储等权限。
  • 如需在线语音、AI 或私有化语音服务,已准备对应 AK/SK、服务域名和接口路径。

下一步