
エッジでの多言語認識、リアルタイム翻訳、自然音声合成を実現。デスクトップ端末、会議端末、ガイドキオスクなどで双方向対話とクロス言語コミュニケーションを展開可能。
主なメリット




倉庫、工場、サーバールームなどの現場で、エッジ音声が複雑なUIやバーコードスキャナを代替。現場作業員は自然言語で入出庫登録、設備点検、巡回報告、危険通知を実施。ローカルASRが構造化テキストを出力し、WMS、MES、IoTプラットフォームに直接連携可能。
主なメリット




XIAO ESP32S3を低消費電力ウェイクワードフロントエンドとして使用し、AIボックスのASR-TTSパイプラインを起動。声紋認識で家族メンバーを識別し個人設定を適用。Matter、HomeAssistant、Mi Home等のローカルプロトコルと連携。全コマンドをローカル処理 — オフラインでも日常使用に支障なし。
主なメリット




音声処理の計算リソースをどこに置くかが、性能上限と単体BOMを決定します。一般的な3つの展開モデル:
主なメリット
| 製品 | グレード | 精度 | 音声機能 | 同時処理 | 試聴音色 | 参考価格 |
|---|---|---|---|---|---|---|
XIAO ESP32-S3 Sense | ウェイクフロントエンド(オンボードマイク) | — | ウェイクワード / コマンドワード | — | — | ~$10 |
reRouter CM4 | エントリー級 | 基礎 | 単一言語ローカル文字起こし | — | マシン音 | $200–300 |
reComputer AI R2130-12 | エントリー級 | 中程度 | 単一言語対話 | 単一 | シミュレート音 | ~$339 |
reComputer RK3576 | スタンドアロン版 | 良好 | 多言語対話 + ローカルLLM* | 単一 | シミュレート音 | ~$139 |
reComputer RK3588 | スタンドアロン版 | 良好 | 多言語対話 + ローカルLLM* | 単一 | シミュレート音 | ~$199 |
reComputer J3011 | プロフェッショナル級 | 良好 | 多言語対話 | 2ch | シミュレート音 / リアル音 | ~$599 |
reComputer J4012 | プロフェッショナル級 | 良好 | 多言語対話 + ローカルLLM | 2~3ch | シミュレート音 / リアル音 | $800–900 |
reComputer J5012 | フラッグシップ級 | 優秀 | 多言語対話 + 高度なLLM | 高並列 | リアル音 | ~$2,000 |
AIコンピュートボックスは対応音声能力によってランク分けされています。下表はランク、精度、対応能力、同時処理数、試聴音声品質、価格帯を記載(マイクとスピーカーの選定は次のタブを参照)。*RKシリーズのローカルLLMには1282 AIアクセラレーター拡張カード(アクセサリ)が必要です。
主なメリット
| 製品 | タイプ | チップ | 集音 距離 | 収音 角度 | 内蔵 アンプ | コアアルゴリズム |
|---|---|---|---|---|---|---|
reSpeaker Lite | リニア 2マイク | XMOS XU316 | 3m | 180° | 5W | AEC · DoA |
reSpeaker XVF3800 | 円形 4マイク | XMOS XVF3800 | 5m | 360° | 5W | AEC · DoA · Multi-beamforming |
reSpeaker Flex Circular-4 | 円形 4マイク | XMOS XVF3800 | 5m | 360° | 10W | AEC · DoA · Multi-beamforming |
reSpeaker Flex Linear-4 | リニア 4マイク | XMOS XVF3800 | 5m | 180° | 10W | AEC · DoA · Multi-beamforming |
主なメリット