> 技术文档 > 4麦 360度定位

4麦 360度定位

要在 ESP32 上用 4 个麦克风实现 360° 声源定位,通常思路是通过 时延估计(TDOA) + 几何计算,核心流程:

  1. 阵列布置

    • 将 4 个麦克风等间距布置成正方形(或圆形)。

    • 记阵列中心为原点,麦克风编号 M0–M3 坐标已知(例如正方形边长 D,则 M0=(+D/2,+D/2),M1=(–D/2,+D/2),M2=(–D/2,–D/2),M3=(+D/2,–D/2))。

  2. 多路采样

    • 用 ESP‑IDF 的 I2S 驱动,以相同时钟同步采集 4 路 PCM。

    • 采样率 fs 建议 ≥ 16 kHz,以满足较高角分辨率。

  3. GCC‑PHAT 时延估计

    • 对任意两路信号 x_i[n], x_j[n] 做 PHAT 交叉相关,估算它们的时间差 Δt_{ij}。

    • 例如计算 M0 与 M2(对角线)和 M1 与 M3 这两对 TDOA。

  4. 几何解算角度

    • 已知麦克风间距 d、光速 c≈343 m/s,可通过

      Δt=dcos⁡θc \\Delta t = \\frac{d \\cos\\theta}{c}

      解出到声源方向 θ。

    • 对两个轴向(X 轴对角线、Y 轴对角线)分别求 θ_x, θ_y,再合成 360° 角度。

  5. 滤波与融合

    • 对多帧结果做滑动平均或卡尔曼滤波,抑制噪声。


ESP‑IDF 示例代码框架

#include \"driver/i2s.h\"#include \"esp_log.h\"#include #define SAMPLE_RATE 16000#define I2S_NUM (0)#define I2S_BUF_LEN (1024)#define MIC_DIST 0.04f // 麦克风间距 4cm#define SPEED_OF_SOUND 343.0fstatic const char *TAG = \"4mic_doa\";// 1. 配置 I2S 同时采集 4 路static void i2s_init(void) { i2s_config_t cfg = { .mode = I2S_MODE_MASTER | I2S_MODE_RX, .sample_rate = SAMPLE_RATE, .bits_per_sample = I2S_BITS_PER_SAMPLE_16BIT, .channel_format = I2S_CHANNEL_FMT_ONLY_LEFT, // 用后面 slot_map 映射多路 .communication_format = I2S_COMM_FORMAT_I2S_MSB, .dma_buf_count = 4, .dma_buf_len = I2S_BUF_LEN, .use_apll = false }; i2s_pin_config_t pin_cfg = { .bck_io_num = GPIO_NUM_26, .ws_io_num = GPIO_NUM_25, .data_out_num = I2S_PIN_NO_CHANGE, .data_in_num = GPIO_NUM_22 // SD0 }; ESP_ERROR_CHECK(i2s_driver_install(I2S_NUM, &cfg, 0, NULL)); ESP_ERROR_CHECK(i2s_set_pin(I2S_NUM, &pin_cfg)); // 如果外部硬件把 4 路麦克风的 SD 引脚合并到 SD0…SD3 // 可用 i2s_set_pin 和 i2s_set_channel_map 指定}// 2. GCC‑PHAT 交叉相关(简化版,FFT 库可替代)static float gcc_phat(const float *x, const float *y, int N) { float max_corr = 0; int best_lag = 0; for (int lag = -N/2; lag < N/2; lag++) { float sum = 0, en = 0, dn = 0; for (int n = 0; n < N; n++) { int m = n + lag; if (m=N) continue; sum += x[n] * y[m]; en += x[n]*x[n]; dn += y[m]*y[m]; } float corr = sum / sqrtf(en*dn + 1e-12f); if (corr > max_corr) { max_corr = corr; best_lag = lag; } } return (float)best_lag / SAMPLE_RATE; // 返回 Δt}// 3. 主循环:采集 + DOA 估计void app_main(void) { i2s_init(); int16_t buf[I2S_BUF_LEN * 4]; float mic0[I2S_BUF_LEN], mic1[I2S_BUF_LEN]; float mic2[I2S_BUF_LEN], mic3[I2S_BUF_LEN]; while (1) { // 从 I2S 读 N*4 通道×16bit size_t bytes_read = 0; ESP_ERROR_CHECK(i2s_read(I2S_NUM, buf, sizeof(buf), &bytes_read, portMAX_DELAY)); int sample_count = bytes_read/ (sizeof(int16_t)*4); // 拆通道 for (int i = 0; i < sample_count; i++) { mic0[i] = buf[4*i + 0]; mic1[i] = buf[4*i + 1]; mic2[i] = buf[4*i + 2]; mic3[i] = buf[4*i + 3]; } // 选对角阵对估计 X 和 Y 分量 float dt_x = gcc_phat(mic0, mic2, sample_count); // M0-M2 float dt_y = gcc_phat(mic1, mic3, sample_count); // M1-M3 // 通过时延计算角度 (rad) float theta_x = acosf(fminf(fmaxf(dt_x * SPEED_OF_SOUND / MIC_DIST, -1), 1)); float theta_y = acosf(fminf(fmaxf(dt_y * SPEED_OF_SOUND / MIC_DIST, -1), 1)); // 合成 360°:这里简单平均示例,可用更复杂的四象限处理 float angle = fmodf((theta_x + theta_y) * 180.0f / M_PI * 0.5f, 360.0f); ESP_LOGI(TAG, \"Estimated DOA: %.1f° (dt_x=%.6f, dt_y=%.6f)\", angle, dt_x, dt_y); vTaskDelay(pdMS_TO_TICKS(200)); }}

说明:

  • i2s_init:需根据你所用的 4 路 PDM/I2S 麦克风硬件布局调整 channel_format 和引脚映射。

  • gcc_phat:这里是时域交叉相关,为示例用;生产建议用 FFT+PHAT 算法加速。

  • 角度解算:示例中对角线做估计并平均,实际可扩展到 4 对麦克风、基于最小二乘或卡尔曼滤波的 2D 多点解算。

  • 精度与带宽:采样率和缓冲区长度会影响角度分辨率和响应速度,可根据需求调节。

这样就完成了基于 4 麦克风阵列,在 ESP‑IDF 上做 360° 声源定位的完整示例。

留学规划指导