Over de scene: er zijn 4 personen in een gewone kamer met één persoon in eerste instantie uit het zicht van strekking. Iedereen wordt geplaatst in de configuratie van de verschillende en uiteenlopende afstand.
Sleutel stappen in detectie:
1. Nao detecteert eerst de persoon met behulp van gezichtsherkenning.
2. vervolgens wordt een nieuwe geluidsbron lokalisatie techniek gebruikt om op te sporen van de persoon die spreekt
3. vervolgens is draaien haar hoofd naar de speurder persoon