Chinesische Wissenschaftler versuchen, „perfekten Zuhörer“ zu erschaffen

BEIJING, 9. April (Xinhuanet) -- Stellen Sie sich vor, auf der Straße zu gehen, während zwei Frauen vor Ihnen über einen neuen Laden sprechen, hinter Ihnen ein Hund bellt, und an der Ecke eine Polizeisirene heult.

Sie drehen sich zum Polizeiauto, um zu sehen, was sich ereignet hat. Wenn die Sirene verklingt, merken Sie, dass der Hund immer noch bellt und die Passanten sich immer noch unterhalten.

Ohne es zu wissen, haben Sie eine Lösung für ein Problem gefunden, mit dem Computer seit mehr als einem halben Jahrhundert ringen: der Cocktailparty-Effekt.

Der Cocktailparty-Effekt ist das Phänomen der Fähigkeit des Gehirns, die akustische Aufmerksamkeit auf einen bestimmten Stimulus zu fokussieren und gleichzeitig eine Reihe anderer Reize herauszufiltern, etwa wenn sich ein Partybesucher in einem lauten Raum auf eine einzelne Konversation konzentriert. Zuhörer haben die Fähigkeit, verschiedene Reize in verschiedene Ströme zu trennen und anschließend zu entscheiden, welche Ströme für sie am relevantesten sind.

Diese Fähigkeit ist dem Menschen angeboren, aber den Computern fremd. Wissenschaftler haben Jahrzehnte damit verbracht, verschiedene Ansätze zu versuchen, Computern diese Fähigkeit zu geben.

Jetzt sind Forscher am Institut für Automatisierung der Chinesischen Akademie der Wissenschaften näher an die Lösung des Problems gelangt, durch die Entwicklung eines tiefen neuronalen Netzwerkes.

Sie haben ein auditives Aufmerksamkeitsauswahlmodell entworfen, das es Computern ermöglicht, nützliche Audiosignale von Störsignalen auszusondern.

Wenn Computer den Cocktailparty-Effekt meistern können, würde dies eine große Bandbreite möglicher Anwendungen haben.

Zum Beispiel könnten wir einer Fahrkartenmaschine in einer lauten U-Bahnstation unser Ziel sagen und sofort ein Ticket kaufen. Oder man könnte einem Roboter in der Küche befehlen, einem eine Tasse Tee zu bringen, während man gleichzeitig laut fernsieht.

(gemäß der Nachrichtenagentur Xinhua)

Xinhuanet Deutsch

Chinesische Wissenschaftler versuchen, „perfekten Zuhörer“ zu erschaffen

GERMAN.XINHUA.COM 2018-04-10 14:57:26

BEIJING, 9. April (Xinhuanet) -- Stellen Sie sich vor, auf der Straße zu gehen, während zwei Frauen vor Ihnen über einen neuen Laden sprechen, hinter Ihnen ein Hund bellt, und an der Ecke eine Polizeisirene heult.

Sie drehen sich zum Polizeiauto, um zu sehen, was sich ereignet hat. Wenn die Sirene verklingt, merken Sie, dass der Hund immer noch bellt und die Passanten sich immer noch unterhalten.

Ohne es zu wissen, haben Sie eine Lösung für ein Problem gefunden, mit dem Computer seit mehr als einem halben Jahrhundert ringen: der Cocktailparty-Effekt.

Der Cocktailparty-Effekt ist das Phänomen der Fähigkeit des Gehirns, die akustische Aufmerksamkeit auf einen bestimmten Stimulus zu fokussieren und gleichzeitig eine Reihe anderer Reize herauszufiltern, etwa wenn sich ein Partybesucher in einem lauten Raum auf eine einzelne Konversation konzentriert. Zuhörer haben die Fähigkeit, verschiedene Reize in verschiedene Ströme zu trennen und anschließend zu entscheiden, welche Ströme für sie am relevantesten sind.

Diese Fähigkeit ist dem Menschen angeboren, aber den Computern fremd. Wissenschaftler haben Jahrzehnte damit verbracht, verschiedene Ansätze zu versuchen, Computern diese Fähigkeit zu geben.

Jetzt sind Forscher am Institut für Automatisierung der Chinesischen Akademie der Wissenschaften näher an die Lösung des Problems gelangt, durch die Entwicklung eines tiefen neuronalen Netzwerkes.

Sie haben ein auditives Aufmerksamkeitsauswahlmodell entworfen, das es Computern ermöglicht, nützliche Audiosignale von Störsignalen auszusondern.

Wenn Computer den Cocktailparty-Effekt meistern können, würde dies eine große Bandbreite möglicher Anwendungen haben.

Zum Beispiel könnten wir einer Fahrkartenmaschine in einer lauten U-Bahnstation unser Ziel sagen und sofort ein Ticket kaufen. Oder man könnte einem Roboter in der Küche befehlen, einem eine Tasse Tee zu bringen, während man gleichzeitig laut fernsieht.

(gemäß der Nachrichtenagentur Xinhua)

010020071360000000000000011100001371003211