Wrocławscy naukowcy znów zaskakują!

poniedziałek, 14.9.2015 09:43 1194 0

Rozumie pytanie w formie pisanej i mówionej. Następnie wskazuje fragment w nagraniu, w którym mówca wypowiada poszukiwane przez nas słowa. Audioscope to innowacyjny system do automatycznego wyszukiwania treści w zapisach audio w języku polskim.

Nowy projekt Politechniki Wrocławskiej, Uniwersytetu Wrocławskiego i projekt wrocławskiej firmy jest odpowiedzią na zapotrzebowanie polskiego rynku. Istnieje coraz więcej możliwości gromadzenia danych audio, jednak wciąż nie ma narzędzi, które pozwalają szybko wyszukiwać informacje w takich bazach.

- Audioscope ma zadanie przyspieszyć ten proces i wypełnić istniejącą na rynku lukę, a tym samym rozszerzyć funkcjonalność innych produktów oferowanych przez Neurosoft m.in. e-Protokołu, który służy do nagrywania posiedzeń sądowych – wyjaśnia Cezary Dołęga.

Póki co projekt jest w fazie badań, jednak już teraz można przewidzieć, że zastosowanie znalazłby w wielu instytucjach, których działalność wiąże się z gromadzeniem danych dźwiękowych. Obszerne bazy audio w Polsce mają sądy powszechne, kancelarie sejmu i senatu oraz inne organizacje państwowe odpowiedzialne za bezpieczeństwo w kraju. Audioscope powinien też zainteresować podmioty komercyjne, takie jak: call center, contact center czy firmy oferujące monitoring mediów.

Przedsięwzięcie opiera się na innowacyjnym połączeniu następujących technologii: analizie i przetwarzaniu sygnałów dźwiękowych, automatycznym rozpoznawaniu mowy (ASR), przetwarzaniu języka naturalnego (NLP), uczeniu maszynowym (ML) i wyszukiwaniu informacji (IR).

- Nasz zespół będzie przede wszystkim odpowiedzialny za zaprojektowanie i implementację silnika wyszukującego, który będzie w stanie efektywnie obsłużyć wielkie ilości danych (BIGDATA). Ponadto mamy w planie opracowanie ergonomicznej aplikacji webowej, umożliwiającej użytkownikowi przeprowadzenie wyszukiwania i analizę wyników. Oprócz tego będziemy wspierać naszych partnerów z uczelni w zagadnieniach przetwarzania sygnałów, zastosowania sieci neuronowych oraz zaawansowanej analizie tekstów w języku polskim - informuje Cezary Dołęga.

Na prowadzenie badań uzyskano dofinansowanie od Narodowego Centrum Badań i Rozwoju w ramach Programu Badań Stosowanych. Całkowity koszt realizacji przedsięwzięcia wynosi 1 642 873 złotych. Z tego dofinansowanie udzielone przez Narodowe Centrum Badań i Rozwoju wynosi aż 1 223 375 złotych.

Projekt obecnie wszedł w pierwszą fazę badań, które zakończą się 31 marca 2017 roku.

Dodaj komentarz

Komentarze (0)