Kanał - ATNEL tech-forum
Wszystkie działy
Najnowsze wątki



Teraz jest 18 sty 2025, o 03:49


Strefa czasowa: UTC + 1





Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 16 ] 
Autor Wiadomość
PostNapisane: 5 maja 2013, o 15:49 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Witam!

Poszukuje jakiegoś schematu do obsługi głosowego układu. Każda podpowiedż, najlepiej jakies przykładowe schematy. To w sumie dzięki z asugestie.

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 18:24 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Naprawdę szacunek w stosunku do ciebie. Zawsze z taka otwartością starasz się wspomóc w poszukiwaniu rozwiązania problemu.


Ogólnie planuje zbudowac robota, który będzie sterowany głosowo komendami, a na te komendy ma reagować również głosem jako odpowiedź. Obecnie to ja nagrywam pojedyńcze litery. Następnie będzie analiza za pomocą rozwinięcia szeregu fouriera , żebym wiedział jak próbkowac. bo jak to jeden z userów pisał, jak będzie chrypa to może nie rozpoznać

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 19:16 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Rozpoznawanie mowy i synteza to nie jest łatwe zadanie jeśli to robić od zera.
Miałem o tym przedmiot na studiach i niestety ale nie chcę nikogo zniechęcać, ale bez PORZĄDNYCH podstaw teoretycznych z zakresu cyfrowej techniki dźwięku i mowy oraz DSP będzie bardzo ciężko.
Nie mówię, że się nie da, bo wszystko się da. Jednak nie jest to porównywanie dwóch stringów wpisanego z klawiatury i tego w pamięci, co to to nie.
Jeśli chcesz nakieruję Cię na kilka pozycji z literatury gdzie jest to opisane w szczegółach.
Niestety ale podstawa to wyższa matematyka, wiedza z DSP, teorii sygnałów i Matlaba.

Właśnie, jak chcesz zacząć zabawę z mową to polecam zacząć od Matlaba - ma sporo wbudowanych funkcji do tego celu - np. rysowanie spektrogramu.

Samo porównanie wyniku FFT niewiele Ci da w tym przypadku, uwierz mi. Sygnał mowy jest na tyle złożony, że to mija się z celem. Trzeba się przestawić na inne "jednostki" - fonemy, difony itp. I to je porównywać.

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:03 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

W sumie lektura się przyda. To jaką polecasz?
Mnsótwo jest literatiry o tym DSP:
znalazłem 38 pozycji na w bibliotece
The DSP handbook : algorithms, applications and design techniques / Andrew Baterman, Stephens Iain Paterson.

_________________
sig off ;(



Ostatnio edytowano 5 maja 2013, o 20:17 przez Paul Dirac, łącznie edytowano 1 raz

Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:17 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Cyfrowe przetwarzanie sygnałów : metody, algorytmy, zastosowania, Dag Stranneby
Cyfrowe przetwarzanie sygnałów : od teorii do zastosowań, Tomasz P. Zieliński.
Dźwięk i jego percepcja : aspekty fizyczne i psychoakustyczne, Edward Ozimek.
Dźwięk cyfrowy : wybrane zagadnienia teoretyczne, technologia, zastosowania, Andrzej Czyżewski.
Przetwarzanie sygnałów w praktyce, Mark Owen


Autor postu otrzymał pochwałę

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:21 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

dobra wypożyczyłem te pozycje, i kilka w angielskim. Jutro je odiore w bibliotece i zaczynamy zabawe. A to ty na jakim kierunku takie cuda masz jak analiza sygnałów?

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:27 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Elektronika i Telekomunikacja, specjalność Multimedia i Elektronika Powszechnego Użytku, Politechnika Poznańska ;)

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:30 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

ja tez politechnika więc wszystkie pozycje które podałes sa :D. Wielkie dzięki.

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 20:51 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 03 lip 2012
Posty: 238
Pomógł: 5

Jeśli chłopak ma wymyślać rozpoznawanie mowy to rzeczywiście, profesor w tych sprawach trzeba być przynajmniej.

A szukałeś jakiegoś rozwiązania Open Source ... co normalnie na komputerze sampluje i rozpoznaje mowę tzn jakieś wybrane zwroty itd?? ... bo jak by się udało dojść do takiego kodu to już nie problem przenieść z wzmiankami na jaki mikrokontroler :)



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:08 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Jak juz będę w temacie przynajmniej ciut cuit obeznany, to mogę pójść do jakiegos profesora i popytać jak on widzi problem. Się zobaczy. Ogólnie dzięki panowie za zainteresowanie tematem.

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:10 
Offline
Użytkownik

Dołączył(a): 15 lut 2012
Posty: 344
Lokalizacja: Bydgoszcz
Pomógł: 11

Paul Dirac temat który poruszasz jest diabelnie ciekawy(aż sam się kurczę zażyłem nim :) ) tak jak rozpoznawanie obrazu ale to już dyskusja na inny temat ;) .
Zobacz tutaj: https://instruct1.cit.cornell.edu/cours ... index.html właśnie oni też robili pojazd sterowany głosem, wykorzystali oni ATMEGE 32. Przejrzyj sobie stronkę masz tam schematy i kody programu w C.



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:30 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Kolega na inżynierce wycinał z filmu ruchome obiekty. kod, który juz był sprawny zajął mu niecałe 100+ linijek. Właśnie w tych niby mega trudnych sprawach trzeba mieć pomsył bo sie narobic to każdy potrafi, a rezultatu może nie być żadnego.

_________________
sig off ;(



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:31 
Offline
Użytkownik

Dołączył(a): 17 sty 2013
Posty: 327
Lokalizacja: Białystok
Pomógł: 14

To może być pomocne:
https://instruct1.cit.cornell.edu/cours ... index.html
i to jakiś gotowiec pod Andurino:
http://hackaday.com/2012/09/22/speech-r ... n-arduino/

Tak poza tym, to możesz informować na bieżąco jak idą postępy, jestem ciekawy jak to wszystko wyjdzie ;)



Ostatnio edytowano 5 maja 2013, o 21:38 przez Mscichu, łącznie edytowano 1 raz

Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:35 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

xbary napisał(a):
Jeśli chłopak ma wymyślać rozpoznawanie mowy to rzeczywiście, profesor w tych sprawach trzeba być przynajmniej.

A szukałeś jakiegoś rozwiązania Open Source ... co normalnie na komputerze sampluje i rozpoznaje mowę tzn jakieś wybrane zwroty itd?? ... bo jak by się udało dojść do takiego kodu to już nie problem przenieść z wzmiankami na jaki mikrokontroler :)

Wiesz, jest pytanie czy ktoś chce to zrozumieć czy tylko użyć gotowca jako biblioteki. Jednak w tym drugim przypadku też wypada mieć jakieś minimalne pojęcie o temacie aby wiedzieć, jak to połączyć ze swoim projektem.

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 21:51 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 03 lip 2012
Posty: 238
Pomógł: 5

Ledes napisał(a):
xbary napisał(a):
Jeśli chłopak ma wymyślać rozpoznawanie mowy to rzeczywiście, profesor w tych sprawach trzeba być przynajmniej.

A szukałeś jakiegoś rozwiązania Open Source ... co normalnie na komputerze sampluje i rozpoznaje mowę tzn jakieś wybrane zwroty itd?? ... bo jak by się udało dojść do takiego kodu to już nie problem przenieść z wzmiankami na jaki mikrokontroler :)

Wiesz, jest pytanie czy ktoś chce to zrozumieć czy tylko użyć gotowca jako biblioteki. Jednak w tym drugim przypadku też wypada mieć jakieś minimalne pojęcie o temacie aby wiedzieć, jak to połączyć ze swoim projektem.


Oczywiście :) zgadzam się nawet z tym jeśli sam będzie chciał dojść do tego , jaki algorytm zastosować i jak go napisać, wielki szacun jeśli w końcu naskrobie po swojemu tak złożony algorytm .



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
PostNapisane: 5 maja 2013, o 22:23 
Offline
Użytkownik
Avatar użytkownika

Dołączył(a): 01 lis 2011
Posty: 266
Lokalizacja: Szczecin
Pomógł: 9

Na maxa ciekawe zagadnienie, ale zarazem chyba bardzo trudne do wykonania:) Ale na pewno jest możliwe, w swoim telefonie mam opcję mówię a on mi pisze SMS, bardzo dobrze sobie z tym radzi. Niesamowite to jest!

Takie zadania rozwiązuje się między innymi za pomocą sztucznych sieci neuronowych. Kiedyś miałem kod programu w delphi (szukam ale nie mogę znaleźć) który rozpoznawał literki.
Najpierw program uczył się literek. Sieć neuronowa uczyła się literek. Wagi przy każdym neuronie się ustawiały.
Jak sieć nauczyła się literek, to dosyć dobrze radziła sobie z rozpoznawaniem literek.

Wydaje mi się, że rozpoznawanie tekstu, mowy, twarzy itd. od strony matematycznej sprowadza się do podobnego problemu :)

Może powinieneś iść tą drogą- sztuczne sieci neuronowe?

Na pewno nie może to być standardwy algorytm który porównuje wypowiedziane słowa, ze słowami których próbki "szablon" jest w bazie. danych. Ponieważ nigdy tak samo się nie wypowie słowa.

Albo algorytm oparty na jakimś prawdopodobieństwie... hmmm
Ale jak by tak dokładnie każdy wyraz (próbka po próbce...) był porównywany z nowo wypowiedzianym wyrazem to na pewno moc obliczeniowa AVR by nie wystarczyła.

Wydaje mi się, że jest to ambitny i mega trudny temat do wykonania. Chyba, że są jakieś triki o których nie mam najmniejszego pojęcia:)

Życzę powodzenia :)

_________________
www.gryfsmart.pl



Góra
 Zobacz profil  
cytowanie selektywne  Cytuj  
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 16 ] 

Strefa czasowa: UTC + 1


Kto przegląda forum

Użytkownicy przeglądający ten dział: Majestic-12 [Bot] i 4 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów
Nie możesz dodawać załączników

Szukaj:
Skocz do:  
cron
Sitemap
Technologię dostarcza phpBB® Forum Software © phpBB Group phpBB3.PL
phpBB SEO