ATNEL tech-forum • Sterowanie głosowe

Kanał - ATNEL tech-forum

Wszystkie działy

Najnowsze wątki

Teraz jest 20 lis 2025, o 10:20

Portal » Forum » Dział "RYBNY"

Strefa czasowa: UTC + 1

Sterowanie głosowe

Strona 1 z 1

[ Posty: 16 ]

Drukuj

Poprzedni | Następny

Autor

Wiadomość

Paul Dirac

Tytuł: Sterowanie głosowe

Napisane: 5 maja 2013, o 15:49

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Witam!

Poszukuje jakiegoś schematu do obsługi głosowego układu. Każda podpowiedż, najlepiej jakies przykładowe schematy. To w sumie dzięki z asugestie.

_________________
sig off ;(

Góra

Google

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 18:24

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Naprawdę szacunek w stosunku do ciebie. Zawsze z taka otwartością starasz się wspomóc w poszukiwaniu rozwiązania problemu.

Ogólnie planuje zbudowac robota, który będzie sterowany głosowo komendami, a na te komendy ma reagować również głosem jako odpowiedź. Obecnie to ja nagrywam pojedyńcze litery. Następnie będzie analiza za pomocą rozwinięcia szeregu fouriera , żebym wiedział jak próbkowac. bo jak to jeden z userów pisał, jak będzie chrypa to może nie rozpoznać

_________________
sig off ;(

Góra

Ledes

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 19:16

Użytkownik

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Rozpoznawanie mowy i synteza to nie jest łatwe zadanie jeśli to robić od zera.
Miałem o tym przedmiot na studiach i niestety ale nie chcę nikogo zniechęcać, ale bez PORZĄDNYCH podstaw teoretycznych z zakresu cyfrowej techniki dźwięku i mowy oraz DSP będzie bardzo ciężko.
Nie mówię, że się nie da, bo wszystko się da. Jednak nie jest to porównywanie dwóch stringów wpisanego z klawiatury i tego w pamięci, co to to nie.
Jeśli chcesz nakieruję Cię na kilka pozycji z literatury gdzie jest to opisane w szczegółach.
Niestety ale podstawa to wyższa matematyka, wiedza z DSP, teorii sygnałów i Matlaba.

Właśnie, jak chcesz zacząć zabawę z mową to polecam zacząć od Matlaba - ma sporo wbudowanych funkcji do tego celu - np. rysowanie spektrogramu.

Samo porównanie wyniku FFT niewiele Ci da w tym przypadku, uwierz mi. Sygnał mowy jest na tyle złożony, że to mija się z celem. Trzeba się przestawić na inne "jednostki" - fonemy, difony itp. I to je porównywać.

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2

Góra

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:03

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

W sumie lektura się przyda. To jaką polecasz?
Mnsótwo jest literatiry o tym DSP:
znalazłem 38 pozycji na w bibliotece
The DSP handbook : algorithms, applications and design techniques / Andrew Baterman, Stephens Iain Paterson.

_________________
sig off ;(

Ostatnio edytowano 5 maja 2013, o 20:17 przez Paul Dirac, łącznie edytowano 1 raz

Góra

Google

Ledes

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:17

Użytkownik

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Cyfrowe przetwarzanie sygnałów : metody, algorytmy, zastosowania, Dag Stranneby
Cyfrowe przetwarzanie sygnałów : od teorii do zastosowań, Tomasz P. Zieliński.
Dźwięk i jego percepcja : aspekty fizyczne i psychoakustyczne, Edward Ozimek.
Dźwięk cyfrowy : wybrane zagadnienia teoretyczne, technologia, zastosowania, Andrzej Czyżewski.
Przetwarzanie sygnałów w praktyce, Mark Owen

Autor postu otrzymał pochwałę

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2

Góra

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:21

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

dobra wypożyczyłem te pozycje, i kilka w angielskim. Jutro je odiore w bibliotece i zaczynamy zabawe. A to ty na jakim kierunku takie cuda masz jak analiza sygnałów?

_________________
sig off ;(

Góra

Ledes

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:27

Użytkownik

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

Elektronika i Telekomunikacja, specjalność Multimedia i Elektronika Powszechnego Użytku, Politechnika Poznańska

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2

Góra

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:30

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

ja tez politechnika więc wszystkie pozycje które podałes sa

. Wielkie dzięki.

_________________
sig off ;(

Góra

Google

xbary

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 20:51

Użytkownik

Dołączył(a): 03 lip 2012
Posty: 238
Pomógł: 5

Jeśli chłopak ma wymyślać rozpoznawanie mowy to rzeczywiście, profesor w tych sprawach trzeba być przynajmniej.

A szukałeś jakiegoś rozwiązania Open Source ... co normalnie na komputerze sampluje i rozpoznaje mowę tzn jakieś wybrane zwroty itd?? ... bo jak by się udało dojść do takiego kodu to już nie problem przenieść z wzmiankami na jaki mikrokontroler

Góra

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:08

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Jak juz będę w temacie przynajmniej ciut cuit obeznany, to mogę pójść do jakiegos profesora i popytać jak on widzi problem. Się zobaczy. Ogólnie dzięki panowie za zainteresowanie tematem.

_________________
sig off ;(

Góra

MichalXY

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:10

Użytkownik

Dołączył(a): 15 lut 2012
Posty: 344
Lokalizacja: Bydgoszcz
Pomógł: 11

Paul Dirac temat który poruszasz jest diabelnie ciekawy(aż sam się kurczę zażyłem nim

) tak jak rozpoznawanie obrazu ale to już dyskusja na inny temat

.
Zobacz tutaj: https://instruct1.cit.cornell.edu/cours ... index.html właśnie oni też robili pojazd sterowany głosem, wykorzystali oni ATMEGE 32. Przejrzyj sobie stronkę masz tam schematy i kody programu w C.

Góra

Paul Dirac

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:30

Użytkownik

Dołączył(a): 08 mar 2013
Posty: 236
Lokalizacja: Warszawa
Pomógł: 5

Kolega na inżynierce wycinał z filmu ruchome obiekty. kod, który juz był sprawny zajął mu niecałe 100+ linijek. Właśnie w tych niby mega trudnych sprawach trzeba mieć pomsył bo sie narobic to każdy potrafi, a rezultatu może nie być żadnego.

_________________
sig off ;(

Góra

Google

Mscichu

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:31

Użytkownik

Dołączył(a): 17 sty 2013
Posty: 327
Lokalizacja: Białystok
Pomógł: 14

To może być pomocne:
https://instruct1.cit.cornell.edu/cours ... index.html
i to jakiś gotowiec pod Andurino:
http://hackaday.com/2012/09/22/speech-r ... n-arduino/

Tak poza tym, to możesz informować na bieżąco jak idą postępy, jestem ciekawy jak to wszystko wyjdzie

Ostatnio edytowano 5 maja 2013, o 21:38 przez Mscichu, łącznie edytowano 1 raz

Góra

Ledes

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:35

Użytkownik

Dołączył(a): 06 maja 2012
Posty: 758
Pomógł: 9

xbary napisał(a):

Wiesz, jest pytanie czy ktoś chce to zrozumieć czy tylko użyć gotowca jako biblioteki. Jednak w tym drugim przypadku też wypada mieć jakieś minimalne pojęcie o temacie aby wiedzieć, jak to połączyć ze swoim projektem.

_________________
ATB 1.03, Win XP SP3, ECLIPSE Indigo 3.7.2

Góra

xbary

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 21:51

Użytkownik

Dołączył(a): 03 lip 2012
Posty: 238
Pomógł: 5

Ledes napisał(a):

xbary napisał(a):

Oczywiście

zgadzam się nawet z tym jeśli sam będzie chciał dojść do tego , jaki algorytm zastosować i jak go napisać, wielki szacun jeśli w końcu naskrobie po swojemu tak złożony algorytm .

Góra

IUVOit

Tytuł: Re: Sterowanie głosowe

Napisane: 5 maja 2013, o 22:23

Użytkownik

Dołączył(a): 01 lis 2011
Posty: 266
Lokalizacja: Szczecin
Pomógł: 9

Na maxa ciekawe zagadnienie, ale zarazem chyba bardzo trudne do wykonania:) Ale na pewno jest możliwe, w swoim telefonie mam opcję mówię a on mi pisze SMS, bardzo dobrze sobie z tym radzi. Niesamowite to jest!

Takie zadania rozwiązuje się między innymi za pomocą sztucznych sieci neuronowych. Kiedyś miałem kod programu w delphi (szukam ale nie mogę znaleźć) który rozpoznawał literki.
Najpierw program uczył się literek. Sieć neuronowa uczyła się literek. Wagi przy każdym neuronie się ustawiały.
Jak sieć nauczyła się literek, to dosyć dobrze radziła sobie z rozpoznawaniem literek.

Wydaje mi się, że rozpoznawanie tekstu, mowy, twarzy itd. od strony matematycznej sprowadza się do podobnego problemu

Może powinieneś iść tą drogą- sztuczne sieci neuronowe?

Na pewno nie może to być standardwy algorytm który porównuje wypowiedziane słowa, ze słowami których próbki "szablon" jest w bazie. danych. Ponieważ nigdy tak samo się nie wypowie słowa.

Albo algorytm oparty na jakimś prawdopodobieństwie... hmmm
Ale jak by tak dokładnie każdy wyraz (próbka po próbce...) był porównywany z nowo wypowiedzianym wyrazem to na pewno moc obliczeniowa AVR by nie wystarczyła.

Wydaje mi się, że jest to ambitny i mega trudny temat do wykonania. Chyba, że są jakieś triki o których nie mam najmniejszego pojęcia:)

Życzę powodzenia

_________________
www.gryfsmart.pl

Góra

Strona 1 z 1

[ Posty: 16 ]

Portal » Forum » Dział "RYBNY"

Strefa czasowa: UTC + 1

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 1 gość

Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów
Nie możesz dodawać załączników

Skocz do: