Na maxa ciekawe zagadnienie, ale zarazem chyba bardzo trudne do wykonania:) Ale na pewno jest możliwe, w swoim telefonie mam opcję mówię a on mi pisze SMS, bardzo dobrze sobie z tym radzi. Niesamowite to jest!
Takie zadania rozwiązuje się między innymi za pomocą sztucznych sieci neuronowych. Kiedyś miałem kod programu w delphi (szukam ale nie mogę znaleźć) który rozpoznawał literki.
Najpierw program uczył się literek. Sieć neuronowa uczyła się literek. Wagi przy każdym neuronie się ustawiały.
Jak sieć nauczyła się literek, to dosyć dobrze radziła sobie z rozpoznawaniem literek.
Wydaje mi się, że rozpoznawanie tekstu, mowy, twarzy itd. od strony matematycznej sprowadza się do podobnego problemu
Może powinieneś iść tą drogą- sztuczne sieci neuronowe?
Na pewno nie może to być standardwy algorytm który porównuje wypowiedziane słowa, ze słowami których próbki "szablon" jest w bazie. danych. Ponieważ nigdy tak samo się nie wypowie słowa.
Albo algorytm oparty na jakimś prawdopodobieństwie... hmmm
Ale jak by tak dokładnie każdy wyraz (próbka po próbce...) był porównywany z nowo wypowiedzianym wyrazem to na pewno moc obliczeniowa AVR by nie wystarczyła.
Wydaje mi się, że jest to ambitny i mega trudny temat do wykonania. Chyba, że są jakieś triki o których nie mam najmniejszego pojęcia:)
Życzę powodzenia