Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2015-01-06 10:04:10

  ethanak - Użytkownik

ethanak
Użytkownik
Skąd: Ungwenor
Zarejestrowany: 2010-07-19
Serwis

Sterowanie głosem - jak to najsmaczniej ugryźć?

Jako że wszystkie komputery w moim otoczeniu świetnie potrafią mówić, postanowiłem wreszcie, aby chociaż jeden nauczył się mnie słuchać. Padło na Raspberry Pi, który robi u mnie za sterownik do piecyka CO (między innymi) - i który mógłby uprzejmie odpowiadać na wydawane głosem polecenia (np. w stylu "włącz to cholerstwo bo zimno").


Mój chitry plan jest następujący:

1) Do Raspa podłączam jakąś najprostszą kartę© dźwiękową i mikrofon
2) Dźwięk z mikrofonu przesyłam do włączonego non-stop mojego desktopa - nie chcę przeciążać Malinki, a desktop przez większość dnia się nudzi (pytanie przy okazji: jak najlepiej? jakiś pulseaudio czy po prostu prosty programik siedzący na mikrofonie i wysyłający dźwięk do serwerka na desktopie?)
3) Na desktopie instaluję sobie pocketsphinxa
4) Wykorzystuję hiszpański model akustyczny (IMHO najbliższy polskiemu) z voxforge
5) Tworzę słownik zawierający wszystkie rozpoznawalne słowa
6) Generuję wszystkie możliwe polecenia (trochę ich będzie ze względu na liczebniki) i tworzę plik .lm
7) Hm...

Teoretycznie dalej powinno być prosto. Tylko że:

a) dokumentacja pocketsphinxa jest jaka jest
b) wszelkie przykłady znalezione w necie dotyczą sphinxa 0.5, podczas gdy aktualna wersja (0.8) nie ma najmniejszego zamiaru współpracować z kodem napisanym dla starszej wersji
c) po prowizorycznym uruchomieniu pocketsphinx_continuous (na desktopie, mikrofon podłączony lokalnie) nie ma najmniejszego zamiaru ze mną współpracować - wypisuje wielce mnóstwo bardzo mądrych komunikatów, ale nie rozpoznaje żadnego tekstu.
d) hm...

Jakieś pomysły? Ktoś się może tym bawił?

W przystępie rozpaczy ściągnąłem sobie źródła Jaspera i zaczynam go analizować... może z tego coś wyjdzie? Podobno Jasper komuś zadziałał...


Nim mechaniczne larum zagrasz mi, kanalio,
głosząc nadejście Javy - śmiertelnego wroga!
[i]Zespół Adwokacki Dyskrecja[/i]

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
To nie jest tylko forum, to nasza mała ojczyzna ;-)

[ Generated in 0.006 seconds, 9 queries executed ]

Informacje debugowania

Time (s) Query
0.00009 SET CHARSET latin2
0.00005 SET NAMES latin2
0.00104 SELECT u.*, g.*, o.logged FROM punbb_users AS u INNER JOIN punbb_groups AS g ON u.group_id=g.g_id LEFT JOIN punbb_online AS o ON o.ident='18.221.187.121' WHERE u.id=1
0.00071 REPLACE INTO punbb_online (user_id, ident, logged) VALUES(1, '18.221.187.121', 1714687721)
0.00049 SELECT * FROM punbb_online WHERE logged<1714687421
0.00071 SELECT t.subject, t.closed, t.num_replies, t.sticky, f.id AS forum_id, f.forum_name, f.moderators, fp.post_replies, 0 FROM punbb_topics AS t INNER JOIN punbb_forums AS f ON f.id=t.forum_id LEFT JOIN punbb_forum_perms AS fp ON (fp.forum_id=f.id AND fp.group_id=3) WHERE (fp.read_forum IS NULL OR fp.read_forum=1) AND t.id=26879 AND t.moved_to IS NULL
0.00007 SELECT search_for, replace_with FROM punbb_censoring
0.00105 SELECT u.email, u.title, u.url, u.location, u.use_avatar, u.signature, u.email_setting, u.num_posts, u.registered, u.admin_note, p.id, p.poster AS username, p.poster_id, p.poster_ip, p.poster_email, p.message, p.hide_smilies, p.posted, p.edited, p.edited_by, g.g_id, g.g_user_title, o.user_id AS is_online FROM punbb_posts AS p INNER JOIN punbb_users AS u ON u.id=p.poster_id INNER JOIN punbb_groups AS g ON g.g_id=u.group_id LEFT JOIN punbb_online AS o ON (o.user_id=u.id AND o.user_id!=1 AND o.idle=0) WHERE p.topic_id=26879 ORDER BY p.id LIMIT 0,25
0.00067 UPDATE punbb_topics SET num_views=num_views+1 WHERE id=26879
Total query time: 0.00488 s