Data sa dajú už stiahnuť a su voľne k dispozíci...
https://commonvoice.mozilla.org/sk/datasets
Takže hurá na trénovanie slovenskej AI.
Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine
Moderátori: psichac, Moderátori
- boraicho
- Ultimate člen
- Príspevky: 12411
- Dátum registrácie: 03 Feb 2007, 00:00
- Bydlisko: Prešov
- Vek: 35
- Kontaktovať používateľa:
Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine
ospravedlnujem sa za blbu otazku, ale ako to funguje? alebo ako to použiť? Kde strčim ten subor?
Rasbery alebo niečo podobne, pripojim mikrofon a ono to potom dokaže prekladať hlasove príkazy do textu a všetko OFFLINE?
Rasbery alebo niečo podobne, pripojim mikrofon a ono to potom dokaže prekladať hlasove príkazy do textu a všetko OFFLINE?
0
"Aj nevinne vyzerajúca súčiastka, môže byť príčinou nefunkčnosti zariadenia a tou kondenzator 100% je"
3D REBEL II + PLA + PETG
CNC 1810 na DPS
3D REBEL II + PLA + PETG
CNC 1810 na DPS
Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine
Ak je to popis blokového HW schématu, tak ano je to v podstate tak. Podstatné na tom riešení je ale to off-line .
Ta malina nemusí byť jediné HW riešenie viz. staršie príspevky, alebo inšpirácia z malého porovnávania HW.
https://www.hackster.io/dmitrywat/offli ... ker-c537e7
Je potrebné tam mať eště v tej maline nejaký SW na prevod hlasu do textu (STT-speech to text) napríklad DeepSpeech.
Tu je návod na inštaláciu na Raspberry Pi 4
https://github.com/touchgadget/DeepSpeech
Manuál k DeepSpeech.
https://deepspeech.readthedocs.io/en/latest/
Ďalšie informácie o prevode hlasu na text hľadať v kombináciach STT-speech to text-speech-voice-speak + Raspberry
Existuje i varianta využitia opačná a to prevod textu na hlas tj. TTS-text to speech.
https://levelup.gitconnected.com/instal ... af16459ab9
https://github.com/mozilla/TTS
DOVOLÍM SI POZNÁMKU, TYCH SLOVENSKÝCH DÁT VO ZVEREJNENOM BALÍKU NA STIAHNUTIE JE STRAŠNE MÁLO NA NEJAKÉ ZLOŽITEJŠIE ÚLOHY!
Celkom je teraz k dispozícii cca 6-7000 "viet" a v prípade slovenčiny to sú z 90% len samostatné slová.
Nahovorených je celkom 12 hodín z toho validovaných len 10 hodín. Je to tak-tak na nejaké jednoduché príkazy, to sa uvidí...
Takže prispievajte, šírte informácie, pritiahnite ďalších dobrovoľníkov, teraz keď už je slovenčina vonku, treba to už "len" rozširovať a zlepšovať... darovaním:
- textov s licenciou CC0 https://commonvoice.mozilla.org/sentence-collector/, alebo validovaním tych z wikipedie https://discourse.mozilla.org/t/slovak- ... a/71350/11
- hlasu (hovorte)
- ucha (počúvajte)
Ta malina nemusí byť jediné HW riešenie viz. staršie príspevky, alebo inšpirácia z malého porovnávania HW.
https://www.hackster.io/dmitrywat/offli ... ker-c537e7
Je potrebné tam mať eště v tej maline nejaký SW na prevod hlasu do textu (STT-speech to text) napríklad DeepSpeech.
Tu je návod na inštaláciu na Raspberry Pi 4
https://github.com/touchgadget/DeepSpeech
Manuál k DeepSpeech.
https://deepspeech.readthedocs.io/en/latest/
Ďalšie informácie o prevode hlasu na text hľadať v kombináciach STT-speech to text-speech-voice-speak + Raspberry
Existuje i varianta využitia opačná a to prevod textu na hlas tj. TTS-text to speech.
https://levelup.gitconnected.com/instal ... af16459ab9
https://github.com/mozilla/TTS
DOVOLÍM SI POZNÁMKU, TYCH SLOVENSKÝCH DÁT VO ZVEREJNENOM BALÍKU NA STIAHNUTIE JE STRAŠNE MÁLO NA NEJAKÉ ZLOŽITEJŠIE ÚLOHY!
Celkom je teraz k dispozícii cca 6-7000 "viet" a v prípade slovenčiny to sú z 90% len samostatné slová.
Nahovorených je celkom 12 hodín z toho validovaných len 10 hodín. Je to tak-tak na nejaké jednoduché príkazy, to sa uvidí...
Takže prispievajte, šírte informácie, pritiahnite ďalších dobrovoľníkov, teraz keď už je slovenčina vonku, treba to už "len" rozširovať a zlepšovať... darovaním:
- textov s licenciou CC0 https://commonvoice.mozilla.org/sentence-collector/, alebo validovaním tych z wikipedie https://discourse.mozilla.org/t/slovak- ... a/71350/11
- hlasu (hovorte)
- ucha (počúvajte)
0
Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine
Bol vydaný nový hlasový dataset a slovenčina má už celkovo 17 hodín overených záznamov voľne k použitiu.
https://commonvoice.mozilla.org/sk/datasets
https://commonvoice.mozilla.org/sk/datasets
0
Re: Naučte svoj HW-elektroniku porozumieť hovorenej reči - slovenčine
V lete bol vydaný aktualizovaný dataset. Slovenčina nezaznamenala výrazný pokrok a pribudla len 1 hodina a tak má iba 18 hodín overených záznamov.
Chce to nové hlasové záznamy a trochu viac zaparacovať hlavně na pridávaní a kontrole nového obsahu tu:
https://commonvoice.mozilla.org/sentenc ... ctor/#/sk/
Chce to nové hlasové záznamy a trochu viac zaparacovať hlavně na pridávaní a kontrole nového obsahu tu:
https://commonvoice.mozilla.org/sentenc ... ctor/#/sk/
0
-
- Podobné témy
- Odpovedí
- Zobrazení
- Posledný príspevok
-
- 1 Odpovedí
- 586 Zobrazení
-
Posledný príspevok od používateľa mr.dred