photog.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A place for your photos and banter. Photog first is our motto Please refer to the site rules before posting.

Administered by:

Server stats:

244
active users

#speech2text

0 posts0 participants0 posts today
Verfassungklage@troet.cafe<p><a href="https://troet.cafe/tags/Speech" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech</span></a> <a href="https://troet.cafe/tags/Note" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Note</span></a> – <a href="https://troet.cafe/tags/Notizen" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Notizen</span></a> und mehr - </p><p>Bei der Recherche für einen Artikel über <a href="https://troet.cafe/tags/Text2Speech" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Text2Speech</span></a> und <a href="https://troet.cafe/tags/Speech2Text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech2Text</span></a> unter <a href="https://troet.cafe/tags/Linux" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Linux</span></a> bin ich auf die kleine App Speech Note gestoßen, nicht zu verwechseln mit dem proprietären SpeechNotes. Insofern ist der Name nicht wirklich clever gewählt. Clever ist dagegen das Konzept der noch jungen Anwendung. </p><p>Speech Note ist eine vielseitige Anwendung für Notizen, die durch ihre Funktionen und Datenschutzorientierung hervorsticht. </p><p><a href="https://linuxnews.de/speech-note-notizen-und-mehr/" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="ellipsis">linuxnews.de/speech-note-notiz</span><span class="invisible">en-und-mehr/</span></a></p>
Parleur<p>Ça existe les applications libres de <a href="https://mastodon.parleur.net/tags/speech2text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>speech2text</span></a>&nbsp;? 🤔</p>
utzer [Pleroma]Wenn eins ein paar Audiodateien <a class="hashtag" href="https://soc.utzer.de/tag/transkribieren" rel="nofollow noopener noreferrer" target="_blank">#transkribieren</a> wollen würde, wie würde eins das auf <a class="hashtag" href="https://soc.utzer.de/tag/debian" rel="nofollow noopener noreferrer" target="_blank">#Debian</a> machen? Ich hatte mal ein Tool irgendwo gefunden, dass das in CLI konnte und dann den Text meine ich sogar mit den Sprechern ausgeworfen hat. Vielleicht hab ich das Tool sogar noch installiert. <br><br>Offline wäre super. <br><br><a class="hashtag" href="https://soc.utzer.de/tag/speech2text" rel="nofollow noopener noreferrer" target="_blank">#Speech2Text</a> <a class="hashtag" href="https://soc.utzer.de/tag/voicerecognition" rel="nofollow noopener noreferrer" target="_blank">#VoiceRecognition</a>
Kettwachsler<p>So eine <a href="https://sueden.social/tags/Leuchtschrift" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Leuchtschrift</span></a> hinten am Rücken, die während des <a href="https://sueden.social/tags/Radfahrens" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Radfahrens</span></a> dort anzeigt, was ich gerade sage. </p><p>DAS fände ich cool. </p><p>Quasi <a href="https://sueden.social/tags/Speech2Text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech2Text</span></a> for Dödel behind!</p>
amaz1ng<p><a href="https://social.anon-groups.de/tags/Speech2Text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech2Text</span></a></p><p>Eine Freundin hat fortschreitende Artrose in den Handgelenken &amp; war früher eine fleißige Schreiberin.</p><p>Heute leidet sie alleine bei der Beantwortung einer einzigen E-Mail.</p><p>Welches Tool kennt ihr, Möglichst Open-Source &amp; Offline, um Texte aus Sprache zu transkribieren?</p><p><a href="https://social.anon-groups.de/tags/Fedipower" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Fedipower</span></a></p>
Lapineige<p>Sur le site de Vosk (<a href="https://alphacephei.com/vosk/models" rel="nofollow noopener noreferrer" target="_blank"><span class="invisible">https://</span><span class="">alphacephei.com/vosk/models</span><span class="invisible"></span></a>), je vois deux gros modèles, celui de Vosk, et un de <a href="https://mamot.fr/tags/LINTO" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>LINTO</span></a>, et sur le site de LINTO (<a href="https://doc.linto.ai/#/services/linstt_download" rel="nofollow noopener noreferrer" target="_blank"><span class="invisible">https://</span><span class="ellipsis">doc.linto.ai/#/services/linstt</span><span class="invisible">_download</span></a>) il y a :<br>- des modèles v1, 4 différents<br>- des modèles v2 (a priori meilleurs ?), dont 2 "acoustic models" et 2 "decoding graphs".</p><p>Lesquels servent à quoi ?</p><p>À l'usage, vous en avez trouvé un meilleur ? (et en quoi ?)<br>Ou c'est pareil ?</p><p>Je ne m'y retrouve pas dans tous ces modèles de <a href="https://mamot.fr/tags/Speech2Text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech2Text</span></a> 😅</p>
Lapineige<p>Question pour les gens qui ont testé la transcription automatique de la parole (<a href="https://mamot.fr/tags/Speech2Text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Speech2Text</span></a>) intégrée à <a href="https://mamot.fr/tags/Kdenlive" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Kdenlive</span></a> : quel modèle <a href="https://mamot.fr/tags/Vosk" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>Vosk</span></a> choisir ?</p><p>Je compte prendre un des "gros" modèle pour avoir la meilleure fidélité de la retranscription.</p><p>Mais pour retranscrire du français, quel modèle est le plus performant ?</p><p>Plus de détails ⬇️</p>
Couscous<p><span class="h-card"><a href="https://framapiaf.org/@Chocobozzz" class="u-url mention" rel="nofollow noopener noreferrer" target="_blank">@<span>Chocobozzz</span></a></span> (et peut-être) <span class="h-card"><a href="https://framapiaf.org/@booteille" class="u-url mention" rel="nofollow noopener noreferrer" target="_blank">@<span>booteille</span></a></span> </p><p>Hey hey, j'avais une petite question à propos de <a href="https://mamot.fr/tags/peertube" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>peertube</span></a>. En m'impliquant sur <a href="https://mamot.fr/tags/commonvoice" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>commonvoice</span></a> de Mozilla, je me suis demandé si des projets s'en servaient pour du <a href="https://mamot.fr/tags/speech2text" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>speech2text</span></a> (j'ai dû mal cherché et rien trouvé d'utilisable pour un end user...), et donc je me demandais si peertube envisageait d'implémenter ça?</p><p>Même avec des trad approximatives, ce serait d'une grande aide pour gagner du temps sur les traductions en général je suppose?</p>