Babble und Rhasspy: Unterschied zwischen den Versionen

Aus FHEMWiki
Keine Bearbeitungszusammenfassung
Zeile 11: Zeile 11:
Darüber hinaus stellt Babble eine Verbindung zu einem RiveScript-Modul her, falls dies in der lokalen Perl-Installation vorhanden ist. RiveScript ist eine einfache Programmiersprache für ChatBots, Babble realisiert also für die Ansprache von FHEM auch einen ChatBot.
Darüber hinaus stellt Babble eine Verbindung zu einem RiveScript-Modul her, falls dies in der lokalen Perl-Installation vorhanden ist. RiveScript ist eine einfache Programmiersprache für ChatBots, Babble realisiert also für die Ansprache von FHEM auch einen ChatBot.


=== Sprachausgabe von Rhasspy via FHEM ===
=== Sprachausgabe von Rhasspy direkt oder via FHEM ?===
Rhasspy bietet verschiedene Open Source Sprach-Synthesizer an
Rhasspy bietet verschiedene integrierte Open Source Sprach-Synthesizer an
*Vorteile
*Vorteile
**Cloud-frei
**Cloud-frei
Zeile 18: Zeile 18:
**Schlechte Sprachqualität
**Schlechte Sprachqualität
**Steuerung von Ausgabeparametern wie z.B. eine zur Nachtzeit verringerte Lautstärke, nur über externen Aufwand (=Fernsteuerung von Rhasspy) möglich
**Steuerung von Ausgabeparametern wie z.B. eine zur Nachtzeit verringerte Lautstärke, nur über externen Aufwand (=Fernsteuerung von Rhasspy) möglich
 
Es empfiehlt sich daher, die Sprachausgabe von Rhasspy komplett an FHEM zu übergeben.




[[Kategorie:Sprachsteuerung|Babble]]
[[Kategorie:Sprachsteuerung|Babble]]

Version vom 26. Dezember 2021, 06:35 Uhr


Clock - Under Construction.svg An dieser Seite wird momentan noch gearbeitet.


Einleitung

Rhasspy ist eine Open Source Server-Lösung für Spracherkennung und Sprachsteuerung, welche auf einem RaspBerry Pi oder einem anderen Debian-basierten Serversystem lauffähig ist. Es handelt sich dabei um eine Sammlung von Programmen (=Skripten in der Python-Sprechweise), die unter einer einheitlichen und sehr flexiblen Benutzungsoberfläche zusammengefasst sind. Die Besonderheit an Rhasspy ist, dass es nach der Installation komplett offline betrieben werden kann. Es werden also keine Daten an einen Server im Internet geschickt, und für den Betrieb nur für FHEM werden nur moderate Hardwareanforderungen gestellt - ein aktueller Raspberry Pi ab Modell 3B+ sollte in der Regel genügen.

Die Anbindung weiterer Räume ist über sogenannte "Satelliten" möglich. Dies kann z.B. ein Pi Zero mit Mikro und Lautsprecher sein, ein ESP32 mit entsprechender Hardware oder ein Mobiltelefon mit Android und der entsprechenden App.

Rhasspy besteht aus vielen unterschiedlichen Modulen (Hot-Word Erkennung, Text-to-Speech, Speech-to-Text, Intent Erkennung, etc.). Alle diese Module kommunizieren miteinander über das MQTT-Protokoll.

Das Modul 95_Babble.pm stellt eine komfortable Oberfläche bereit, um per Webinterface ein Natural Language User Interface (NLUI) zu konfigurieren. Mit ein paar zusätzlichen Codezeilen kann Babble ganz komfortable mit einem Rhassps-Server zusammenarbeiten

Darüber hinaus stellt Babble eine Verbindung zu einem RiveScript-Modul her, falls dies in der lokalen Perl-Installation vorhanden ist. RiveScript ist eine einfache Programmiersprache für ChatBots, Babble realisiert also für die Ansprache von FHEM auch einen ChatBot.

Sprachausgabe von Rhasspy direkt oder via FHEM ?

Rhasspy bietet verschiedene integrierte Open Source Sprach-Synthesizer an

  • Vorteile
    • Cloud-frei
  • Nachteile
    • Schlechte Sprachqualität
    • Steuerung von Ausgabeparametern wie z.B. eine zur Nachtzeit verringerte Lautstärke, nur über externen Aufwand (=Fernsteuerung von Rhasspy) möglich

Es empfiehlt sich daher, die Sprachausgabe von Rhasspy komplett an FHEM zu übergeben.