This page has been robot translated, sorry for typos if any. Original content here.

Sprachsynthese und Lesen elektronischer Bücher per Stimme

Синтез речи и чтение электронных книг голосом

Automatische Sprachsynthese - der Prozess der Erzeugung eines Sprachsignals - eine Technologie, die es ermöglicht, einen Text (Dokument, Brief, SMS) mit einer natürlichen Stimme zu lesen. Damit die synthetisierte Sprache natürlich klingt, müssen eine ganze Reihe von Problemen gelöst werden, die sowohl die Natürlichkeit der Stimme auf der Ebene des Timbres, der Glätte des Klangs und der Intonation als auch die korrekte Platzierung von Spannungen, die Dekodierung von Abkürzungen, Zahlen, Abkürzungen und Sonderzeichen betreffen.

Die Synthesetechnologie kann sowohl in einem engen Themenbereich als auch in einem breiten oder unbegrenzten Bereich gefragt sein. Für einen engen Bereich kann die Klangqualität aufgrund der Zusammenstellung von aufgezeichneten langen Sprachfragmenten, die sich auf diesen Bereich beziehen, auf das Natürlichste reduziert werden. Ein Beispiel für eine solche Synthese (Makrosynthese genannt) kann als Warnsystem für die Bewegung von Zügen dienen, die an Bahnhöfen großer Städte in Russland eingesetzt werden. Es ist viel schwieriger, einen Sprachsynthesizer für unbegrenzten Text in einem beliebigen Themenbereich zu erstellen. In diesem Fall kann der Benutzer das Synthesesystem um die Aussprache einer beliebigen Phrase oder eines Satzes bitten.

Sprachsynthesemethoden

Heute gibt es drei Hauptbereiche der Synthese: den Diphon-Ansatz (der Diphon ist der Ton von der Mitte eines Phonems bis zur Mitte des benachbarten Phonems), den Allophon-Ansatz (die Implementierung des Phonems, das vom Kontext links und rechts umgeben ist) und die Einheitenauswahltechnologie (Auswahl von Tonelementen aus der Sprachbasis). Aber jeder von ihnen hat seine Nachteile:

  • Diphon-Ansatz - ermöglicht es Ihnen, ein lesbares, aber unnatürliches Timbre-Sprachsignal zu erzeugen . Im Timbre der synthetisierten Sprache wird das Timbre des Spendersprechers nicht erkannt.
  • Allophonischer Ansatz - Die Natürlichkeit der Stimme ist aufgrund eines größeren Satzes von Klangelementen etwas höher als beim Diphon-Ansatz. Wie bei der Diphonsynthese erweist sich die Stimme jedoch als ziemlich roboterhaft, und es ist schwierig, die Stimme des Spenderansagers darin zu erkennen.
  • Einheitenauswahl - Die Natürlichkeit des Sprach-Timbres ist hoch und in der synthetisierten Stimme bleibt das Timbre der Stimme des Sprecher-Spenders erhalten. Aufgrund von Einschränkungen bei der Größe der Sprachbasis werden jedoch einige Texte (Wörter und ihre Kombinationen) mit merklichen Verzerrungen bis zum vollständigen Verlust einzelner Töne ausgesprochen.

Entwickler-Website: www.elantts.com .

Voice Engines

Derzeit eignen sich Voice Engines am besten für die Sprachsynthese:

  • Acapela ALYONA Multimedia (Acapela Multimedia Alyona)
  • Acapela ELAN NIKOLAI Tempo Multimedia (Acapela ELAN Tempo Multimedia) V5.1.0.0 Russisch (255 Kanäle)
  • Andere russische Stimmen

Hinzufügen. Information: Text-to-Speech-Engine (TTS) oder Sprachsynthese-Engines - Treiberähnliche Programme dienen zum Konvertieren und Synthetisieren von Text in eine Schallwelle. Sprachsynthese-Engines verfügen nicht über integrierte Steuerelemente, und nur ein TTS reicht nicht aus, damit Ihr Computer sprechen kann. Um TTS verwenden zu können, benötigen Sie ein Syntheseprogramm (TextAloud, Cool Reader, Balabolka usw.), das die Benutzeroberfläche ersetzt und es Ihnen ermöglicht, mit TTS zu arbeiten, Einstellungen, Klang und Klangfarbe zu ändern und andere Funktionen zu verwalten.

Синтез речи и чтение электронных книг голосом

Acapela, die Entwickler des beliebten russischsprachigen Sprachmoduls Nikolai, veröffentlichte eine neue russische weibliche Sprach-Engine namens Alyona, die auf SAPI-5 mit einer Frequenz von 22 kHz läuft. Alyona ist Nicholas in der Qualität der synthetisierten Sprache weit voraus. Das Timbre und die Intonation der Stimme sind angenehmer als die der Benutzer Katerinas Engine von ScanSoft RealSpeak.

Mit der Engine kommt Lexicon Manager - ein Wörterbuch-Editor, mit dem Sie die Aussprache von Wörtern sowohl wörtlich als auch phonetisch ändern können.

Mit KooBAudio, mp3book2005 und dieser Voice Engine kann beispielsweise ein 4-stündiger Roman in 10 Minuten gesprochen und in mp3 übertragen werden

Acapela Alyona - funktioniert gut mit Programmen wie: KooBAudio 0.7.0.7, mp3book2005, Balabolka, Cool Reader ...

Gute Sprachmaschine! Im Allgemeinen liest er wirklich klarer als alle anderen russischsprachigen, einschließlich Nikolai, aber letzterer hat aufgrund des tiefen Timbres seiner Stimme eine angenehmere Stimme und macht weniger Fehler bei Stress.

Acapela Alyona HQ TTS (Russisch) v.2.2.20 + Wörterbuch + Anleitung [Teil 1] Alena.part1.rar Alena.part1.rar Virusfrei von KAV
Acapela Alyona HQ TTS (Russisch) v.2.2.20 + Wörterbuch + Anleitung [Teil 2] Alena.part2.rar Alena.part2.rar Virusfrei von KAV

Buchleser

Balaboka 2.5.0.525

Синтез речи и чтение электронных книг голосом

Laden Sie Balabolka 2.5.0.525 (7 Mb) herunter Balabolka.rar Balabolka.rar Virusfrei von KAV

Kostenlos und am erfolgreichsten, mit allen notwendigen Funktionen, die Fähigkeit, in MP3 aufzunehmen.

ToM Reader 2.73

Синтез речи и чтение электронных книг голосом

Laden Sie ToM Reader 2.73 (1 Mb) herunter ToM_Reader2.73rus.rar ToM_Reader2.73rus.rar Virusfrei von KAV

Kostenlose, vertraute Art von Buch, visuelle Lesezeichen, die Möglichkeit, in MP3 aufzunehmen.

ToM Reader Russischer Leser. Der Hauptvorteil besteht darin, dass die Aussprache der Sprach-Engine nicht beeinträchtigt wird und Sätze und keine Absätze wie in vielen Programmen gelesen werden, sodass das Lesen einfach nachverfolgt werden kann. Es sieht aus wie ein gebundenes Buch, was auch praktisch ist. Unterstützte Formate: txt, doc, rtf, htm.

MP3book2005

Синтез речи и чтение электронных книг голосом

MP3book2005 herunterladen (7 Mb) MP3book2005_441.zip MP3book2005_441.zip Virusfrei von KAV

Mit allen notwendigen Funktionen zum Bearbeiten des Wortschatzes, Schreiben in MP3 und Lesen.

MP3book2005 ist ein Programm zum Bearbeiten von Vokabeln, Lesen und Schreiben in MP3. Es bearbeitet das Wörterbuch perfekt, aber ich möchte, dass es eine Buchansicht ist. Unterstützte Formate: txt, rtf, htm, fb2.

Vorbereitung für die Installation

1. Laden Sie die Sprachsynthese-Engine herunter:

2. Laden Sie die Infovox Desktop 2.220 Engine SP3 ( Acapela_Infovox_Desktop_2.220_EngineSP3.rar ) (24,08 MB) herunter - ein Steuerungs- und Aktivierungsprogramm mit einem nativen, einfachen Reader und vor allem dem Programm zum Bearbeiten des Alyona-Aussprachewörterbuchs - Lexicon Manager.

3. Laden Sie US English 2.220 ( English_ID2220.rar ) (233.13 Mb) herunter - eine Engine zur Synthese der englischen Sprache.

4. Laden Sie den Reader herunter, ein Programm zum Lesen von Büchern ( Links oben ).

5. Laden Sie AlyonaSlovari-Alyona22k ( AlyonaSlovari.rar ) (1,2 MB) herunter - Wörterbücher für Alena für 24345 Wörter.

7. Laden Sie MSagent.exe und ms_speech_api.exe ( sintez_bib.rar ) (1,09 MB Archiv) herunter - MSagent.exe (400 KB) - Agent für die Arbeit mit Spracherkennungs- und Synthese-Engines, ms_speech_api.exe (830 KB) - Bibliotheken, die für Spracherkennungs- und Sprachsyntheseprogramme erforderlich sind (für Windows 7 nicht erforderlich).

Unterstützt Betriebssysteme: Windows XP, Windows Vista, Windows 7, 8.

Alle unten auf der Seite aufgeführten Links!

Installation und Start

  • 1) Installieren Sie die Hauptsteuerung von Infovox Desktop 2.220 Engine
  • 2) Installieren Sie oben die Voice Engine Alyona Russian 2.220
  • 3) Starten Sie den Lizenzmanager und kopieren Sie die Schaltfläche "In Zwischenablage kopieren"
  • 4) Führen Sie key.exe aus, fügen Sie den Code dort ein und klicken Sie auf "Schlüssel erstellen", um eine Lizenzdatei zu generieren.
  • 5) Importieren Sie die resultierende Datei in den Lizenzmanager, indem Sie auf "Lizenzdatei importieren" klicken.
  • 6) Fügen Sie Wörterbücher mit dem Lexikon-Manager hinzu (Lexikon-Sprachzuordnungen - Lexikon hinzufügen ... oder Datei - Lexikon importieren)

Für den Betrieb sind zusätzliche Bibliotheken erforderlich (in dieser Reihenfolge installieren!):

  • 1. MSagent.exe und ms_speech_api.exe - Bibliotheken, die für den Betrieb von Spracherkennungs- und Syntheseprogrammen erforderlich sind. (wird für Win 7 nicht benötigt)
  • 2. Acapela ELAN Tempo Multimedia V5.1.0.0 Nicolai - Russische Sprachsynthese-Engine für den Agenten.
  • 3. ToM Reader 2.73 oder MP3book2005 - Programme zum Lesen, die einem gefallen werden.
  • 4. Laden Sie das Stress-Wörterbuch für ELAN Tempo Multimedia Nikolai herunter .

Kopieren Sie das Hauptwörterbuch exc_rus.txt und abb_rus.txt für Abkürzungen in das Paket C: \ Programme \ Elan und exc_rus.txt auch in Programme \ MP3book2005 \ DIC mit einem Ersatz.

MP3book2005 bearbeitet nur exc_rus.txt, abb_rus.txt muss in Notepad oder Word bearbeitet werden. Dies sind Firmenwörterbücher, die von ELAN Tempo Multimedia verwendet werden.

Es gibt auch ein Wörterbuch, das in das ToM Reader-Leseprogramm (Digalo Russian Nicolai.dic) eingebettet ist. Verwenden Sie solche Wörterbücher in keinem Fall, sie verschlechtern nur die Aussprache.

In ToM Reader sind die Motoreinstellungen ungefähr wie folgt:

Синтез речи и чтение электронных книг голосом

Um das Wörterbuch in MP3book2005 zu bearbeiten, klicken Sie auf die Schaltfläche Wörterbuch und laden Sie gegebenenfalls das Wörterbuch exc_rus.txt. Um dem Wörterbuch ein neues Wort hinzuzufügen, drücken Sie die Taste oben in der Aussprache, schreiben Sie das Wort in die untere Zeile. Wenn es im Text hervorgehoben ist, ist es bereits vorhanden. Klicken Sie auf die Schaltfläche Prüfen, setzen Sie den Cursor auf die richtige Belastungsstelle, drücken Sie (<), und wenn die Aussprache geeignet ist Klicken Sie auf Hinzufügen. Dann die Schaltfläche oben Speichern, um das Wörterbuch zu überschreiben. Abkürzungen wie Sternchen werden in Firmenwörterbüchern nicht verwendet, jedes Wort wird separat geschrieben. Dies ist nicht bequem, aber die Aussprache ist besser.

Sie können ToM Reader und MP3book2005 gleichzeitig geöffnet lassen. Sie lesen in ToM Reader, bearbeiten in MP3book2005 und nach dem Ändern des Wörterbuchs muss ToM Reader neu gestartet werden. Es kann nur MP3book2005 verwendet werden. Es sollte beachtet werden, dass ToM Reader kostenlos ist und kein registriertes MP3book2005 geringfügige Einschränkungen aufweist.

Nachteile:

Acapela ELAN Tempo Multimedia liest manchmal Wörter in Großbuchstaben und Rechtschreibung.

Digalo Nikolay ist eine alte Version.

Sie können Digalo TTS 2000 (DigaloCoreRus.exe-7.44 MB, SAPI 4) und ToM Reader Russian verwenden. Digalo TTS 2000 ist eine Sprach-Engine, die mehrere Sprachen unterstützt, einschließlich Russisch. Es wird bezahlt, aber Sie können Riss finden. ToM Reader Russian ist ein Programm, das mit dem Digalo TTS 2000 Bücher liest.

Digalo TTS 2000 hat die russische Stimme Nicolai, es ist besser als Stimmen anderer Unternehmen, aber nicht perfekt, deshalb braucht es ein Wörterbuch. Es gibt zwei Möglichkeiten: Verwenden Sie das in ToM Reader eingebettete Wörterbuch und das Wörterbuch in Digalo. Das erste ist einfacher, weil es Sternchen (*) verwendet, die einen Teil des Wortes ersetzen, aber von geringerer Qualität sind, das zweite ist komplexer, aber auch von höherer Qualität.

Nehmen Sie im ersten Fall das Digalo Russian Nicolai.dic-Wörterbuch und kopieren Sie es in den Diktatordner in ToM Reader, der beim Öffnen von ToM Reader und in den festgelegten Einstellungen angezeigt wird: Verwenden Sie das Wörterbuch. Im zweiten Fall ist der Prozess etwas länger. Der Vorteil ist jedoch, dass Sie eine bessere Aussprache erhalten und andere Programme wie PROMT, die kein Wörterbuch verbinden können, die richtige Aussprache haben, weil Digalo wird sein Vokabular verwenden.

Nehmen Sie also DigaloEditor 1.0 und entpacken Sie es in c: \ Programme \ Digalo \ Digalo 2000 Russian \ russian \ data. Es erscheinen: DigaloEditor.exe - ein Programm zum Bearbeiten des Wörterbuchs, abb_rus.txt und exc_rus.txt - Wörterbücher. abb_rus.txt für Abkürzungen, exc_rus.txt für andere Wörter. DigaloEditor.exe bearbeitet nur exc_rus.txt, abb_rus.txt muss in Notepad oder Word bearbeitet werden.

Nun zu den Funktionen der Bearbeitung in DigaloEditor.

Wenn Sie ein Wort hinzufügen oder suchen möchten, klicken Sie auf die Schaltfläche Hinzufügen und beginnen Sie mit der Eingabe. Eine Suche wird automatisch durchgeführt. Wenn eine solche Kombination vorhanden ist, wird sie rot hervorgehoben. Und das Wichtigste. Wenn Sie ein Wort eingeben, wird es bereits im Wörterbuch aufgezeichnet. Wenn Sie es beim Speichern des Ergebnisses beenden, befindet es sich im Wörterbuch. Gibt es in der Unabhängigkeit ein solches Wort im Wörterbuch oder nicht? Wenn Sie das richtige Wort geschrieben haben, klicken Sie auf die Schaltfläche Speichern. Wenn es nicht korrekt ist oder ein solches Wort bereits vorhanden ist, löschen Sie die eingegebene Zeile mit der Schaltfläche Löschen. Und so speichern-löschen nach jedem Satz. Der Akzent wird mit einem "<" ohne Anführungszeichen gesetzt, auf der einen und der anderen Seite sollte die gleiche Anzahl von Leerzeichen vorhanden sein. Zum Beispiel: "Fischforellenfisch foret <l". Zeile: "Fischforelle Fischforet <l" verursacht einen Fehler in Digalo. Wörter mit variabler Betonung müssen je nach Bedeutung in einer Phrase geschrieben werden. Vorhängeschloss = Vorhängeschloss <k.

Das Ergebnis ist nach dem Neustart des Leseprogramms zu hören.

Download-Links:

Alyona_Russian_ID2220.rar Alyona_Russian_ID2220.rar Alyona_Russian_ID2220.rar Virusfrei von KAV
Acapela-Elan-TTS-Nicolai.rar Acapela-Elan-TTS-Nicolai.rar Acapela-Elan-TTS-Nicolai.rar Virusfrei von KAV
Acapela_Infovox_Desktop_2.220_EngineSP3.rar Acapela_Infovox_Desktop_2.220_EngineSP3.rar Acapela_Infovox_Desktop_2.220_EngineSP3.rar Virusfrei von KAV
English_ID2220.rar English_ID2220.rar English_ID2220.rar Virusfrei von KAV
AlyonaSlovari.rar AlyonaSlovari.rar AlyonaSlovari.rar Virusfrei von KAV
sintez_bib.rar sintez_bib.rar sintez_bib.rar Virusfrei von KAV


espeech_v.2.3 Russisch zum Lesen - ELAN Tempo Multimedia Voice Engine, die ihre Entwicklung von Digalo fortsetzt. Die Qualität ist gut, die männliche Stimme ist Nicolai. Und natürlich ist die Hauptkomponente das bearbeitbare Wörterbuch, mit dem die Aussprache heute nahezu perfekt gemacht werden kann. Wir sehen alle Programme, einschließlich PROMT.

espeech_v.2.3 Russisches Programm zum Lesen - http://native-speech.invitation.ru/description200.html - Die vollständigste Beschreibung des Programms. Unterstützte Formate: txt, doc, rtf, htm.

Installationsanleitung:

  1. MSagent.exe und ms_speech_api.exe (Archiv-1,09 MB) (Link unten) - MSagent.exe (400 KB) - Agent für die Arbeit mit Spracherkennungs- und Synthese-Engines, ms_speech_api.exe (830 KB) - für die Arbeit erforderliche Bibliotheken Spracherkennungs- und Syntheseprogramme.
  2. Acapela ELAN Tempo Multimedia V5.1.0.0 (10,7 MB) (Link unten) - Russische Sprachsynthese-Engine für den Agenten.
  3. espeech_v.2.3 (2.08 MB) (Link unten) - für mich der beste russischsprachige Leser im Internet, es wird mir gefallen !!!
  4. Laden Sie das Stress-Wörterbuch für ELAN Tempo Multimedia Nikolai herunter. (Link unten)
  5. Kopieren Sie das Hauptwörterbuch exc_rus.txt und abb_rus.txt - für Abkürzungen - in das Paket C: Program FilesElan. Dies sind Firmenwörterbücher
  6. Die Motoreinstellungen sind ungefähr gleich. Gehen Sie zum Bedienfeld -> Sprache -> Sprachauswahl -> versuchen Sie es!

Alte Download-Links:


Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ] [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ] [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ]]
digalo.mp3 [ digalo.mp3 ] [ ] [ digalo.mp3 ]]
setup_espeech_v.2.3.exe [ setup_espeech_v.2.3.exe ] [ setup_espeech_v.2.3.exe ] [ setup_espeech_v.2.3.exe ]]
sintez.rar [ sintez.rar ] [ sintez.rar ] [ sintez.rar ]]
slovarNicolai.rar [ slovarNicolai.rar ] [ ] [ slovarNicolai.rar ]]



Russisches Sprachsyntheseprogramm Talker 2.0.6 und Digalo und SpeechCube Voice Engines

Программа синтеза русской речи Говорилка 2.0.6 и голосовые движки Digalo и SpeechCube
  • Entwicklerseite
  • Erscheinungsjahr: 2006
  • Version: 2.0.6.0
  • Entwickler: Ryazanov Anton
  • Plattform: Windows 9x / nt / 2000 / xp
  • Systemanforderungen: Mindestens P200 + Soundkarte
  • Sprache der Benutzeroberfläche: Englisch + Russisch
  • Tabletka: Nicht erforderlich

Govorilka ist ein kleines Sprachleseprogramm . Sie kann jeden Text, den Sie ihr geben, in jeder Sprache und mit jeder etablierten Stimme vorlesen. Zeichnet Text in eine MP3-Datei auf.

Hauptmerkmale des Govorilka-Programms.

  • Text per Stimme lesen.
  • Schreiben von lesbarem Text in eine Audiodatei (* .WAV, * .MP3) mit erhöhter Geschwindigkeit * und mit einer Aufteilung in Teile einer bestimmten Größe.
  • Passen Sie die Lesegeschwindigkeit und die Tonhöhe an.
  • Scrollt automatisch den Text auf dem Bildschirm, sodass das lesbare Fragment immer sichtbar ist (Sprachverfolgung). In diesem Fall kann der gelesene Text farblich hervorgehoben werden.
  • Nachfüllbare Aussprachewörterbücher, mit denen sich die Aussprache einzelner Wörter und Phrasen leicht anpassen lässt.
  • Öffnet große Dateien in DOS- und Windows-Codierung.
  • Öffnet Texte aus Microsoft® Word- und HTML-Dateien.
  • Lesbare Textgröße bis zu 2 Gigabyte.
  • Die Text- und Cursorposition beim Beenden des Programms wird gespeichert.

Bitte beachten Sie, dass die aktuelle Version des Programms ein Test (Beta) ist - es können geringfügige Fehler auftreten.

Was ist nützlich Govorilka: Govorilka schützt Ihr Sehvermögen. Damit können die Texte elektronischer Bücher angehört und nicht vom Bildschirm gelesen werden. Sie können herausfinden, wie Wörter und Phrasen in einer Fremdsprache klingen. Sie können Bücher schnell in MP3-Dateien brennen und auf Ihrem MP3-Player anhören. Mit dem Talker können Sie die Funktionen der Computer-Sprachsynthese bewerten und Ihrem Computer das Sprechen beibringen.

Beschreibung: Ein Sprecher wird für jemanden benötigt, der lieber Texte hört als sie vom Bildschirm liest oder sich um sein Sehvermögen kümmert und elektronische Buchtexte lesen möchte, während er nicht auf dem Monitor sitzt. Er möchte wissen, wie Wörter und Sätze in einer Fremdsprache klingen. Jeder, der seinem Computer das Sprechen beibringen möchte und nur neugierig ist, herauszufinden, wie das alles funktioniert, braucht einen Sprecher.

Zusätzliche Funktionen: Änderung der Lesegeschwindigkeit und Tonhöhe; Öffnen großer Dateien in DOS- und Windows-Codierung sowie Lesen von Text aus MS Word-Dateien; Sprache in eine Audiodatei (WAV oder MP3) aufnehmen; automatisches Scrollen von Text auf dem Bildschirm, sodass das lesbare Fragment immer sichtbar ist; Lesen von Text in der Zwischenablage, die Möglichkeit, die Aussprache (Wörterbuch) zu ändern.

Hinzufügen. Information: Die Benutzeroberfläche von Govorilka ist mehrsprachig. In Windows 2000 / XP funktioniert das Programm sofort, aber Benutzer von Windows 95/98 / NT müssen möglicherweise einige fehlende Dateien herunterladen - Text-to-Speech-Engine und SAPI (Details finden Sie auf der Homepage). .

Talker 2.0.6 und Digalo und SpeechCube Voice Engines Govorilka206_Digalo_SpeechCube__torrents.ru_.rar Govorilka206_Digalo_SpeechCube__torrents.ru_.rar Virusfrei von KAV
Talker 2.2.2 (die offizielle endgültige Version vom 9. Dezember 2009) Govorilka222.zip Govorilka222.zip Virusfrei von KAV

Sprachsynthesesysteme

Reader - ein Programm zum bequemen Lesen von Texten und E-Books von einem Computerbildschirm aus. Darüber hinaus können viele Leser Texte mit speziellen Sprachsyntheseprogrammen aussprechen.

Ein guter Leser hat viele Funktionen, die das Lesen vom Bildschirm weniger anstrengend machen. Das Layout in Form eines Buches, das reibungslose Scrollen von Text und das Glätten von Text sind nur einige der Werkzeuge, die in Lesern verwendet werden.

  • ** ICE Book Reader ** - ein leistungsstarkes, kostenloses Programm zum Lesen von Texten per Sprache (Reader).
  • ** Cool Reader ** - ein Programm zum bequemen Lesen von Büchern vom Bildschirm, Formatieren und Konvertieren.
  • ** UkrVox ** - Ukrainische Sprache für die Sprach-API und ein einfaches Programm zum Konvertieren von Texten in Sprache.
  • ** Rozmovlyalka ** - ein kostenloser Synthesizer zum Überspielen von ukrainischsprachigen Texten.
  • ** TOM Reader Russian ** - ein Programm zum bequemen Lesen elektronischer Texte und Bücher auf Ihrem Computer.
  • ** Balabolka ** ist ein kostenloses Programm zum Lesen von Textdateien mit menschlicher Stimme.
  • ** Govorilka ** ist ein kleines kostenloses Programm zum Lesen von Texten mit Sprachsynthese-Engines.

Damit Programme der Kategorie „Readers“ Texte mit einer „menschlichen Stimme“ lesen können, müssen die SAPI- Bibliothek (Speech Application Programming Interface oder Speech API) und Voice Engines im System installiert sein.

Sprach-API

Bisher sind zwei Versionen der Sprach-API üblich: SAPI4 und SAPI5. Beide Bibliotheken sind nicht kompatibel, stören sich jedoch nicht gegenseitig und können auf demselben Computer arbeiten. Daher wird empfohlen, beide Bibliotheken für Programme zu installieren, die beide Bibliotheken unterstützen (dies ermöglicht Ihnen mehr Voice Engines).

Betriebssysteme Windows XP, Vista und 7 verfügen normalerweise bereits über die installierten SAPI5-Bibliotheken, sodass Sie nur SAPI4 installieren müssen (aber nicht unbedingt). Es kann jedoch vorkommen, dass Sie SAPI5 installieren müssen. Sie können die Installationsfunktionen jeder dieser Bibliotheken auf ihren Seiten herunterladen und sich mit ihnen vertraut machen: Laden Sie SAPI herunter .

Voice Engines

Für die Sprachsynthese muss der Computer außerdem Sprachmodule für die gewünschte Sprache installiert haben. Es wurde bereits oben darauf hingewiesen, dass die SAPI4- und SAPI5-Bibliotheken nicht kompatibel sind. Daher kann jede der Voice Engines nur mit einer dieser Bibliotheken arbeiten. Wenn beide Sprach-API-Bibliotheken auf Ihrem Computer installiert sind, können Sie alle Sprachmodule installieren: Laden Sie Sprachmodule für SAPI herunter .

Bildschirmzugriffsprogramme

Das VIRGO 4- Bildschirmzugriffsprogramm ist das Ergebnis der langjährigen Arbeit von BAUM bei der Entwicklung des VIRGO-Programms, dessen Hauptzweck darin besteht, den komfortablen Betrieb blinder und sehbehinderter Benutzer mit Windows zu gewährleisten. Mit VIRGO 4 kann der Benutzer auswählen, welche Informationen auf der Braillezeile angezeigt und welche mit der Stimme ausgesprochen werden sollen. Sehbehinderte Benutzer können auch das in VIRGO 4 integrierte Galileo-Bildschirmvergrößerungssystem verwenden. Der integrierte Ansatz von VIRGO 4 unter Verwendung von Braille und Sprache kombiniert die Leistungsfähigkeit beider Methoden der Informationsausgabe flexibel, um dem Benutzer den Komfort zu erleichtern.

MyStick ist der erste mobile Bildschirmzugriff, der ohne Installation auf allen modernen Windows-Computern funktioniert. MyStick wird an einen freien USB-Anschluss des Computers angeschlossen und startet automatisch. Der Benutzer kann sofort mit dem Computer arbeiten. Nach dem Entfernen von MyStick verbleiben keine Dateien auf dem Computer und keine Konfigurationsänderungen. MyStick ist ein U3-Flash-Laufwerk. Mit MyStick sind blinde und sehbehinderte PC-Benutzer nicht an einen bestimmten, speziell ausgestatteten Computer gebunden und können auf jeden Computer mit Windows zugreifen. Für MyStick gibt es zwei Optionen: mit Sprachausgabe und Bildschirmvergrößerung und nur mit Sprachausgabe. MyStick-Versionen sind für Russisch, Englisch, Deutsch, Französisch, Schwedisch, Norwegisch und Dänisch verfügbar.

Das Bildschirmzugriffsprogramm Cobra 9.1 vereinfacht die Arbeit mit Windows 7, Vista oder Windows XP für blinde und sehbehinderte Computerbenutzer. COBRA kombiniert alle Standardfunktionen eines modernen, benutzerfreundlichen Bildschirmzugriffsprogramms. COBRA erfasst Benutzeranforderungen und zeigt wichtige Informationen von einem Computermonitor mithilfe von Sprache, Braille oder Bildschirmvergrößerung an.

Die Geschichte

Die Sprachsynthese hat eine lange Geschichte, die mit Legenden bewachsen ist. Bereits im zehnten Jahrhundert wurde Herbert Avrilaksky die Kunst zugeschrieben, ein Teraphim herzustellen - einen sprechenden toten Kopf. Dieser aus Bronze gefertigte Kopf mit den Worten „Ja“ und „Nein“ beantwortete die Fragen aller, die ihn angesprochen hatten. Mitte des 13. Jahrhunderts versuchten auch der Dominikanermönch Albert von Bolstedt und der englische Philosoph und Naturforscher Roger Bacon, die ersten Beispiele für „sprechende Köpfe“ zu schaffen.

Ende des 18. Jahrhunderts schuf der dänische Wissenschaftler Christian Krattsenshtein, Vollmitglied der Russischen Akademie der Wissenschaften, ein Modell des menschlichen Stimmwegs, das fünf lange Vokale (a, e, u, o, y) aussprechen kann. Das Modell war ein System von akustischen Resonatoren verschiedener Formen, die Vokale aus vibrierenden Stimmzungen herstellten, die von einem Luftstrom angeregt wurden. 1778 ergänzte der österreichische Wissenschaftler Wolfgang von Kampelen das Kratzenstein-Modell durch Modelle der Zunge und der Lippen und führte eine akustisch-mechanische Sprechmaschine ein, mit der bestimmte Geräusche und ihre Kombinationen reproduziert werden können. Das Zischen und Pfeifen wurde mit Hilfe eines speziellen manuellen Pelzes ausgeblasen. 1837 führte der Wissenschaftler Charles Wheatstone eine verbesserte Version der Maschine ein, die Vokale und die meisten Konsonanten reproduzieren konnte. Und 1846 demonstrierte Joseph Faber sein sprechendes Organ Euphonia, in dem versucht wurde, nicht nur Sprache, sondern auch Gesang zu synthetisieren.

Ende des 19. Jahrhunderts schuf der berühmte Wissenschaftler Alexander Bell sein eigenes "sprechendes" mechanisches Modell, das im Design der Wheatstone-Maschine sehr ähnlich ist. Mit dem Aufkommen des 20. Jahrhunderts begann die Ära der elektrischen Maschinen, und Wissenschaftler konnten Schallwellengeneratoren verwenden und auf ihrer Grundlage algorithmische Modelle erstellen.

In den 1930er Jahren entwickelte Homer Dudley, Mitarbeiter von Bellr Labs, an dem Problem, Wege zu finden, um die Bandbreite zu reduzieren, die in der Telefonie zur Erhöhung der Übertragungskapazität benötigt wird, und entwickelte VOCODER (kurz für English Voice - Voice, English Coder - Encoder ) - Tastaturgesteuerter elektronischer Analysator und Sprachsynthesizer. Dudleys Idee war es, das Sprachsignal zu analysieren, es in Teile zu zerlegen und zu einem weniger anspruchsvollen Leitungsdurchsatz neu zu synthetisieren. Eine verbesserte Version von Dudleys Vocoder VODER wurde 1939 auf der New Yorker Weltausstellung vorgestellt.

Die ersten Sprachsynthesizer klangen ziemlich unnatürlich, und oft war es kaum möglich, die von ihnen produzierten Phrasen zu erkennen. Die Qualität der synthetisierten Sprache wurde jedoch ständig verbessert, und die von modernen Sprachsynthesesystemen erzeugte Sprache kann manchmal nicht von der realen menschlichen Sprache unterschieden werden. Trotz des Erfolgs elektronischer Sprachsynthesizer wird derzeit noch auf dem Gebiet der Herstellung mechanischer Sprachsynthesizer geforscht, beispielsweise für den Einsatz in humanoiden Robotern.

Die ersten computergestützten Sprachsynthesesysteme wurden Ende der 1950er Jahre eingeführt, und der erste Text-zu-Sprache-Synthesizer wurde 1968 entwickelt.