This page has been robot translated, sorry for typos if any. Original content here.

Sprachsynthese und Voice Reading E-Books

Синтез речи и чтение электронных книг голосом

Automatische Sprachsynthese - der Prozess der Erzeugung eines Sprachsignals - eine Technologie, die es ermöglicht, den Text (Dokument, Brief, SMS) mit einer Stimme zu lesen, die der natürlichen nahe kommt. Damit die synthetisierte Sprache natürlich klingt, ist es erforderlich, eine ganze Reihe von Aufgaben zu lösen, die sowohl mit der Sicherstellung der Natürlichkeit der Stimme auf Timbre-, Klang- und Intonationsniveau als auch mit der korrekten Platzierung von Akzenten, Dekodierungsabkürzungen, Zahlen, Abkürzungen und Sonderzeichen zusammenhängen.

Die Synthesetechnologie kann sowohl in einem engen Themenbereich als auch in einem weiten oder unbegrenzten Bereich beansprucht werden. Für eine enge Region kann die Klangqualität aufgrund der Zusammenstellung von aufgezeichneten langen Sprachfragmenten, die zu dieser Region gehören, auf das Natürlichste reduziert werden. Ein Beispiel für eine solche Synthese (Makrosynthese genannt) kann als Warnsystem für Zugbewegungen dienen, die an den Bahnhöfen von Großstädten in Russland eingesetzt werden. Es ist viel schwieriger, einen Sprachsynthesizer für unbegrenzten Text in einem beliebigen Themenbereich zu erstellen. In diesem Fall kann der Benutzer das Synthesesystem so einstellen, dass eine beliebige Phrase oder ein beliebiger Satz ausgesprochen wird.

Sprachsynthesemethoden

Heute gibt es drei Hauptrichtungen der Synthese: den Diphonansatz (das Diphon ist der Schall von der Mitte eines Phonems bis zur Mitte des benachbarten Phonems), den Allophonansatz (Realisierung des Phonems im Kontext von links und rechts) und die Unit Selection-Technologie (Auswahl der Klangelemente aus der Sprachbasis). Aber jeder von ihnen hat seine Nachteile:

  • Mit der Diphon-Methode können Sie ein Sprachsignal erzeugen , das zwar lesbar, aber in der Klangfarbe unnatürlich ist. In der Klangfarbe der synthetisierten Sprache wird die Klangfarbe des Gebersprechers nicht erkannt.
  • Allophon-Ansatz - Die Natürlichkeit der Stimme ist aufgrund einer größeren Anzahl von Klangelementen etwas höher als beim Diphon-Ansatz. Wie bei der diphonischen Synthese ist die Stimme jedoch ziemlich roboterhaft und es ist schwierig, die Stimme des Gebersprechers darin zu erkennen.
  • Geräteauswahl - Die Natürlichkeit des Stimmklangs ist hoch und in der synthetisierten Stimme bleibt die Klangfarbe der Stimme des Spenders erhalten. Aufgrund der begrenzten Größe der Vokalbasis werden einige Texte (Wörter und deren Kombinationen) jedoch mit merklichen Verzerrungen bis hin zum vollständigen Verlust einzelner Klänge ausgesprochen.

Entwickler-Website: www.elantts.com .

Voice Engines

Derzeit eignen sich Voice Engines am besten für die Sprachsynthese:

  • Acapela ALYONA Multimedia (Acapela Multimedia Alyona)
  • Acapela ELAN NIKOLAI Tempo Multimedia (ELAN Tempo Multimedia von Acapela) V5.1.0.0 Englisch (255 Kanäle)
  • Andere russische Stimmen

Hinzufügen. Information: Text-to-Speech (TTS) -Engine oder Sprachsynthese -Engine - Programme ähnlich den Treibern, mit denen Text in eine Schallwelle umgewandelt und synthetisiert werden kann. Die Sprachsynthese-Engines verfügen nicht über integrierte Steuerelemente und es reicht nicht aus, dass ein TTS Ihren Computer sprechen lässt. Um TTS verwenden zu können, benötigen Sie ein Syntheseprogramm (TextAloud, Cool Reader, Balabolka usw.), das die Benutzeroberfläche ersetzt und es Ihnen ermöglicht, mit TTS zu arbeiten, Einstellungen, Sound und Sprache zu ändern und andere Funktionen zu steuern.

Синтез речи и чтение электронных книг голосом

Die Firma Acapela, die Entwickler des beliebten russischsprachigen Sprachmoduls Nikolay, veröffentlichte eine neue russische, weibliche Sprachmaschine mit dem Namen Alyona, die auf SAPI-5 bei 22 KHz arbeitet. Laut der Qualität der synthetisierten Sprache ist Alyona Nicholas weit voraus. an der Katerina-Engine von ScanSoft RealSpeak.

Zusammen mit der Engine kommt Lexicon Manager - ein Wörterbuch-Editor, mit dem Sie die Aussprache von Wörtern sowohl wörtlich als auch phonetisch ändern können.

Zum Beispiel mit KooBAudio, mp3book2005 und dieser Voice Engine - eine 4-stündige Romanze kann in 10 Minuten geäußert und auf mp3 übertragen werden

Acapela Alyona - funktioniert gut mit Programmen wie: KooBAudio 0.7.0.7, mp3book2005, Balabolka, Cool Reader ...

Gute Sprachsteuerung! Im Allgemeinen liest er wirklich klarer als alle anderen Russischsprachigen, einschließlich Nikolai. Letzterer hat jedoch eine angenehmere Stimme aufgrund des tiefen Timbres seiner Stimme und macht weniger Fehler bei den Akzenten.

Acapela Alyona HQ TTS (Russisch) v.2.2.20 + Wörterbuch + Anleitung [Teil 1] Alena.part1.rar Alena.part1.rar Virusfrei von KAV
Acapela Alyona HQ TTS (Russisch) v.2.2.20 + Wörterbuch + Anleitung [Teil 2] Alena.part2.rar Alena.part2.rar Virusfrei von KAV

Buchleser

Balabolka 2.5.0.525

Синтез речи и чтение электронных книг голосом

Herunterladen Balabolka 2.5.0.525 (7 Mb) Balabolka.rar Balabolka.rar Virusfrei von KAV

Kostenlos und am erfolgreichsten, mit allen notwendigen Funktionen, die Fähigkeit, in MP3 aufzunehmen.

ToM Reader 2.73

Синтез речи и чтение электронных книг голосом

ToM Reader 2.73 herunterladen (1 Mb) ToM_Reader2.73rus.rar ToM_Reader2.73rus.rar Virusfrei von KAV

Kostenloses, vertrautes Buch, visuelle Lesezeichen, die Möglichkeit, in MP3 aufzunehmen.

ToM Reader Russisches Programm zum Lesen. Der Hauptvorteil besteht darin, dass es die Aussprache der Voice Engine nicht beeinträchtigt und nach Sätzen und nicht nach Absätzen wie in vielen Programmen gelesen wird, so dass es einfach ist, das Lesen zu verfolgen. Es sieht aus wie ein Buch in einem Einband, was auch praktisch ist. Unterstützte Formate: txt, doc, rtf, htm.

MP3book2005

Синтез речи и чтение электронных книг голосом

MP3book2005 herunterladen (7 Mb) MP3book2005_441.zip MP3book2005_441.zip Virusfrei von KAV

Mit allen notwendigen Funktionen zum Bearbeiten des Wörterbuchs, Schreiben in MP3 und Lesen.

MP3book2005 ist ein Programm zum Bearbeiten eines Wörterbuchs, Lesen und Schreiben von MP3-Dateien. Das Bearbeiten des Wörterbuchs ist in Ordnung, aber ich möchte, dass die Ansicht ein Buch ist. Unterstützte Formate: txt, rtf, htm, fb2.

Vorbereiten der Installation

1. Sprachsynthese-Engine herunterladen:

2. Laden Sie Infovox Desktop 2.220 Engine SP3 ( Acapela_Infovox_Desktop_2.220_EngineSP3.rar ) (24.08 Mb) herunter - Verwaltungs- und Aktivierungsprogramm, mit einem nativen, einfachen Lesegerät und vor allem mit der Wörterbuchbearbeitungssoftware von Alyonny Dictionary - Lexicon Manager.

3. Laden Sie US-Englisch 2.220 ( English_ID2220.rar ) (233.13 Mb) - Englisches Sprachsynthesemodul herunter.

4. Laden Sie den Reader herunter, ein Programm zum Lesen von Büchern ( Links oben ).

5. Herunterladen AlyonaSlovari-Alyona22k ( AlyonaSlovari.rar ) (1.2 Mb) - Wörterbücher für Alain in 24.345 Wörtern.

7. MSagent.exe und ms_speech_api.exe ( sintez_bib.rar ) herunterladen (archive-1.09 MB) - MSagent.exe (400 KB) - Agent für die Arbeit mit Spracherkennungs- und Synthese-Engines, ms_speech_api.exe (830 KB) - Bibliotheken, die für den Betrieb von Spracherkennungs- und Syntheseprogrammen erforderlich sind (für Windows 7 nicht erforderlich).

Unterstützt Betriebssysteme: Windows XP, Windows Vista, Windows 7, 8.

Alle unten auf der Seite aufgelisteten Links!

Installieren und ausführen

  • 1) Installieren Sie die Hauptsteuerung Infovox Desktop 2.220 Engine
  • 2) Installieren Sie oben die Voice Engine Alyona English 2.220
  • 3) Starten Sie den Lizenzmanager und kopieren Sie den Lizenzcode mit der Schaltfläche "In Zwischenablage kopieren"
  • 4) Starten Sie key.exe, fügen Sie den Code dort ein und klicken Sie auf "Make Key", um die Lizenzdatei zu generieren.
  • 5) Importieren Sie die resultierende Datei in den Lizenzmanager, indem Sie auf "Lizenzdatei importieren" klicken.
  • 6) Wörterbücher mit dem Lexikon-Manager hinzufügen (Lexikon-Sprachzuordnungen - Lexikon hinzufügen ... oder Datei - Lexikon importieren)

Zusätzliche Bibliotheken werden für die Arbeit benötigt (in dieser Reihenfolge installieren!):

  • 1. MSagent.exe und ms_speech_api.exe sind Bibliotheken, die für den Betrieb von Spracherkennungs- und Syntheseprogrammen erforderlich sind. (für Win 7 nicht erforderlich)
  • 2. Acapela ELAN Tempo Multimedia V5.1.0.0 Nicolai ist eine Engine zur Synthese der russischen Sprache für einen Agenten.
  • 3. ToM Reader 2.73 oder MP3book2005 - Lese-Software, welche Sie mögen.
  • 4. Laden Sie das Stresswörterbuch für ELAN Tempo Multimedia Nikolai herunter .

Wir kopieren das Hauptwörterbuch exc_rus.txt und abb_rus.txt - für Abkürzungen in C: \ Programme \ Elan und exc_rus.txt auch in Programme \ MP3book2005 \ DIC, mit Ersetzung.

MP3book2005 bearbeitet nur exc_rus.txt, abb_rus.txt muss in Notepad oder Word bearbeitet werden. Hierbei handelt es sich um Markenwörterbücher, die von ELAN Tempo Multimedia verwendet werden.

Es gibt auch ein Wörterbuch, das in das Leseprogramm ToM Reader (Digalo Russian Nicolai.dic) integriert ist. Verwenden Sie auf keinen Fall solche Wörterbücher, sie verschlechtern nur die Aussprache.

In ToM Reader sind die Engine-Einstellungen wie folgt:

Синтез речи и чтение электронных книг голосом

Um das Wörterbuch im MP3book2005 zu bearbeiten, klicken Sie auf die Schaltfläche Wörterbuch und laden Sie bei Bedarf das Wörterbuch exc_rus.txt. Um dem Wörterbuch ein neues Wort hinzuzufügen, drücken Sie die Taste oben in der Aussprache. Schreiben Sie das Wort in die unterste Zeile. Wenn es im Text hervorgehoben ist, ist es bereits vorhanden. Klicken Sie auf die Schaltfläche Prüfen. Setzen Sie den Cursor auf die richtige Stelle der Betonung. Drücken Sie (<). Wenn die Aussprache passt Klicken Sie auf Hinzufügen. Dann die Schaltfläche oben Speichern, um das Wörterbuch zu überschreiben. Abkürzungen werden wie Sternchen nicht in Markenwörterbüchern verwendet, sondern jedes Wort wird separat geschrieben. Dies ist nicht bequem, aber die Aussprache ist besser.

Sie können ToM Reader und MP3book2005 gleichzeitig geöffnet lassen. Sie lesen in ToM Reader, bearbeiten es in MP3book2005, während ToM Reader nach dem Ändern des Wörterbuchs neu gestartet werden muss. Kann nur MP3book2005 verwenden. Es ist zu beachten, dass der ToM Reader kostenlos ist und das nicht registrierte MP3book2005 geringfügige Einschränkungen aufweist.

Nachteile:

Acapela ELAN Tempo Multimedia liest manchmal Wörter, die in GROSSBUCHSTABEN geschrieben sind.

Digalo Nikolai - die alte Version.

Sie können Digalo TTS 2000 (DigaloCoreRus.exe-7,44 MB, SAPI 4) und ToM Reader Russian verwenden. Digalo TTS 2000 ist ein Sprachmodul, das mehrere Sprachen unterstützt, darunter Russisch. Es ist bezahlt, aber Sie können Crack finden. ToM Reader Russian ist ein Programm, das das Digalo TTS 2000 zum Lesen von Büchern verwendet.

Digalo TTS 2000 hat Nicolais russische Stimme, es ist besser als Stimmen anderer Firmen, aber nicht perfekt, daher wird ein Wörterbuch dafür benötigt. Es gibt zwei Möglichkeiten: Verwenden Sie das im ToM Reader integrierte Wörterbuch und das Wörterbuch in Digalo. Der erste ist einfacher, weil er einen Teil des Wortes durch Sternchen (*) ersetzt, der zweite ist komplizierter, aber auch qualitativer.

Nehmen Sie im ersten Fall das Wörterbuch Digalo Russian Nicolai.dic und kopieren Sie es in den Ordner dict im ToM Reader, der angezeigt wird, wenn Sie den ToM Reader öffnen und in den Einstellungen festlegen: Verwenden Sie das Wörterbuch. Im zweiten Fall ist der Prozess etwas länger. Der Vorteil ist jedoch, dass Sie eine bessere Aussprache erhalten und andere Programme, wie z. B. PROMT, die kein Wörterbuch verbinden können, die richtige Aussprache haben, weil Digalo wird sein Wörterbuch verwenden.

Nehmen Sie also DigaloEditor 1.0 und entpacken Sie es in c: \ Programme \ Digalo \ Digalo 2000 Russian \ russian \ data. Es erscheinen: DigaloEditor.exe - Wörterbuchbearbeitungsprogramm, abb_rus.txt und exc_rus.txt - Wörterbücher. abb_rus.txt für Abkürzungen, exc_rus.txt für andere Wörter. DigaloEditor.exe bearbeitet nur exc_rus.txt, abb_rus.txt muss in Notepad oder Word bearbeitet werden.

Nun zu den Bearbeitungsfunktionen in DigaloEditor.

Wenn Sie ein Wort oder eine Suche hinzufügen möchten, klicken Sie auf die Schaltfläche Hinzufügen und beginnen Sie mit der Eingabe. Die Suche wird automatisch durchgeführt. Wenn eine solche Kombination vorhanden ist, wird sie rot hervorgehoben. Und vor allem. Wenn Sie ein Wort eingeben, ist es bereits im Wörterbuch gespeichert. Wenn Sie es beenden und das Ergebnis speichern, befindet es sich im Wörterbuch. In der Unabhängigkeit gibt es ein solches Wort im Wörterbuch oder nicht. Wenn Sie also das richtige Wort geschrieben haben, drücken Sie die Speichertaste. Ist dies nicht der Fall oder existiert bereits ein solches Wort, löschen Sie die eingegebene Zeile mit der Schaltfläche Löschen. Und so speichern-löschen Sie nach jedem Satz. Die Betonung erfolgt durch das Zeichen "<" ohne Anführungszeichen, Leerzeichen müssen auf der einen und der anderen Seite gleich sein. Zum Beispiel: „Forellenfisch Fischvordergrund“. Zeile: “fish forout fish <e” verursacht einen Fehler in Digalo. Wörter mit variabler Betonung, abhängig von der Bedeutung, müssen in einer Phrase geschrieben werden. Aufhängesperre = Aufhängesperre <k.

Das Ergebnis ist nach dem Neustart des Readers zu hören.

Download-Links:

Alyona_Russian_ID2220.rar Alyona_Russian_ID2220.rar Alyona_Russian_ID2220.rar Virusfrei von KAV
Acapela-Elan-TTS-Nicolai.rar Acapela-Elan-TTS-Nicolai.rar Acapela-Elan-TTS-Nicolai.rar Virusfrei von KAV
Acapela_Infovox_Desktop_2.220_EngineSP3.rar Acapela_Infovox_Desktop_2.220_EngineSP3.rar Acapela_Infovox_Desktop_2.220_EngineSP3.rar Virusfrei von KAV
English_ID2220.rar English_ID2220.rar English_ID2220.rar Virusfrei von KAV
AlyonaSlovari.rar AlyonaSlovari.rar AlyonaSlovari.rar Virusfrei von KAV
sintez_bib.rar sintez_bib.rar sintez_bib.rar Virusfrei von KAV


espeech_v.2.3 Russisch zum Lesen - ELAN Tempo Multimedia Voice Engine, die ihre Entwicklung von Digalo aus fortsetzt. Die Qualität ist gut, die Stimme eines Mannes ist Nicolai. Und natürlich ist die Hauptkomponente ein editierbares Wörterbuch, mit dem die Aussprache bis heute nahezu perfekt gemacht werden kann. Wir sehen alle Programme, einschließlich PROMT.

espeech_v.2.3 Russisches Programm zum Lesen - http://native-speech.invitation.ru/description200.html - Die vollständigste Beschreibung des Programms. Unterstützte Formate: txt, doc, rtf, htm.

Installationsanleitung:

  1. MSagent.exe und ms_speech_api.exe (Archiv-1.09 MB) (Link unten) - MSagent.exe (400 KB) - Agent für die Arbeit mit Spracherkennungs- und Synthese-Engines, ms_speech_api.exe (830 KB) - für die Arbeit erforderliche Bibliotheken Spracherkennungs- und Syntheseprogramme.
  2. Acapela ELAN Tempo Multimedia V5.1.0.0 (10,7 MB) (Link unten) ist ein Agent für die Synthese der russischen Sprache für einen Agenten.
  3. espeech_v.2.3 (2.08 MB) (Link unten) - für mich das beste russischsprachige Programm im Internet zum Lesen, viel Spaß !!!
  4. Laden Sie das Stresswörterbuch für ELAN Tempo Multimedia Nikolai herunter. (Link unten)
  5. Wir kopieren das Hauptwörterbuch "exc_rus.txt" und "abb_rus.txt" für Abkürzungen in das Paket "C: Program FilesElan". Hierbei handelt es sich um proprietäre Wörterbücher.
  6. Die Einstellungen des Motors sind ungefähr gleich: Gehen Sie zur Systemsteuerung -> Sprache -> Sprachauswahl -> probieren Sie es aus!

Alte Downloadlinks:


Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ] [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ] [ Acapela-Elan-TTS-SpeechCube-5_1_.1-RUS-Nicolai_MmE255.rar ]
digalo.mp3 [ digalo.mp3 ] [ ] [ digalo.mp3 ]
setup_espeech_v.2.3.exe [ setup_espeech_v.2.3.exe ] [ setup_espeech_v.2.3.exe ] [ setup_espeech_v.2.3.exe ]
sintez.rar [ sintez.rar ] [ sintez.rar ] [ sintez.rar ]
slovarNicolai.rar [ slovarNicolai.rar ] [ ] [ slovarNicolai.rar ]



Russisches Sprachsyntheseprogramm Speaking Language 2.0.6 und Digalo und SpeechCube Voice Engines

Программа синтеза русской речи Говорилка 2.0.6 и голосовые движки Digalo и SpeechCube
  • Entwicklerseite
  • Erscheinungsjahr: 2006
  • Version: 2.0.6.0
  • Entwickler: Anton Ryazanov
  • Plattform: Windows 9x / nt / 2000 / xp
  • Systemanforderungen: mindestens P200 + Soundkarte
  • Oberflächensprache: Englisch + Russisch
  • Tabletka: Nicht erforderlich

Govorilka ist ein kleines Programm zum Lesen von Texten mit der Stimme. Sie kann jeden Text, den Sie ihr geben, in jeder Sprache und mit jeder etablierten Stimme vorlesen. Text in MP3-Datei aufnehmen.

Die wichtigsten Funktionen des Programms Govorilka.

  • Text in der Stimme lesen.
  • Zeichnen Sie lesbaren Text in einer Audiodatei (* .WAV, * .MP3) mit erhöhter Geschwindigkeit * auf und unterteilen Sie ihn in Teile einer bestimmten Größe.
  • Stellen Sie die Lesegeschwindigkeit und die Tonhöhe ein.
  • Führt einen automatischen Bildlauf auf dem Bildschirm durch, sodass das lesbare Fragment immer sichtbar ist (Sprachverfolgung). In diesem Fall kann der lesbare Text farblich hervorgehoben werden.
  • Das aktualisierte Aussprachewörterbuch, mit dem Sie die Aussprache einzelner Wörter und Phrasen leicht anpassen können.
  • Öffnet große Dateien in DOS- und Windows-Codierung.
  • Öffnet Texte aus Microsoft® Word- und HTML-Dateien.
  • Lesbare Textgröße bis zu 2 Gigabyte.
  • Gespeicherte Text- und Cursorposition beim Verlassen des Programms.

Bitte beachten Sie, dass es sich bei der aktuellen Version des Programms um einen Test (Beta) handelt - es können geringfügige Fehler auftreten.

Was ist nützlich Govorilka: Govorilka rettet Ihr Augenlicht. Mit ihm können Sie die Texte elektronischer Bücher anhören und nicht vom Monitorbildschirm aus lesen. Sie können lernen, wie Wörter und Phrasen in einer Fremdsprache klingen. Sie können Bücher schnell in MP3-Dateien brennen und sie auf Ihrem MP3-Player anhören. Mit Hilfe des Sprechers können Sie die Möglichkeiten der Computersprachsynthese bewerten und Ihrem Computer das Sprechen beibringen.

Beschreibung: Ein Sprecher ist notwendig für jemanden, der lieber Texte hört, als sie auf dem Bildschirm zu lesen, oder das Augenlicht rettet und Texte von E-Books lesen möchte, die nicht auf dem Bildschirm sitzen und herausfinden möchten, wie Wörter und Phrasen in einer Fremdsprache klingen. Jeder, der seinem Computer das Sprechen beibringen möchte und der einfach nur neugierig ist, herauszufinden, wie das alles funktioniert, braucht einen Sprecher.

Zusätzliche Funktionen: Änderung der Lesegeschwindigkeit und der Stimmlage; Öffnen großer Dateien in DOS- und Windows-Codierung sowie Lesen von Text aus MS Word-Dateien; Sprachaufzeichnung in eine Audiodatei (WAV oder MP3); automatisches Scrollen von Text auf dem Bildschirm, sodass das lesbare Fragment immer sichtbar ist; Lesen Sie den Text in der Zwischenablage, die Fähigkeit, die Aussprache (Wörterbuch) zu ändern.

Hinzufügen. Information: Die Benutzeroberfläche von Govorilka ist mehrsprachig, unter Windows 2000 / XP funktioniert das Programm sofort, aber Benutzer von Windows 95/98 / NT müssen möglicherweise einige fehlende Dateien herunterladen - Text-to-Speech-Engine und SAPI (Details - auf der Homepage) .

Speaker 2.0.6 und Digalo und SpeechCube Voice Engines Govorilka206_Digalo_SpeechCube__torrents.ru_.rar Govorilka206_Digalo_SpeechCube__torrents.ru_.rar Virusfrei von KAV
Talker 2.2.2 (offizielle Endversion vom 12.09.2009) Govorilka222.zip Govorilka222.zip Virusfrei von KAV

Sprachsynthesesysteme

Reader - ein Programm zum einfachen Lesen von Texten und E-Books von einem Computerbildschirm. Darüber hinaus können viele Leser mithilfe spezieller Sprachsyntheseprogramme Texte vortragen.

Ein guter Leser verfügt über viele Funktionen, die das Lesen auf dem Bildschirm weniger mühsam machen. Layout in Buchform, Smooth Text Scrolling, Text Smoothing sind nur einige der Werkzeuge, die im Reader zum Einsatz kommen.

  • ** ICE Book Reader ** - ein leistungsfähiges, kostenloses Programm zum Lesen von Texten mit Stimme (Reader).
  • ** Cool Reader ** - ein Programm zum bequemen Lesen von Büchern auf dem Bildschirm, Formatieren und Konvertieren.
  • ** UkrVox ** - Ukrainische Sprache für die Sprach-API und ein einfaches Programm zum Konvertieren von Texten in Sprache.
  • ** Rozmovlyalka ** - kostenloser Synthesizer zum Synchronisieren ukrainischer Texte.
  • ** TOM Reader Russian ** - Programm zum bequemen Lesen von elektronischen Texten und Büchern am Computer.
  • ** Balabolka ** ist ein kostenloses Programm zum Lesen von Textdateien mit menschlicher Stimme.
  • ** Govorilka ** ist ein kleines kostenloses Programm zum Lesen von Texten mit Sprachsynthesemaschinen.

Damit die in der Kategorie "Leser" enthaltenen Programme Texte mit einer "menschlichen Stimme" wiedergeben können, müssen die SAPI- Bibliothek (Speech Application Programming Interface oder Speech API) und Voice Engines im System installiert sein.

Sprach-API

Heute werden zwei Versionen der Sprach-API vertrieben: SAPI4 und SAPI5. Beide Bibliotheken sind inkompatibel, stören sich jedoch nicht und können auf demselben Computer ausgeführt werden. Für Programme, die beide Bibliotheken unterstützen, wird daher empfohlen, beide zu installieren (dies ermöglicht Ihnen, mehr Sprachmodule zu verwenden).

In den Betriebssystemen Windows XP, Vista und 7 sind die SAPI5-Bibliotheken normalerweise bereits installiert, sodass Sie SAPI4 nur (aber nicht unbedingt) installieren müssen. Es kann jedoch vorkommen, dass SAPI5 eingerichtet werden muss. Laden Sie die Installationsfunktionen jeder dieser Bibliotheken herunter und machen Sie sich auf den folgenden Seiten mit ihnen vertraut: Laden Sie SAPI herunter .

Voice Engines

Für die Sprachsynthese ist es außerdem erforderlich, Sprachmodule für die gewünschte Sprache auf dem Computer installiert zu haben. Es wurde bereits oben festgestellt, dass die SAPI4- und SAPI5-Bibliotheken nicht kompatibel sind. Daher kann jede Voice Engine nur mit einer dieser Bibliotheken arbeiten. Wenn beide Sprach-API-Bibliotheken auf Ihrem Computer installiert sind, können Sie alle Sprachmodule installieren: Laden Sie die Sprachmodule für SAPI herunter .

Bildschirmzugriffsprogramme

Das Bildschirmzugriffsprogramm VIRGO 4 ist das Ergebnis der langjährigen Arbeit von BAUM bei der Entwicklung des Programms VIRGO, dessen Hauptziel es ist, das komfortable Arbeiten blinder und sehbehinderter Benutzer mit Windows zu gewährleisten. Mit VIRGO 4 kann der Benutzer auswählen, welche Informationen auf der Braillezeile angezeigt und welche mit Stimme ausgesprochen werden sollen. Sehbehinderte Benutzer können auch das in VIRGO 4 integrierte Bildschirmvergrößerungssystem GALILEO verwenden. Der integrierte Ansatz VIRGO 4, der Braille und Sprache verwendet, kombiniert flexibel die Möglichkeiten beider Methoden zur Anzeige von Informationen, um dem Benutzer die Arbeit zu erleichtern.

MyStick ist der erste mobile Bildschirmzugriff, der ohne Installation auf allen modernen Windows-Computern funktioniert. Wird der MyStick an einen freien USB-Anschluss des Computers angeschlossen, startet er automatisch und der Benutzer kann sofort mit dem Computer arbeiten. Nach dem Entfernen von MyStick verbleiben keine Dateien auf dem Computer und es werden keine Konfigurationsänderungen vorgenommen. MyStick ist ein Flash-Laufwerk im U3-Format. Mit MyStick sind blinde und sehbehinderte PC-Benutzer nicht an einen bestimmten, speziell ausgestatteten Computer gebunden und können auf jeden Computer mit Windows zugreifen. Es gibt zwei MyStick-Optionen: mit Sprachausgabe und Bildschirmvergrößerung und nur mit Sprachausgabe. MyStick-Versionen sind für Russisch, Englisch, Deutsch, Französisch, Schwedisch, Norwegisch und Dänisch verfügbar.

Das Cobra 9.1- Bildschirmzugriffsprogramm vereinfacht die Arbeit mit Windows 7, Vista oder Windows XP für blinde und sehbehinderte Computerbenutzer. COBRA kombiniert alle Standardfunktionen eines modernen benutzerfreundlichen Bildschirmzugriffsprogramms. COBRA erfasst Benutzeranforderungen und zeigt wichtige Informationen von einem Computermonitor mithilfe von Sprache, Blindenschrift oder Bildschirmvergrößerung an.

Geschichte

Die Sprachsynthese hat eine lange Geschichte, die von Legenden überwuchert ist. Bereits im zehnten Jahrhundert wurde Herbert Avrilaksky zugeschrieben, die Kunst der Herstellung eines Teraphims - eines sprechenden toten Kopfes - zu beherrschen. Dieser Kopf aus Bronze mit den Worten „Ja“ und „Nein“ beantwortete die Fragen aller, die ihn angesprochen hatten. Mitte des 13. Jahrhunderts versuchten auch der Dominikanermönch Albert von Bolstedt und der englische Philosoph und Naturforscher Roger Bacon, erste Beispiele für „sprechende Köpfe“ zu schaffen.

Ende des 18. Jahrhunderts schuf der dänische Wissenschaftler Christian Kratzenstein, ein ordentliches Mitglied der Russischen Akademie der Wissenschaften, ein Modell des menschlichen Sprachtrakts, mit dem fünf lange Vokale (a, äh, o, o) erzeugt werden können. Das Modell war ein System von akustischen Resonatoren verschiedener Formen, die mit Hilfe von durch den Luftstrom angeregten vibrierenden Stimmzungen Vokale aussendeten. Der österreichische Wissenschaftler Wolfgang von Kampelen ergänzte das Kratzenstein-Modell 1778 durch Zungen- und Lippenmodelle und führte eine akustisch-mechanische Sprechmaschine ein, mit der bestimmte Geräusche und deren Kombinationen reproduziert werden konnten. Das Zischen und Pfeifen wurde mit Hilfe eines speziellen handbetätigten Pelzes geblasen. 1837 stellte der Wissenschaftler Charles Wheatstone (Charles Wheatstone) eine verbesserte Version der Maschine vor, mit der Vokale und die meisten konsonanten Klänge reproduziert werden können. Und 1846 demonstrierte Joseph Faber (Joseph Faber) seine Sprechorgel Euphonia, in der versucht wurde, nicht nur Sprache zu synthetisieren, sondern auch zu singen.

Ende des 19. Jahrhunderts schuf der berühmte Wissenschaftler Alexander Bell ein eigenes mechanisches Modell, das der Wheatstone-Maschine sehr ähnlich ist. Mit dem Aufkommen des 20. Jahrhunderts begann die Ära der Elektroautos, und Wissenschaftler konnten Schallwellengeneratoren verwenden und auf deren Basis algorithmische Modelle erstellen.

In den 1930er Jahren entwickelte ein Mitarbeiter von Bell Labs, Homer Dudley (Homer Dudley), der sich mit dem Problem befasst, Möglichkeiten zur Reduzierung der für die Erhöhung der Übertragungskapazität in der Telefonie erforderlichen Bandbreite zu finden, den VOCODER (Abkürzung für English Voice - Voice, englischer Codierer - Codierer) ) - Tastaturgesteuerter elektronischer Analysator und Sprachsynthesizer. Dudleys Idee war es, das Sprachsignal zu analysieren, in Teile zu zerlegen und es in eine weniger anspruchsvolle Bandbreite umzuwandeln. Eine verbesserte Version des Vocoders Dudley, VODER, wurde auf der New York World Expo 1939 vorgestellt.

Die ersten Sprachsynthesizer klangen ziemlich unnatürlich, und oft konnten sie die von ihnen produzierten Phrasen kaum erkennen. Die Qualität der synthetisierten Sprache wurde jedoch ständig verbessert, und die von modernen Sprachsynthesesystemen erzeugte Sprache ist manchmal nicht von der realen menschlichen Sprache zu unterscheiden. Trotz der Erfolge elektronischer Sprachsynthesizer wird weiterhin auf dem Gebiet der Herstellung mechanischer Sprachsynthesizer geforscht, beispielsweise für den Einsatz in humanoiden Robotern.

Die ersten auf Computertechnologie basierenden Sprachsynthesesysteme kamen Ende der 1950er Jahre auf den Markt, und der erste Text-zu-Sprache-Synthesizer wurde 1968 entwickelt.