Strona stworzona 20 listopada 2002 r.

Gadające komputery

MENU

Praca osoby niewidomej w systemie DOS.

Zalety i wady readerboarda.

SCR.

Syntezatory mowy i screenreadery.

Sposoby tworzenia screenreaderów.

Window-Eyes

Odczytywanie grafiki.

Po co to wszystko? Do czego niewidomi wykorzystują komputer?

Co wybrać?


Od autora

Nazywam się Paweł Podolski. Mam 26 lat. Jestem osobą niewidomą, która komputerem posługuje się już od siedmiu lat.
Niektórzy z Was zapewne uśmiechnęli się i pytają: Jak to możliwe, aby ktoś taki mógł pracować na komputerze, skoro nie widzi, co się pojawia na ekranie? Czy on mówi poważnie?
Przeczytajcie ten artykuł, a przekonacie się, że tak. Gdy ktoś mi zadaje powyższe pytanie, a wiem, że z komputerami nie miał nic lub prawie nic wspólnego; odpowiadam, że skoro Mahomet nie mógł przyjść do góry, to góra musiała przyjść do Mahometa.
Musiałem po prostu nauczyć komputer mówić. Rozmowa człowieka z maszyną pozostaje nadal w sferze naszych marzeń, ale już dziś synteza mowy nie jest czymś zaskakującym. Dzięki mowie syntetycznej komputer służy mi jako lektor, informując, czego ode mnie chce. Dzięki temu mogę czytać, pisać a czasami świetnie się bawić.


1. Praca osoby niewidomej w systemie DOS.

Teraz postaram się Wam przedstawić możliwości niewidomych podczas pracy z komputerem. Omówię głównie pracę w Windowsach, gdyż bez tego dzisiaj ani rusz. Ponieważ jednak większość niewidomych, używających komputerów do pracy lub zabawy na co dzień, czasami korzysta jeszcze ze środowiska znakowego, dlatego parę słów poświęcę nieco starszym rozwiązaniom w dziedzinie mowy syntetycznej, których kiedyś używało się pod starym, poczciwym, ale jednak czasami niezastąpionym DOS-em.
DOS jest dużo łatwiejszy do udźwiękowienia dla osób niewidomych niż środowiska graficzne. Wynika to głównie z faktu, że dla środowiska DOS znacznie prościej jest napisać screenreader, który współpracuje z programami działającymi w trybie tekstowym, niż program spełniający taką samą funkcję dla systemu windows, w którym jak wiadomo oprócz tekstu mamy także różnego rodzaju elementy graficzne (np. ikony przyciski).

> PowrótPowrót do MENU

2. Zalety i wady readerboarda.

Gdy królował DOS jednym z popularniejszych programów udźwiękawiających pracę komputera w trybie znakowym był readboard warszawskiej firmy Altix. Jego zaletą jest to, że pozwala on na pracę z większością programów, które działają w trybie tekstowym. Problemy występują tylko przy programach rezydentnych, które uaktywnia się przez naciśnięcie jakiejś kombinacji klawiszy. Poza tym jest on prosty w obsłudze i pozwala na łatwe dostosowywanie go do potrzeb programu, z którym aktu-alnie pracujemy. W przypadku, gdy używamy niewielkiej liczby programów, nie ma to właściwie żadnego znaczenia, gdyż przy pomocy osoby widzącej zawsze można dostosować screenreader do swoich potrzeb, a następnie na dysku zapisać, jak ma się on zachowywać w sytuacji, gdy uruchomimy na przykład Nortona Commander lub ulubiony edytor tekstów.
Gdy jednak ogląda się dużo różnych programów, nie zawsze można liczyć na pomoc osoby widzącej, która opisze wygląd ekranu. Readboard właśnie dzięki swojej prostocie obsługi pozwala na pracę z różnymi programami bez uciekania się do pomocy osób trzecich. Ma on jednak jedną poważną wadę. Napisany jest w Pascalu, co powoduje, że zajmuje dużo pamięci operacyjnej i czasami lubi się zawieszać, a ponadto niekiedy nie wystarcza pamięci konwencjonalnej na uruchomienie jakiegoś programu.
Synteza mowy jest w nim realizowana programowo, dzięki czemu aby z nim pracować wystarczy prosty syntezatorek mowy oparty na kowoksie podłączanym do portu równoległego.
Jest dostępna również jego specjalna wersja, która działa z syntezatorem apollo, który jest jednym z najpopularniejszych sprzętowych syntezatorów mowy na świecie gdyż pozwala na pracę z wieloma językami, co stwarza możliwość zatrudniania niewidomych na przykład przy tłumaczeniu tekstów.
Kolejną zaletą readboarda jest fakt, że w najnowszej wersji (czyli 6.0) udźwiękawia większość programów uruchamianych w systemie operacyjnym DOS, współpracuje także z programami przygotowanymi wyłącznie dla osób niewidomych. Idea tych programów polega na tym, że wysyłają one do syntezatora mowy to, co ma być wypowiadane i screenreader nie musi się zajmować monitorowaniem całego systemu ani analizowaniem, co ma być w danym momencie wypowiedziane. Zaletą tego rozwiązania jest fakt, że takie udźwiękowione programy zajmują znacznie mniej pamięci operacyjnej (w DOS-ie ma to kolosalne znaczenie) aniżeli screenreader, który na bieżąco podgląda naszą pracę na komputerze.
Niestety, takich udźwiękowionych programów jest stosunkowo mało i są sprzed kilku lat, ale dla niewidomych sama możliwość pracy przy komputerze stwarza ciekawe perspektywy oraz duże możliwości.

> PowrótPowrót do MENU

3. SCR

Kolejnym programem, który umożliwia pracę w DOS-ie jest program SCR warszawskiej firmy Emtron. Działa on z syntezatorem mowy smp (skrót od słów: system mowy polskiej), oraz z notatnikiem kajetek, który jest urządzeniem stanowiącym połączenie syntezatora mowy smp oraz klawiaturki do wprowadzania danych. Kajetek ma także możliwość transmisji danych do i z komputera, dzięki czemu niewidomy, jadąc na przykład pociągiem może sobie czytać książki, wykorzystując do tego mowę syntetyczną generowaną przez syntezator smp. Syntezator smp jest w pełni polskim produktem, który jest tańszy od syntezatora apollo, a mowa, którą generuje, w niczym mu nie ustępuje. Program SCR jest napisany w asemblerze, co powoduje, że jest on stabilny, zajmuje mało pamięci operacyjnej i nie wiesza się. Komendy wydaje się mu za pomocą brajlowskiej klawiatury, która jest emulowana na zwykłej klawiaturze, komputerowej. Na przykład - aby syntezator przeczytał cały ekran, należy napisać brajlowskie "ę" przez jednoczesne naciśnięcie klawiszy s- k- l. Powrót do MENU Praca osoby niewidomej w systemie Windows. Dzisiaj każdy użytkownik komputerów, czytając powyższe rozważania zastanawia się zapewne, jaki ma sens używanie komputera przez niewidomych w środowisku znakowym? Przecież w dzisiejszych czasach zdobycie programów dla DOS-a jest raczej trudne, a cały świat używa systemu Windows, nazywanego przez niektórych żartobliwie jedynym słusznym systemem operacyjnym stworzonego przez firmę Microsoft. Tu niewidomy sobie na pewno nie poradzi! Przecież są ikonki, obrazki, trzeba klikać myszką, pokazywać kursorem, na jakim obiekcie chcemy kliknąć, a więc nie jest to sposób pracy, jaki mógłby przypaść do gustu niewidomym. Niemniej jednak Windows dla nas wcale nie jest taki straszny, jak mogło by się to wydawać na pierwszy rzut oka. Praca w tym środowisku jest tak samo możliwa, jak w trybie znakowym.

> PowrótPowrót do MENU

4. Syntezatory mowy i screenreadery.

System Windows jest możliwy do udźwiękowienia i przystosowania do pracy dla osób niewidomych, potrzebne jest jednak specjalne oprogramowanie. Aby komputer do nas przemówił w Windows, potrzebujemy dwóch programów: syntezatora mowy i screenreadera. Ten angielski termin jest w zasadzie nie przetłumaczalny na język polski, ale jak sama nazwa mówi: screenreader to program, którego zadaniem jest odczytywanie ekranu osobie niewidomej.
"Obserwuje" on co dzieje się aktualnie w systemie. Sprawdza , jakie programy mamy uruchomione, co wyświetlają na ekranie, co robi użytkownik i przekazuje tekst w postaci kodów ASCII do syntezatora mowy, który je następnie wypowiada. Na rynku mamy kilka screenreaderów i kilka syntezatorów mowy.
Syntezatory mowy dzielą się na sprzętowe i programowe. Do syntezatorów sprzętowych potrafiących generować polską mowę syntetyczną zaliczamy Apollo2 i SMP.
Część niewidomych używa syntezatorów sprzętowych, a część programowych, wszystko zależy od gustów i możliwości finansowych. Koszt sprzętowego syntezatora mowy to ok. 3 tysiące złotych. Urządzenia te przypominają małe prostokątne pudełeczka, podpinane do komputera do portu szeregowego. Dysponując syntezatorem sprzętowym nie jesteśmy uzależnieni od systemu operacyjnego, który używamy.
Udźwiękowić można praktycznie wszystko: DOS, Windows, Linux, ale pod warunkiem, że do danego systemu jest napisany screenreader, udźwiękawiając go tak, aby potrafił obsługiwać nasz sprzętowy syntezator mowy.
Jednym z popularniejszych na świecie syntezatorów mowy jest apollo2. Potrafi on generować mowę w kilku językach, pod warunkiem, że w syntezatorze są umieszczone odpowiednie kości pamięci z mową dla poszczególnych języków.
Podczas pracy ze screenreaderem istnieje możliwość przełączania się pomiędzy różnymi językami, co się przydaje, gdy czytamy polski albo angielski tekst. Syntezator ma możliwość mówienia kilkoma głosami, które można dowolnie konfigurować z poziomu screenreadera, oraz szeroki zakres intonacji wypowiadanego tekstu. Ma też wejście na słuchawki, dzięki czemu można pracować, nie przeszkadzając otoczeniu generowaną mową syntetyczną. Podobne możliwości ma syntezator smp, nie potrafi on jednak mówić w różnych językach. Więcej informacji na temat syntezatora Apollo2 można znaleźć na stronie firmy
Harpo z Poznania, która jest jednym z dystrybutorów tego sprzętu w Polsce.
Syntezatory sprzętowe to jednak nie jedyny sposób udźwiękowienia komputera - całe szczęście, gdyż są one dosyć drogie i wielu niewidomych nie jest w stanie ich kupić. Na rynku istnieją jeszcze syntezatory programowe, z którymi współpracują praktycznie wszystkie dostępne w tej chwili screenreadery. Syntezatory te działają w standardzie ms-sapi, co umożliwia zainstalowanie kilku różnych syntezatorów w komputerze i w razie potrzeby przełączanie się pomiędzy nimi podczas pracy.
Ja osobiście jestem zwolennikiem syntezatorów mowy programowej, ponieważ mowa generowana w ten sposób ma dużo lepszą jakość. Aby jednak można było używać syntezatorów dźwiękowych, musi być w komputerze zainstalowana karta dźwiękowa. Polecałbym kartę soundblaster live, ewentualnie audigy, ze względu na możliwość odtwarzania kilku strumieni audio jednocześnie, dzięki czemu można na przykład pracować nad tekstem, słuchając przy okazji ulubionych utworów w standardzie mp3.
Najlepszym na rynku programowym syntezatorem mowy jest syntezator spiker firmy Ivo. Oferuje on dwa głosy: męski i żeński (bardzo dobrej jakości), potrafi intonować tekst, co jest wyjątkiem wśród programowych syntezatorów mowy, oraz ma szeroki wachlarz parametrów konfiguracyjnych, takich jak: przerwy między słowami, zdaniami, wysokość głosu podczas wypowiadania dużych liter, czy głębokość oddechu, przez co generowana mowa jest bardzo podobna do mowy ludzkiej. Koszt tego programu to 600 złotych.
Wersję demonstracyjną oraz informacje na temat syntezatora mowy spiker można znaleźć na stronie firmy Ivo.

> PowrótPowrót do MENU

5. Sposoby tworzenia screenreaderów.

Jak już wspomniałem, zadaniem screenreadera jest nadzorowanie tego, co dzieje się na ekranie komputera i wysyłanie tekstu w postaci kodów ASCII do syntezatora mowy, który zamienia je na mowę słyszalną dla nas. Są dwie szkoły, według których screenreadery są tworzone. Jedna mówi, że program taki powinien współdziałać jak najlepiej z samym systemem operacyjnym oraz najpopularniejszymi jego aplikacjami takimi jak np.Word, Exel. W myśl tej zasady został napisany program hal dla windows 95 lub windoweyes. Charakterystyczną cechą hala jest wbudowana angielska mowa syntezowana przy użyciu karty dźwiękowej, co przydaje się, gdy ktoś pracuje w większości z angielskim systemem operacyjnym i angielskimi aplikacjami albo czyta dużo angielskojęzycznych tekstów. Hal może jednak czytać po polsku pod warunkiem zastosowania syntezatora mowy apollo2 z wbudowanym modułem do syntezy mowy polskiej, albo któregoś z syntezatorów programowych na przykład spikera, syntalka sapi, lub spika.. Druga szkoła zaś mówi, że screenreader musi działać z większością spotykanych na rynku programów. Nie zawsze jest to możliwe w praktyce, gdyż niektóre programy posługują się niestandardowym interfejsem użytkownika i screenreader nie wie, co należy powiedzieć. W większości przypadków taki screenreader świetnie zdaje egzamin i pozwala w sposób prosty dopasowywać się do aktualnie uruchomionych aplikacji. Jednym z takich programów jest outspoken. Swego czasu był to jeden z najlepszych programów dostępnych dla Windows. Niestety, program przestał się roz-wijać i nie polecam jego kupna. Za te same kwoty można kupić obecnie screenreadery oferujące dużo większe możliwości. Outspoken jednak cechowała niespotykana łatwość użycia, wszystkie potrzebne programowi komendy wydaje się z klawiatury numerycznej, są one tak dopasowane, że bardzo łatwo jest je zapamiętać, łatwo można się poruszać po ekranie i klikać myszką na grafikach. Minusem outspokena jest kiepska współpraca z przeglądarką Internet Exploler, co poprawiło się w ostatnim czasie dzięki programowi webformator (można go ściągnąć ze strony www.webformator.com Rolą programu webformator jest takie ułożenie linków i treści na stronie www, aby była ona zaprezentowana w sposób przejrzysty dla osoby niewidomej.

> PowrótPowrót do MENU

6. Window-Eyes

Ja do pracy w środowisku Windows używam programu Window-Eyes. Window-Eyes jest programem odczytu ekranu, stworzonym przez firmę GW Micro, dającym za pomocą mowy syntetycznej dostęp do oprogramowania pracującego w środowisku Windows.
Window-Eyes został opracowany zarówno dla początkujących, jak i zaawansowanych użytkowników komputera. Wyposażony jest w szeroką gamę funkcji oraz duże możliwości elastycznego dostosowywania się do indywidualnych potrzeb użytkowników, jak i do pracy w najbardziej zaawansowanych programach aplikacyjnych. Używając Window-Eyes nie trzeba się skupiać na tym, jakich komend screenreadera należy użyć, aby osiągnąć dany cel, lecz naszą uwagę kierujemy na program aplikacyjny, z którego korzystamy. Przede wszystkim celem programu odczytu ekranu jest udostępnienie wszystkich funkcji programu użytkowego, a nie skupianie uwagi na mechanizmach poszukiwania informacji na ekranie komputera.
Window-Eyes jest dostępny w dwóch wersjach: standard dla systemów Windows 95/98 i Millenium, oraz w wersji professsional przeznaczonej dla systemów w2k oraz Xp. Window-Eyes można w bardzo prosty sposób dostosować do uruchamianych aplikacji, poprzez stworzenie dla każdej z nich plików konfiguracyjnych. Sprowadza się to do odpowiedniego ustawienia parametrów dla każdej uruchamianej aplikacji. Dzięki takiemu podejściu podczas pracy w Wordzie można wyczulić Window-Eyes, aby wymawiał na przykład słowa podkreślone na czerwono lub inne rzeczy. Dzięki faktowi, że Window-Eyes wykorzystuje MSAA (microsoft active accessibility) oglądanie stron www jest bardzo proste i przypomina pracę z edytorem tekstowym. Jesteśmy informowani, co jest linkiem, co tabelką, można wypełniać formularze na stronach, zaznaczać odpowiednie opcje, albo klikać na przyciskach i grafikach. Uważam, że Window-Eyes w połączeniu ze spikerem stanowią doskonałe narzędzie dla udźwiękowienia komputera osobie niewidomej. Wraz z programem dostajemy zestaw stworzonych przez producenta plików konfiguracyjnych, słowników, grafik do najczęściej używanych aplikacji jak Word, Exel Office, czy Internet Explorer. Dostajemy też programowy, sześciojęzyczny syntezator mowy Eloquence bez dodatkowych opłat (syntezator nie ma języka polskiego).

> PowrótPowrót do MENU

7. Odczytywanie grafiki.

A co z grafiką? Na pewno wielu z was zastanawia się, jakie podejście mają screenreadery do grafiki. Przecież grafiki nie da się przełożyć w prosty i zrozumiały sposób na tekst. Ale screenreadery mają mechanizmy pozwalające na pracę z grafiką i klikanie na odpowiednich obrazkach. Window-Eyes pozwala na automatyczne etykietowanie grafiki. Widzący użytkownik widzi grafikę jako obrazek, który coś przedstawia, na przykład nożyczki. Niestety, niewidomemu w ten sposób grafiki przedstawić się nie da. Screenreaderowi można jednak powiedzieć, co ma wypowiadać po napotkaniu na ekranie określonego obrazka. Automatyczne etykietowanie grafiki polega na jej automatycznym nazywaniu przez screenreadera. Do tego celu wyko-rzystywane są napisy pod ikonkami lub innymi symbolami graficznymi pojawiające się po najechaniu kursorem myszki (są to tak zwane dymki pomocy). W Window-Eyes można to osiągnąć naciskając jeden klawisz- następnie takie nazwane przez program grafiki można zapisać do tzw. słownika grafik, gdzie jest napisane, co program ma wypowiadać po napotkaniu określonego obrazka. Jeśli pod obrazkiem nie ma dymka pomocy, to potrzebna jest pomoc osoby widzącej, która nam powie, do czego służy dana ikonka. Inaczej otrzymuję tylko informację, że dany obiekt na ekranie to obrazek, nie wiem jednak, co to jest i do czego służy. Nie oznacza to , że gdy nie mam "ponazywanej"grafiki, nie mogę normalnie pracować.
Podczas pracy w Windows, jak najwięcej staram się korzystać z klawiatury. Myszy praktycznie nie używam, gdyż jest to niemożliwe z dwóch następujących powodów: po pierwsze myszka porusza się po ekranie w sposób płynny, co utrudnia mi na ekranie, po drugie ponieważ nie widzę, nie mogę śledzić kursora myszy. Korzystając z klawiatury poruszamy się w sposób skokowy na przykład od jednego polecenia w menu do drugiego lub między ikonkami, przyciskami czy po tekście. Nie wszystko w Windows można zrobić korzystając z klawiatury. W takim przypadku Window-Eyes daje mi do dyspozycji "wirtualną mysz", emulowaną z klawiatury nume-rycznej. Mogę więc poruszać się po grafikach, słowach, przyciskach i innych elementach przez naciśnięcie czwórki numerycznej (skok o jeden element w lewo) lub szóstki numerycznej (skok o jeden element w prawo). Piątka numeryczna służy do pokazania, na którym elemencie chcemy kliknąć, a numeryczny / lub gwiazdka zastępuje odpowiednio kliknięcie lewym lub prawym przyciskiem myszki.
Window-Eyes ma dostępny po polsku nie tylko interface programu, ale także przystępnie napisany podręcznik. Dla użytkowników Window-Eyes jest dostępna polskojęzyczna
lista dyskusyjna poświęcona temu programowi.

> PowrótPowrót do MENU

8. Po co to wszystko? -  Do czego niewidomi wykorzystują komputer?

Mając do dyspozycji komputer, syntezator mowy, screenreadera, skaner i program do rozpoznawania pisma, jestem w stanie korzystać z materiałów drukowanych jak gazety, książki i inne. Czy potrafisz sobie wyobrazić, co by było, gdybyś nie mógł czytać? Jeśli tak, to wiesz jakie nieocenione usługi może oddać mi skaner z programem do rozpoznawania pisma. Bez trudności mogę też pracować z edytorem tekstów, arkuszem kalkulacyjnym, czy bazą danych. Mogę w szerokim zakresie korzystać z mnóstwa informacji dostępnych w Internecie. Dzięki poczcie elektronicznej, czy komunikatorom internetowym jest możliwa wszechstronna komunikacja, wymiana informacji i nawiązanie nowych znajomości, co pozwala mi na komunikowanie się nie tylko z niewidomymi, ale także z ludźmi w pełni sprawnymi.
Komputer i Internet znoszą w tej dziedzinie wszelkie bariery, które mieliśmy do niedawna. Wcześniej mogłem czytać tylko książki napisane pismem brajla, lub nagrane na kasetach. Dzięki komputerowi mogę czytać wszystkie książki i komunikować się ze wszystkimi bez kłopotów. Różnica jest tylko taka, że ty czytasz tekst oczami, a mi wypowiada go gadacz.
Oprogramowanie, które opisałem, stwarza dodatkowe możliwości zatrudnienia dla niewidomych. Niestety, jest ono bardzo drogie. Koszt programu Window-Eyes wraz z syntezatorem mowy apollo2 wynosi około siedmiu tysięcy złotych. Trochę tańsze jest wykorzystanie syntezatora programowego - około 3 tysiące złotych. Nic więc dziwnego, że tak niewielki procent niewidomych w Polsce może pracować wWindows.
Większość radzi sobie w ten sposób, że ściąga z sieci wersje demonstracyjne screenreaderów. Jeśli posiadasz kartę dźwiękową na przykład sound blaster live, lub audigy, musisz zainstalować Window-Eyes, a następnie syntezator spiker, wybierając w panelu kontrolnym Window-Eyes w menu plik/wybór syntezatora/syntezatory sapi. Po naciśnięciu klawisza tab najeżdżamy na opcję ivo software spiker i już program jest gotowy do pracy. Do syntezy mowy angielskiej można wykorzystać syntezator microsoft tekst to speech, albo Eloquence dostarczany wraz z Window-Eyes.
System Windows jest jednak niekiedy bardzo nieprzyjazny dla niewidomych, właśnie z uwagi na jego graficzny charakter i na fakt, że nie wszystko można zrobić w nim korzystając z klawiatury. Praktycznie nie jest możliwe napisanie screenreadera, który będzie działał ze wszystkimi programami w środowisku Windows. Wynika to z faktu, że jest to system graficzny, który ułatwia pracę widzącym, ale potrafi znacznie utrudnić lub wręcz uniemożliwić pracę niewidomym. Jak zwykle wszystko zależy od programistów i od tego, czy tworząc program, korzystają z komponentów wchodzących w skład systemu operacyjnego, czy też tworzą własne elementy sterujące programem i procedury ich obsługi. W takim przypadku gadacze się "gubią". Nie potrafią udźwiękowić niestandardowych elementów, nie wiedzą, co jest ważne, a co nie, co ma być wypowiedziane. Czasami się zdarza, że mając gadacza i screenreadera nie jesteśmy w stanie obsłużyć jakiegoś programu, albo jego obsługa jest dla nas bardzo utrudniona.
Bez odpowiedniego oprogramowania niewidomy nie jest w stanie samodzielnie pracować w Windows. Gdy jednak ma screenreadera, może praktycznie konkurować z osobą w pełni sprawną.
Może to dziwne, ale czasami niewidomi potrafią niektóre rzeczy zrobić nawet dokładniej.
Fakt ten stwarza duże, niestety niedocenione przez nasze społeczeństwo możliwości zatrudnienia niewidomych w wielu sektorach gospodarki rynkowej. Niewidomy, mając komputer, może być tłumaczem, pisarzem, dziennikarzem, urzędnikiem i wykonywać wiele zawodów, gdzie komputery są uży-wane na porządku dziennym. Szkoda tylko, że pracodawcy nie chcą dostrzec tych dodatkowych możliwości tkwiących w osobach niewidomych i nie dają szansy zaprezentowania się i pokazania własnych umiejętności. Wiem to z własnego doświadczenia.

> PowrótPowrót do MENU

9. Co wybrać?