2010-04-09: Idea projektu Gutenberg rozwija się dzięki wikiskrybom

Z Wikinews, wolnego źródła informacji.
Przejdź do nawigacji Przejdź do wyszukiwania
piątek, 9 kwietnia 2010
Symbol wersji przejrzanych; udostępniony na zasadach własności publicznej

Wydawać by się mogło, że szybkie, krótkie komunikaty, wpisujące się w „kulturę teledysku” staną się czymś powszechnym i całkowicie dominującym w Internecie, a liczące wiele stron książki odejdą w niepamięć. 40 lat temu powstał projekt Gutenberg, który w formie elektronicznej miał gromadzić książki i pozwalać innym z nich korzystać. Do teraz w projekcie tym znalazło się ponad 30 000 pozycji. W Wikiźródłach, siostrzanym projekcie Wikipedii szybkość publikowania tekstów okazuje się być znacznie większa. Tylko w polskiej wersji językowej znajduje się kilkanaście tysięcy stron internetowych z tekstami źródłowymi. Idea projektu Gutenberg, podchwycona przez internautów skupionych wokół Wikimediów, ma się całkiem dobrze.

Polskie Wikiźródła mają jednak powód do świętowania, ponieważ wprowadzono w nich wersje przejrzane. Od tygodnia, podobnie jak w Wikipedii, strony projektu są przeglądane i oznaczane są wersje wolne od przypadkowych uszkodzeń czy celowych wandalizmów. W przypadku Wikiźródeł, drobny błąd, który nie musi naruszać sensu treści, a także błąd techniczny, typograficzny, zniekształciłby wierność wobec źródła, z którego tekst został powielony.

Praca wikiskrybów, czyli wolontariuszy działających w Wikiźródłach, przebiega w kilku etapach. Na początku należy dobrać odpowiednie źródło, które można upowszechnić, czyli takie, do którego prawa autorskie wygasły (minęło 70 lat od śmierci autora) lub tekst źródłowy, który opublikowany został na wolnej licencji. Ponieważ obecnie głównie opracowuje się historyczne dzieła literackie, przepisywanie ich zaczyna się od skanowania i zamieszczania skanów w projekcie Wikimedia Commons (czyli repozytorium mediów). Następnie są one przepisywane lub przepuszczane przez system OCR. Tu jednak wikiskryby nie zawsze do tego systemu sięgają, ponieważ np. XIX-wieczny język polski nie jest dobrze przez OCR odczytywany. Czytelnik, aby mieć pewność, że czyta tekst źródłowy, może go z opublikowanymi skanami porównać. Końcowy etap prac, to ułożenie typograficzne oraz dodanie linków do innych stron, np. biogramu autora w Wikipedii, aby czytanie tekstu było wygodne dla czytelnika.

Przykładowy tekst, który został w powyższy sposób opublikowany w Wikiźródłach, to „Pan Tadeusz”, wydanie z roku 1834. Informacje o tym co i jak publikuje się w Wikiźródłach, znajduje się na stronie omawiającej politykę publikacji. Poprawność treści zawartych w książkach sprawdzana jest poprzez rozszerzenie do oprogramowania proofread.

Źródła[edytuj]