// Oddział Mazowiecki Polskiego Towarzystwa Informatycznego
gazeta

Bieżące informacje o działaniach, inicjatywach i spotkaniach organizowanych przez Oddział Mazowiecki PTI oraz ogłoszenia i informacje dla członków Oddziału.

// Aktualności

Rozważania lingwistyczne w dobie cyfryzacji

31.10.2019

Odsłon: 76

Około 150 osób przewinęło się przez XII edycję Forum Kultury Słowa, które organizowane jest co dwa lata przez Radę Języka Polskiego przy Polskiej Akademii Nauk – wspieraną przez licznych partnerów. Tegoroczna edycja Forum tym razem w całości była podporządkowana tematowi „Polszczyzna w dobie cyfryzacji”, a więc zagadnieniu, które informatyków powinno angażować szczególnie głęboko.

 

Forum odbyło się 16-18 października br. w Kielcach. Nowoczesne pomieszczenia gmachu Instytutu Filologii Polskiej Uniwersytetu Jana Kochanowskiego pozwoliły uczestnikom w sposób komfortowy skorzystać z różnorodnych form wymiany wiedzy: warsztatów, sesji plenarnych, czy sesji plakatowych (ta ostatnia forma wymiany myśli na Forum pojawiła się po raz pierwszy).

 

Główne wątki

 

Trzy dni sesji konferencji trwających przez 10 godzin dziennie pozwoliły uczestnikom na gruntowne zaznajomienie się z opiniami panującymi wśród polonistów, socjologów i praktyków przekazu (np. dziennikarzy) na temat przemian języka w polskim Internecie, zwłaszcza w użyciu potocznym, codziennym.

 

W sesji inauguracyjnej bogaty zaczyn do dyskusji stworzył prof. Bogusław Skowronek prowadzący Katedrę Lingwistyki Kulturowej i Komunikacji Społecznej oraz jednocześnie Katedrę Mediów i Badań Kulturowych Uniwersytetu Pedagogicznego w Krakowie (UPK). W sesji tej wykłady swoje wygłosili także: dr Marta Juza z Katedry Socjologii Komunikowania, Organizacji i Zarządzania UPK oraz prof. UŚ dr hab. Iwona Loewe z Zakładu Lingwistyki Tekstu i Dyskursu Uniwersytetu Śląskiego.

 

Z referatów jasno wynika, iż nowe media, wyrastające z technik Internetu, rozpowszechniają wśród użytkowników język bardzo odmienny od języka gazet, filmu, czy telewizji. Szczególnie media społecznościowe, które dają użytkownikom złudzenie nieskrępowanej interaktywności doprowadziły do powstania licznych socjolektów, w których dobrze się czują tylko wąskie grupy wtajemniczonych. Wprowadzona na początku epoki komunikacji internetowej netykieta jest przestrzegana wybiórczo, ponieważ w pewnych grupach kultura obcowania jest jedynie przeniesieniem tego, jak dani uczestnicy dyskursów potrafią zachowywać się w realu. A wzorce kulturowe w wirtualnych grupach zainteresowań są bardzo zróżnicowane. Tym niemniej poloniści nie poddają się i zastanawiają nad takimi zagadnieniami jak norma językowa w dobie cyfryzacji, czego przykładem był referat na ten temat prof. Katarzyny Kłosińskiej, przewodniczącej Rady Języka Polskiego PAN.

 

Dyskusja plenarna prowadzona przez prof. Andrzeja Markowskiego. Mówi Iwona Loewe.

 

W kolejnych sesjach Forum uczestnicy mogli się zapoznać z naukowymi analizami zjawisk typowych dla współczesnego Internetu, takimi jak radykalizacja języka w sieci, marginalizacja języka, emocje, mowa nienawiści. Sądząc po reakcjach z sali, spośród wszystkich tematów, przekaz informacji poprzez memy internetowe okazał się dla widowni chyba najbardziej atrakcyjnym pakietem referatów. Wśród referatów nie zabrakło też troski prezentujących o jakość tłumaczeń maszynowych, czy inne algorytmy automatycznego przetwarzania języka, a dodatkowo wpływ tych czynników na komunikację między ludźmi.

 

Kilka osób zaprezentowało wyniki badań języka i stylu wypowiedzi przy określonych wydarzeniach społecznych. Wydaje się, że badania te dotyczyły głównie chwilowych emocji, które są bardzo chwiejne w czasie i nie zawsze reprezentatywne. Rzadko utrzymują się przez dłużej niż jeden sezon. Daleko bardziej nośne wydają się stałe, wieloletnie obserwacje języka pisanego w sieci i analiza ich ewolucji.

 

Językowe hurtownie danych

 

Nie należy zapominać, że poloniści od wielu już lat są doświadczonymi użytkownikami systemów informatycznych opartych na algorytmach danych masowych (Big Data), pracującymi na różnorodnie definiowanych korpusach językowych. Od korpusów języka staropolskiego, poprzez polszczyznę XIX wieku, po język współczesnych gazet, czy wreszcie język Internetu. Powrót do dawnej literatury polskiej metodami cyfrowymi doprowadza do zaskakujących wniosków, nieosiągalnych metodami tradycyjnymi. Dla przykładu pozwala dowieść, że język polski XVII wieku nie u wszystkich autorów epoki skrzył się bogactwem słownictwa w jakie zdajemy się współcześnie wierzyć.

 

Metody badań danych masowych w odniesieniu do języka znajdują się ciągle w fazie badawczo-rozwojowej. W sukurs polonistom pracującym nad dużymi zbiorami danych przychodzą informatycy Politechniki Wrocławskiej (prezentowali: Maciej Piasecki, Marcin Oleksy, Jan Wieczorek). W ramach europejskiego konsorcjum CLARIN (polski oddział nosi nazwę CLARIN-PL) od kilku lat rozwijają oni narzędzia cyfrowej obróbki zasobów językowych (repozytorium DSpace, platforma Next Cloud, system Inforex, Korpusomat). Dzięki tym narzędziom użytkownicy mogą stosować profesjonalne narzędzia analizy zasobów językowych po stosunkowo niskich cenach. Rozwój i utrzymanie udostępnianych platform finansuje bowiem w całości MNiSW, a użytkownicy mogą ewentualnie ponieść dodatkowe koszty, jeśli chcą zainwestować w prace adaptacyjne (np. programistyczne) do realizacji bardziej szczegółowych celów.

 

Oprócz wymienionych narzędzi użytkownicy mają dostęp do narzędzia Słowosieć (WordNet). Słowosieć jest słownikiem semantycznym pokrewieństw słów (relacji) języka polskiego. Obecnie zawiera 191 tys. rzeczowników, czasowników, przymiotników i przysłówków, 285 tys. znaczeń a opisuje ponad 600 tys. relacji pomiędzy nimi. Aktualnie Słowosieć jest na świecie największym wordnetem krajowym – większym nawet niż jego angielski pierwowzór: Princeton WordNet. Słowosieć, jako połączona z Princeton WordNet może służyć jako słownik polsko-angielski i angielsko-polski.

 

Jeśli już o słownikach mowa, to warto na koniec wspomnieć o planach Zespołu Terminologii Informatycznej przy RJP PAN, której przewodniczącym jest prof. Andrzej Jacek Blikle. Podczas XII FKS w Kielcach zaprezentował on koncepcję i stan prac nad PATTI – Polsko-Angielskim Tezaurusem Teleinformatyki, planowanym do wdrożenia w Internecie. PATTI ma być narzędziem ułatwiającym pracę nad stale zmieniającą się terminologią informatyczną.

 

Chwila zadumy

 

Język w dobie cyfryzacji zmienia się. Na pierwszy rzut oka analizę Internetu i jego form komunikacji można próbować prowadzić metodami znanego teoretyka socjologii mediów Marshalla McLuhana (1911-1980). Jego dwa hasła ukute w latach sześćdziesiątych XX w. opublikowane w książce „Galaktyka Gutenberga” są szczególnie często przywoływane. Pierwsze to teoria globalnej wioski, gdzie poprzez media elektroniczne przepływ informacji skraca się od nadawcy do odbiorcy. Drugie to medium is a message (pierwotnie: massage), czyli rodzaj metonimii, że sam środek przekazu stanowi też część przekazu. Przekaz jest więc formą, która rządzi się swoimi prawami i sama narzuca określone znaczenia i interpretacje.

 

Za kontynuatora badań McLuhana uważany jest , wspomniany w referacie Edwina Bendyka Manuel Castells (1942-), współczesny badacz usieciowienia społeczeństwa. Jego książka „Galaktyka Internetu” (2001) to wyraźne nawiązanie do badań McLuhana. Castells w swoich książkach trafnie zewidencjonował wiele zjawisk towarzyszących rozwojowi Internetu w wymiarze społecznym: wirtualne społeczności, e-biznes, społeczeństwo obywatelskie, utrata prywatności, przesunięcie komunikatów politycznych do świata wirtualnego, wreszcie edukacja i nowe formy poszukiwania wiedzy. Castells sugeruje też pokrewne do McLuhanowskiego hasło Network is the Message. Koncepcje globalnej wioski w rzeczywiście przypadku Internetu rozkwitły bardziej niż kiedykolwiek.

 

Tak to już jest z rolą mediów społecznościowych jeśli ktoś kichnie na jednym kontynencie, to na drugim mogą mu wkrótce odpowiedzieć „na zdrowie”. Tezę natomiast, czy sieć sama w sobie zawsze jest przekazem należy wyznawać bardzo ostrożnie. Otwarty na świat użytkownik może w Internecie znaleźć wszystko czego szuka i potrzebuje, pod warunkiem wszakże, że umie o to "wszystko" sieć zapytać.

 

Sieć Internetu jest zimna, nieempatyczna. Można się w niej odizolować od napływu nowych wiadomości z nieznanych sobie dziedzin, popaść w autarkię i izolacjonizm. Medium to może być więc przekazem, ale nie zawsze i nie dla każdego musi. Czasem może doprowadzić do zamknięcia się użytkownika w rodzaj wykluczenia poprzez uzależnienie od zbyt zawężonych obszarów tematycznych. (d)


Zobacz także

 

 

 

 

Migawki z sesji plakatowej

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kategorie: Konferencje i seminaria Tagi: terminologia, sprawozdania, 2019