wtorek, 7 stycznia 2014

Tematów wymyślanie grupowe + pierwsze uwagi o Word Tree

Dwa razy miałam okazję formułować tematy badawcze we współpracy z kimś innym, niż mój promotor.

Raz, kiedy w Kole Naukowym Studentów MISH brałyśmy udział w konkursie o grant (nie wygrałyśmy, ale żal nam było zostawić wykrystalizowany temat niezrealizowanym, więc zrobiłyśmy badania i tak, a wyniki pokazałyśmy na V Studenckim Forum Badań nad Jezykiem. Wspominałam o tym w TYM WPISIE)

I drugi raz ostatnio, razem Moniką, autorką bloga Warsztat badawczy polonisty-językoznawcy i Martą która prowadzi Warsztat badawczy językoznawcy-"diabłologa" .

Po raz kolejny Dysk Google okazał się niezmiernie przydatny - nie trzeba było się martwić czyj komputer jaki format pliku otworzy, a oddzielenie komentarzy od treści komentowanej i jasność, co do autorstwa komentarza jak zwykle celująca.

Mnie łatwiej jest patrzeć krytycznie na cudzy pomysł, niż na swój, więc obecność drugiego  i trzeciego "oka", możliwość zderzenia pierwotnej koncepcji z życzliwą sugestią: "a może zróbmy to tak"? po prostu przydaje się. Czasem zresztą nie chodzi o to, aby wyłapać niedoskonałości, a żeby potwierdzić, że nasz temat jest nowy i obiecujący.

Naszym zadaniem było wymyślić tematy w oparciu o zasoby i narzędzia cyfrowe. Wprawdzie bardziej naturalne wydaje mi się poszukiwanie metody wtedy, kiedy objawił się nam jakiś problem badawczy, nie zaś problemu do wykorzystania metody, ale taki porządek chyba staje się rzadko osiągalnym ideałem.

Zresztą, zobaczywszy program Word Tree autentycznie pomyślałam "ale fajne narzędzie, do czego by go użyć"?.
W zetknięciu z tym i innymi narzędziami do cyfrowej analizy tekstu nasunęły mi się dwa pytania:
  • Jak tego rodzaju narzędzia, projektowane przez badaczy zachodnich, poradzą sobie z tekstem polskim? 
  • Skąd brać długie, ciągłe teksty pisane w formie cyfrowej, którymi można by "nakarmić" taki program?
Pytanie pierwsze wymaga sprawdzenia w praktyce a na pytanie drugie przychodzą mi do głowy na razie 3 odpowiedzi:
  1. Literatura: zdigitalizowana (m. in. uwolniona od autorskich praw majątkowych po 70 latach od śmierci autora) oraz pierwotnie publikowana w internecie.
  2. Blogi.
  3. Instrukcje i teksty urzędowe dostępne do ściągnięcia na stronach instytucji, przeważnie w formacie pdf.
Wszelkie inne pomysły będą bardzo mile widziane w komentarzach.