lördag 30 augusti 2014

Om jag inte vore så trött ...

... skulle jag skriva ett blogginlägg där jag demonstrerar olika sökmetoder och kvalitetsskillnaderna i resultaten. Nu kan jag bara hoppas att folk själva testar t ex Presstanda och jämför relevansen i sökresultaten med att googla eller göra sökningar i tidningarnas egna arkiv eller webbsidor. Poängen är snarast att man behöver flera sökmetoder, om man vill ha kvalitet på sina sökresultat. Resultaten är mycket olika med olika metoder. Att behärska sådant kallas informationskompetens och det är en grundläggande färdighet i dagens informationssamhälle.

Nu orkar jag bara hänvisa till tidigare inlägg (detta är trots allt frågor jag jobbat med och skrivit om i åratal) om t ex hashtags och vikten av bra söksystem och en naiv tro på google som någon sorts perfekt och heltäckande index för all information i världen.

Tidningarnas egna intressen och möjligheter gällande bättre grepp om sina material och en smartare, modern informationsförvaltning, som skulle ge chanser att utveckla tjänster på nya sätt och använda tillgångar bättre, har jag också skrivit om. Att Brages Pressarkiv och Presstanda är en existerande infrastruktur och effektiv resurs, som man riskerar förslösa, kan alltså bara beklagas.

En sak som också är viktig att betänka är att man då man använder big data i forskning (vilket man bör anse fulltextsökningar i textmassor vara!) är att frågor om semantik, kvalitativa dimensioner och kontextkännedom är helt centrala. Jag hoppas därför att man faktiskt för en grundlig kritisk diskussion om vilka konsekvenser det har för forskningen (både dess metoder och kvalitet!) om man helt överger kvalitativa metoder till fördel för kvantitativa (skalan är i praktiken alltid glidande, förstås, men förskjutningen är enorm). I synnerhet i ett läge då vi inte riktigt ännu ser hur t ex topic modelling kunde användas för att hjälpa med att förbättra relevans i fulltextsökningarnas resultat.

En grundläggande poäng inom digital humaniora är nämligen att man för att kunna göra tillförlitlig forskning helst ska kunna belägga ett påstående med flera olika metoder. Detta av den enkla orsaken att det ofta kan vara det i praktiken enda fungerande sättet att testa metoder, dvs de algoritmer som ligger i grunden för forskningen (= en del av forskningsmetoden som ofta är ogenomskinlig). Om man väljer bort att jämföra/beakta resultaten fulltext/indexerade material är frågan om man försämrar forskningens trovärdighet med 50 eller 100%. Tillspetsat. I alla fall är detta något man bör vara medveten om, i fall man beslutar att lägga ner indexeringsverksamheten vid Brages Pressarkiv - som är mycket förmånlig och av god kvalitet.

Jag har gjort vad jag kan för saken. Nu är det upp till dem som ska ta eller kan påverka besluten vid SLS, ministeriet, Nationalbiblioteket osv. Jag kan bara hoppas man inser vidden av konsekvenserna för forskning och kulturarv när man fattar besluten. Vad är god framtida forskning och finlandssvenskt digital kulturarv värda för oss?

Inga kommentarer:

Skicka en kommentar