Forumsvar skapade
-
FörfattareInlägg
-
petronella
MedlemEtt väldigt bra sätt att få en uppfattning om träffens relevans vore om man fick se artikelrubriken. Men detta kanske är svårt, exv. för att rubrikerna har varit svåra för texttolkningen att klara av?
juli 3, 2014 kl. 1:09 e m som svar på: Information om databasen, för att bättre kunna bedöma det man hittar #212petronella
Medlemparnil wrote:Alla text i tidningen som OCR-programvaran har lyckats tolka finns med och är sökbara i systemet. Det gäller alltså vanlig brödtext och textannonser i ”normala” typsnitt, men min erfarenhet är att programvaran försöker (och till en del lyckas) med att tolka även ”text i bild”. Däremot har OCR-programmet haft svåra problem med rubriker och annan onormalt stor text, men där har vi redan vissa lösningar i produktionssystemet.I uppmärkningen saknar vi markörer för att skilja redaktionell text från t.ex. tv-tablåer, men vi har redan diskuterat möjligheten att i söksystemet skapa den uppdelning som saknas i den uppmärkta texten. Det vore förstås mycket värdefullt att kunna utesluta t.ex. tablåer eftersom de ofta ger många skräpträffar. Jag gissar att det är svårare att göra en uppdelning mellan textannonser och redaktionell text, i synnerhet i äldre material.
Pär Nilsson / KB-Dagstidningar
Intressant. Tack för info.
juli 3, 2014 kl. 1:07 e m som svar på: Information om databasen, för att bättre kunna bedöma det man hittar #211petronella
Medlemparnil wrote:Hej!Vad jag kan se är det antalet sidor som man har fått åtminstone en träff på. Formuleringen borde alltså kanske istället vara ”Din sökning på palme gav 1927 träffar på 1373 sidor i 1024 tidningsnummer”. Det skulle onekligen vara mer exakt, men kanske samtidigt möjligen lite mer svårläst?
Vad sägs isåf om att fila på formuleringen.
”Din sökning på palme gav 1927 enskilda träffar, fördelade på 1373 sidor i 1024 tidningsnumer.”
Att stapla siffrorna under varandra ökar också överskådligheten.
1927 träffar på ordet, fördelade på:
1373 sidor
1024 nummerMan kan ju också ”gömma undan” sån info som man tror blir ”för mycket” för de flesta, men så den går att hitta för den som är intresserad.
petronella
MedlemMå vara att jag kanske inte hittar artikeln i er mikrofilmsläsesal, men den går väl att hitta på annat håll. Inte alla bor i Stockholm. Folk kommer att gå även till bibliotek i Göteborg, Lund och Härnösand för att hitta gamla artiklar. Misstänker dessutom att om jag går till Stockholms stadsbibliotek och frågar efter en Aftonbladet från 1947, så hjälper de mig.
Om inte alls finns med blir det svårare att leka språkforskare. Jag förstår att proffsen på svenskainstitutionerna har andra verktyg, men detta är ett jätteroligt verktyg för svenskalärare på gymnasiet. Det är då en fördel om materialet är representativt, och inte baserat på vad som går att läsa i sal på KB.
Det bör gå att i text upplysa om vad som finns och inte finns tillgängligt i sal på KB, tänker jag.
petronella
MedlemMin IE 11 klarar det (liksom min Chrome och FF).
petronella
MedlemVerkar vara SvD som saknas
http://tidningar.kb.se/?q=avhandling&from=1947-01-01&to=1948-01-01 <= bara Aftonbladet.juli 1, 2014 kl. 4:22 e m som svar på: Information om databasen, för att bättre kunna bedöma det man hittar #209petronella
MedlemEn sak man också undrar är om alla ord som är tryckta i tidningen ingår i textdatabasen. TV-tablåer gör det uppenbarligen. Vad med annonser?
juli 1, 2014 kl. 10:31 f m som svar på: Information om databasen, för att bättre kunna bedöma det man hittar #206petronella
MedlemEller kanske rabbla datum på tidningarna som ingår, så man ser om något saknas. Vissa datum, större helgdagar, saknas av naturliga skäl men det får man väl haja själv.
petronella
Medlemparnil wrote:Klart intressant iakttagelse. Vi får försöka undersöka saken djupare, men spontant tycker jag att den skarpa dippen på 1980-talet känns märkligare än den på 1940-talet, då det skulle kunna röra sig om en viss dipp i antalet sidor. Eftersom vi än så länge har bara två titlar i tjänsten kan det också bero på att endera titeln av någon anledning saknas.Bägge tidningarna borde inte samtidigt drastiskt minska och öka sidantalet sidor. Att endera titeln saknas vore mest logiskt med tanke på dippens knivskarpa gränser.
petronella
MedlemAha, det är relevanssortering. Okej, det är en rimlig hållning. Isåf bör det tydligare framgå att det är relevanssortering det är. Eftersom träffarna är så ruggigt svåra att utvärdera (de flesta kommer man ju inte in på) blir intrycket ”slumpmässig ordning”.
petronella
MedlemHåller med. Tidsordning som default vore iaf rätt logiskt.
petronella
MedlemJag syftar alltså inte på formuleringen här i forumet utan på den text som dyker upp när jag klickar på ett söksvar från modern tid. ”Upphovsrättsskyddat material, kan endast läsas på Kungl. Biblioteket”.
”Upphovsrättsskyddat svar, tillhandahålles ej på webben”, ”KB tillhandahåller dessa träffar/svar (etc) endast på Kungl. Biblioteket” e.dyl. är formuleringar varmed ni undgår att göra reklam för vad andra bibliotek kan erbjuda utan att ljuga. Fast egentligen tycker jag att ni gott kan bjuda på en upplysning om det, i folkbildningens tjänst.
petronella
MedlemAnnali, lyckas du avgränsa sökningen i tid med den där månad-för-månad-stegningen? I så fall kan du förmodligen även bläddra mellan åren – klicka på årtalet i kalendern. Det är inte så lätt att hitta. Själv lyckas jag bläddra men det påverkar inte sökresultaten. Det enda sätt att tidsavgränsa sökningen som jag får att funka är att klicka på staplar i histogrammet och välja ett år eller en månad.
petronella
MedlemDet ser ut som att man ska kunna avgränsa en redan gjord sökning m.a.p. tid? men jag kan inte få det att fungera. Alla artiklar visas fast jag gjort en tidsavgränsning. Gränssnittet för tidsavgränsningen är inte heller så intuitivt, det tog en god stund att hitta hur jag kan bläddra årtalen. Det går iofs att lösa med kompletterande skriftliga instruktioner.
-
FörfattareInlägg