petronella

Forumsvar skapade

Visar 14 inlägg - 1 till 14 (av 14 totalt)
  • Författare
    Inlägg
  • som svar på: Markering av söktermer på tidningssidan #160
    petronella
    Medlem

    Ett väldigt bra sätt att få en uppfattning om träffens relevans vore om man fick se artikelrubriken. Men detta kanske är svårt, exv. för att rubrikerna har varit svåra för texttolkningen att klara av?

    petronella
    Medlem
    parnil wrote:
    Alla text i tidningen som OCR-programvaran har lyckats tolka finns med och är sökbara i systemet. Det gäller alltså vanlig brödtext och textannonser i ”normala” typsnitt, men min erfarenhet är att programvaran försöker (och till en del lyckas) med att tolka även ”text i bild”. Däremot har OCR-programmet haft svåra problem med rubriker och annan onormalt stor text, men där har vi redan vissa lösningar i produktionssystemet.

    I uppmärkningen saknar vi markörer för att skilja redaktionell text från t.ex. tv-tablåer, men vi har redan diskuterat möjligheten att i söksystemet skapa den uppdelning som saknas i den uppmärkta texten. Det vore förstås mycket värdefullt att kunna utesluta t.ex. tablåer eftersom de ofta ger många skräpträffar. Jag gissar att det är svårare att göra en uppdelning mellan textannonser och redaktionell text, i synnerhet i äldre material.

    Pär Nilsson / KB-Dagstidningar

    Intressant. Tack för info.

    petronella
    Medlem
    parnil wrote:
    Hej!

    Vad jag kan se är det antalet sidor som man har fått åtminstone en träff på. Formuleringen borde alltså kanske istället vara ”Din sökning på palme gav 1927 träffar på 1373 sidor i 1024 tidningsnummer”. Det skulle onekligen vara mer exakt, men kanske samtidigt möjligen lite mer svårläst?

    Vad sägs isåf om att fila på formuleringen.

    ”Din sökning på palme gav 1927 enskilda träffar, fördelade på 1373 sidor i 1024 tidningsnumer.”

    Att stapla siffrorna under varandra ökar också överskådligheten.

    1927 träffar på ordet, fördelade på:
    1373 sidor
    1024 nummer

    Man kan ju också ”gömma undan” sån info som man tror blir ”för mycket” för de flesta, men så den går att hitta för den som är intresserad.

    som svar på: Ofullständiga data från ett par årgångar #194
    petronella
    Medlem

    Må vara att jag kanske inte hittar artikeln i er mikrofilmsläsesal, men den går väl att hitta på annat håll. Inte alla bor i Stockholm. Folk kommer att gå även till bibliotek i Göteborg, Lund och Härnösand för att hitta gamla artiklar. Misstänker dessutom att om jag går till Stockholms stadsbibliotek och frågar efter en Aftonbladet från 1947, så hjälper de mig.

    Om inte alls finns med blir det svårare att leka språkforskare. Jag förstår att proffsen på svenskainstitutionerna har andra verktyg, men detta är ett jätteroligt verktyg för svenskalärare på gymnasiet. Det är då en fördel om materialet är representativt, och inte baserat på vad som går att läsa i sal på KB.

    Det bör gå att i text upplysa om vad som finns och inte finns tillgängligt i sal på KB, tänker jag.

    som svar på: Söksidan tidningar.kb.se #223
    petronella
    Medlem

    Min IE 11 klarar det (liksom min Chrome och FF).

    som svar på: Ofullständiga data från ett par årgångar #190
    petronella
    Medlem

    Verkar vara SvD som saknas
    http://tidningar.kb.se/?q=avhandling&from=1947-01-01&to=1948-01-01 <= bara Aftonbladet.

    petronella
    Medlem

    En sak man också undrar är om alla ord som är tryckta i tidningen ingår i textdatabasen. TV-tablåer gör det uppenbarligen. Vad med annonser?

    petronella
    Medlem

    Eller kanske rabbla datum på tidningarna som ingår, så man ser om något saknas. Vissa datum, större helgdagar, saknas av naturliga skäl men det får man väl haja själv.

    som svar på: Ofullständiga data från ett par årgångar #187
    petronella
    Medlem
    parnil wrote:
    Klart intressant iakttagelse. Vi får försöka undersöka saken djupare, men spontant tycker jag att den skarpa dippen på 1980-talet känns märkligare än den på 1940-talet, då det skulle kunna röra sig om en viss dipp i antalet sidor. Eftersom vi än så länge har bara två titlar i tjänsten kan det också bero på att endera titeln av någon anledning saknas.

    Bägge tidningarna borde inte samtidigt drastiskt minska och öka sidantalet sidor. Att endera titeln saknas vore mest logiskt med tanke på dippens knivskarpa gränser.

    som svar på: Sortering av söksvar #171
    petronella
    Medlem

    Aha, det är relevanssortering. Okej, det är en rimlig hållning. Isåf bör det tydligare framgå att det är relevanssortering det är. Eftersom träffarna är så ruggigt svåra att utvärdera (de flesta kommer man ju inte in på) blir intrycket ”slumpmässig ordning”.

    som svar på: Sortering av söksvar #169
    petronella
    Medlem

    Håller med. Tidsordning som default vore iaf rätt logiskt.

    som svar på: ”Kan endast läsas på Kungliga Biblioteket” #140
    petronella
    Medlem

    Jag syftar alltså inte på formuleringen här i forumet utan på den text som dyker upp när jag klickar på ett söksvar från modern tid. ”Upphovsrättsskyddat material, kan endast läsas på Kungl. Biblioteket”.

    ”Upphovsrättsskyddat svar, tillhandahålles ej på webben”, ”KB tillhandahåller dessa träffar/svar (etc) endast på Kungl. Biblioteket” e.dyl. är formuleringar varmed ni undgår att göra reklam för vad andra bibliotek kan erbjuda utan att ljuga. Fast egentligen tycker jag att ni gott kan bjuda på en upplysning om det, i folkbildningens tjänst.

    som svar på: Tidsavgränsning #132
    petronella
    Medlem

    Annali, lyckas du avgränsa sökningen i tid med den där månad-för-månad-stegningen? I så fall kan du förmodligen även bläddra mellan åren – klicka på årtalet i kalendern. Det är inte så lätt att hitta. Själv lyckas jag bläddra men det påverkar inte sökresultaten. Det enda sätt att tidsavgränsa sökningen som jag får att funka är att klicka på staplar i histogrammet och välja ett år eller en månad.

    som svar på: Tidsavgränsning #130
    petronella
    Medlem

    Det ser ut som att man ska kunna avgränsa en redan gjord sökning m.a.p. tid? men jag kan inte få det att fungera. Alla artiklar visas fast jag gjort en tidsavgränsning. Gränssnittet för tidsavgränsningen är inte heller så intuitivt, det tog en god stund att hitta hur jag kan bläddra årtalen. Det går iofs att lösa med kompletterande skriftliga instruktioner.

Visar 14 inlägg - 1 till 14 (av 14 totalt)