Informationshåndtering

Nogle ideer til hvordan man kan håndtere og indeksere information på sin computer.

Mange folk har efterhånden fået samlet så meget information på deres computere at de af og til har svært ved at finde det de har brug for. Det ville det være rart at få gjort noget ved, så jeg har prøvet at samle nogle ideer til et værktøj der kan afhjælpe problemet uden at give køb på de fordele - eller i det mindste vaner - vi har af vores eksisterende (Unix-) systemer.

Det er nødvendigt at information om de filer der ligger på computeren bliver lagret i en struktureret form (det vil sige i en database). Her er det en liste med information jeg kan forestille mig det kunne være interessant at søge i:

Så meget som muligt af denne information skal automatisk trækkes ud af filerne, men brugeren skal selvfølgelig have adgang til at rette systemets bud på hvad der skal stå i de forskellige felter.

Det bør overvejes nøje hvornår og hvordan systemet skal spørge brugeren efter information om filerne. På den ene side er det ikke så nyttigt, hvis der ikke er komplet information, men på den anden side kan det tage tid at svare på de spørgsmål systemet måtte stille. Det skal måske implementeres således at alle nye filer i første omgang blot føjes til en kø med ukategoriserede data som brugeren ved en passende lejlighed kan gøre noget ved? Vil det hjælpe hvis ukategoriserede filer passer på alle søgninger?

Man bør indføre en slags enkeltstående bogmærker som alternativer til browsernes bogmærkefiler. Både enkeltstående bogmærker og bogmærkerne i browsernes bogmærkefiler bør håndteres som om de er de filer de henviser til.

tar-, zip- og postkassefiler - såvel som andre sammensatte filtyper - bør indekseres både som samlede enheder og som de individuelle filer de indeholder.

Hvis det kan lade sig gøre bør indekseringssystemet få information direkte fra filsystemet hver gang en fil oprettes, ændres eller slettes. Sekundært bliver indekseringssystemet nødt til med jævne mellemrum at gennemgå filsystemet for ændringer.

Det er strengt nødvendigt at der kommer til at være en eller anden form for adgang til at snakke med systemet på kommandolinien. Og den bør selvfølgelig inkludere filnavnsudfyldning.

Det bør overvejes om man kan implementere et virtuelt filsystem til at formulere opslag i databasen. Det ville for eksempel være praktisk, hvis man kunne have en dialog i stil med den følgende i sin foretrukne kommandofortolker (brugerens tastetryk er fremhævede).

$ xv /db<tab>
[ programmet `xv` kan kun indlæse billeder ]
$ xv /db/.filtype/billede/.ka<tab>
$ xv /db/.filtype/billede/.kategori/L<tab>
Vælg: L(i)nux
      L(E)GO
$ xv /db/.filtype/billede/.kategori/Li<tab>
$ xv /db/.filtype/billede/.kategori/Linux/T<tab>
$ xv /db/.filtype/billede/.kategori/Linux/Tux.png &<enter>
[1] 12683
$ 

Et andet eksempel:

$ ls /db/.fo<tab>
$ ls /db/.forfatter/Pet<tab>
$ ls /db/.forfatter/Peter 
Vælg: Peter (M)akholm
      Peter (T)oft
$ ls /db/.forfatter/Peter M<tab>
$ ls /db/.forfatter/Peter Makholm/.ka<tab>
$ ls /db/.forfatter/Peter Makholm/.kategori/St<tab>
$ ls /db/.forfatter/Peter Makholm/.kategori/Standarder/<enter>
Hvorfor åbne standarder (webside)
Frie standarder (brev, 2001.08.12, 12:23)
Frie standarder (brev, 2001.08.12, 13:10)
$ 

Princippet i de ovenstående eksempler er:

Det ville i øvrigt være praktisk hvis filsystemerne kunne tage sig af at lagre lidt mere af den helt grundlæggende information om filer (for eksempel filtype, kodning sprog, forfatter, stikord og beskrivelse).

-- 

Skrevet af:
Jacob Sparre Andersen <jacob@jacob-sparre.dk>
Inspiration:
"Information retrieval from $HOME" (Freshmeat, 2001-08-28)
Senest opdateret:
27. juni 2008