Sökmotorer är inte smartare än den data som petas in i den

Funderar du på att använda en egen sökmotor till din webbplats? Tänk på att en sökmotor aldrig kan bli smartare än den data som den indexerar.

Ett vanligt exempel jag ofta sett är sökmotorer på e-butiker som säljer vissa typer av produkter. Ofta kan man söka efter produktnamn, beskrivning och artikelnummer. Men om man söker efter ”kameror” eller ”cyklar” så hittar sökmotorn ingenting. Den är konstruerad att leta efter produkter, inte typer av produkter.

Att tro att man kan installera en sökmotor och låta den sedan sköta sig självt är naivt. Den behöver matas med nyttig information hela tiden. En sökmotor är mycket mer komplicerad än att matcha ord med varandra.

Jag testade dessa exempel:

Sök efter ”köksmöbler” på Ikea.se. ”Inga träffar” blir svaret. Naturligtvis finns det massor av köksmöbler hos Ikea, men man måste använda navigationen för att se dem. Sökmotorn klarar bara specifika produkter, vilket jag sällan lägger på minnet (undantaget bokhyllan Billy som jag av någon anledning alltid kommer ihåg).

Sedan har vi ett annat problem. Variationer av ord. Vanligtvis när jag söker använder jag pluralis, ”kameror” i stället för ”kamera”. Problemet med produkter är att produkten i sig är en ”kamera” och därför genererar inga träffar när man söker efter ”kameror”.

För att komma runt det här problemet (bland många andra) brukar man använda en kontrollerad vokabulär. Det är en sorts ordlista som beskriver vilka ord som ska användas, variationer av ordet, synonymer och besläktade ord. Det ger också en hjälp när man skriver texter, eftersom föreslagen stavning och böjning av ord kan ge texterna ett mer enhetligt intryck.

Vanligtvis brukar man ta varje produkt och koppla den till en post i vokabulären. Men en sådan koppling är inte nödvändig. Det går också att låta sökmotorn leta efter besläktade ord automatiskt. När användaren skriver ”kameror” i sökrutan utvidgar sökmotorn resultat till ”kamera, kompaktkameror, digitalkameror, filmkamera, videokamera, systemkamera och fotoapparat”. Även om ordet ”kameror” aldrig förekommer i någon text, kan sökmotorn hitta det användaren letar efter ändå. Magiskt.

Nya problem uppstår givetvis då. ”Fil” är ett ord som kan betyda många saker (en så kallad homonym). Vad sägs om datafil, vägfil, filmjölk, bågfil med flera. En sökmotor kan inte veta vilken betydelse du letar efter.

Mer om kontrollerade vokabulärer i framtida artiklar.