Freebase beskrivs som en “öppen, gemensam databas över världens kunskap”.
Men det är inte en ny Wikipedia. Snarare är Wikipedia bara en av flera informationskällor för Freebase.
Medan Wikipedia är ett uppslagsverk för människor kan Freebase snarare beskrivas som ett uppslagsverk för datorer.
Ytterst handlar förstås även Freebase om att bättre hitta information åt människor. Och för det krävs bättre kopplingar mellan bitar av information. Att information som hör ihop kopplas samman. Och framförallt att det beskrivs på vilket sätt den hör ihop.
Den semantiska webben, med andra ord.
Klassificerad information
Tim O’Reilly ger ett utförligt exempel. Han söker på sitt företag, O’Reilly Media, och hittar en post i databasen som innehåller ett foto på företagets byggnad samt ett utdrag från Wikipedia.

Så långt är det inte så intressant. Fotot har tydligen laddats upp av någon och Freebase syndikerar överensstämmande artiklar från Wikipedia.
Mer intressant är att posten för O’Reilly Media klassificerats som “ett företag”. Jag antar att det är en användare som gjort denna klassificering.

Med typen “företag” är förknippat en uppsättning egenskaper som också kan fyllas i. Det är information såsom när företaget grundades, vilken bransch det är verksamt i, vilken årsomsättningen är osv.
Semantiska kopplingar
Varje av dessa egenskaper är “typade”, dvs. att informationen som anges inte enbart är fritext. För årsomsättning är t.ex. typen “Money value”, för bransch är den “Industry”, för antal anställda är den “Dated integer” (dvs. att det anges när i tiden siffran gällde).
Poängen med typade egenskaper är att kopplingen mellan information ska vara “semantiskt rik”. En annan egenskap för ett företag är dess nyckelpersoner. Här är typen “Employment tenure”, vilket verkar innebära att man dels pekar ut en person och dels anger befattning. Tim O’Reilly listas som företagets vd.
Om vi tänker oss att vi tittar på posten för Tim O’Reilly själv så borde man se honom klassificerad som “en person”. Man skulle också se att han är vd på företaget O’Reilly Media, eftersom han pekats ut som nyckelperson för företaget.
Vad är då poängen med det här? All denna information finns redan på Wikipedia och genom att gå dit och söka skulle man kunnat ta reda på exakt detta.
Skillnaden är att datorer inte kan gå till Wikipedia och dra dessa slutsatser. Och det är det som den semantiska webben är tänkt att råda bot på.
Ett Wikipedia för maskiner
Tanken med den semantiska webben är att gå bortom att bara presentera information så som det görs på Wikipedia idag. Och på alla andra webbplatser för den delen. Tanken är att dessutom beskriva samma information så att den kan tolkas maskinellt. “Denna webbsida handlar om företaget med namnet ‘O’Reilly Media’, vars nyckelpersoner är personen med namnet ‘Tim O’Reilly’, med befattningen ‘vd’, med flera, verksamt i branschen ‘förlagsbranschen’ osv.”
Freewebs lösning på den semantiska webben är istället att centralt samla den semantiska informationen, alltså informationen som beskriver vad det är för information och hur den hänger ihop med annan information. Och att Freewebs användare bygga upp denna information i stället för att förlita sig på att alla som publicerar information också beskriver dess semantik.
Denna lösning verkar onekligen mer realistisk. Kan du se framför dig att varje bloggare, varje kommunal webbredaktör, varje tonåring som laddar upp filmklipp på Youtube – kort sagt att alla som publicerar information på nätet skulle ta sig tid att beskriva informationen i den här utsträckningen?
Samtidigt är det ett enormt ambitiöst projekt. Men det kan fungera, givet att Wikipedia lyckats komma dit de är idag med en teknisk plattform som utesluter alla förutom de mest hängivna geeksen. Av de skärmdumpar som Tim O’Reilly postat så är det tveklöst mycket mer tillgängligt.
Konsensus eller folksonomi
Frågan är bara hur långt Wikipedia-liknelsen kan dras. Wikipedias modell bygger på konsensus, dvs. att man enas om vad som stämmer, vad som är sant. Denna modell fungerar bättre i vissa sammanhang, men när det gäller omstridda ämnen blir det svårare, som Israel-/Palestinakonflikten.
Av Tim O’Reillys text att döma så satsar Freeweb inte på konsensus. Han skriver att de istället går folksonomi-vägen, dvs. att man tillåter människor att klassificera saker på det sätt som är meningsfullt för dem. Det kommer att vara motsägelsefullt men man sätter sitt hopp till att det ska gå att avgöra vad sanningen är efter att flera har klassificerat något. Om banan är en frukt enligt 150 av 200 människor så är det en frukt och inte ett bär.
Än så länge finns inte så mycket detaljer om Freeweb. Förutom Tim O’Reillys inlägg finns en artikel i New York Times. Det har givetvis börjat snackas bland bloggar men jag har inte hittat något ännu med mer information.
Främsta anledningen till att jag är intresserad är egentligen att det är Danny Hillis som ligger bakom. Han är en av mina hjältar och inget mindre än ett geni. Min uppfattning är att hans drivkraft är att skapa saker som är av verkligt värde för människor, han är inte intresserad av att piska upp hajp.
Det ska bli mycket intressant att se hur det här utvecklar sig.

Comments