W3C

W3C skapar dataåtkomst på webben med SPARQL

Kraftfull teknologi för frågor mot distribuerad och heterogen data

Kontaktpunkt Amerika, Australien --
Ian Jacobs, <ij@w3.org>, +1.718.260.9447 eller +1.617.253.2613
Kontaktpunkt Europa, Afrika och Mellanöstern --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(finns även på engelska, franska och japanska; dessutom i översättningar till andra språk)http://www.w3.org/ -- 15 januari 2008 -- W3C publicerar idag SPARQL, en fundamental standard för att komma åt data i den semantiska webben. Med frågeteknologin SPARQL (uttalas "sparkel"), kan användare nu fokusera på vilken information de behöver, istället för att bekymra sig om den databasteknologi och de dataformat som används bakom kulisserna för att lagra data. Då frågor i SPARQL uttrycker högnivåmål, så blir det lättare att utnyttja nya datakällor och att använda dem i nya tillämpningar.

"Att använda den semantiska webben utan SPARQL är som att använda relationsdatabaser utan SQL", förklarar Tim Berners-Lee, ledare för W3C. "SPARQL gör det möjligt att hämta information från databaser och andra typer av informationskäller på webben".

Det finns redan 14 implementationer av SPARQL, flera av vilka är tillgängliga som öppen källkod.

SPARQL eliminerar traditionella frågespråks begränsning till lokal sökning och ett format

Det finns många bra frågespråk, bland annat standarder som SQL och XQuery. Dessa har huvudsakligen använts för att ställa frågor mot specifik sökmotor, format, typ av information eller lokal databas. Det har vanligtvis varit nödvändigt att formulera samma högnivåfråga på olika sätt, beroende på vilken tillämpning som den används i och hur relationsdatabasen har konfigurerats. Och när man behöver samtidigt ställa frågor mot olika datakällor, så har det varit nödvändigt att konstruera logik som sammanställer resultaten. Dessa begränsningar har orsakat högre utvecklingskostnader och skapat hinder för att utnyttja nya datakällor.

Målet med den semantiska webben är att användare ska kunna dela, sammanställa och återanvända data på ett globalt sätt. SPARQL har konstruerats för att kunna fungera storskaligt -- som på webben -- och alltså möjliggöra frågor mot distribuerade datakällor, oberoende av format. Med SPARQL blir det lättare att skapa en fråga som kan användas mot olika datakällor, implementeringskostnaderna minskar, och mer informationsrika resultat erhålls.

Eftersom SPARQL inte är knutet till något speciellt databasformat, så kan det användas för att dra nytta av lavinen av webb 2.0-data, och knyta samman med andra resurser på den semantiska webben. Då heterogena datakällor kanske inte representerar data i samma format, eller med samma datamodell, så har SPARQL skapats för att kunna ställa frågor mot data som inte ensats.

SPARQL gör dataaccess till en webbtjänst

Med kombinationen av SPARQLs frågespråk och dess protokoll skapas i princip en renodlad webbtjänst -- då den körs ovanpå HTTP eller SOAP erbjuder den en tjänst till allt som vill ställa frågor.

"SPARQL:s fokus på att ställa frågor mot datamodeller sparar tid för utvecklare; det finns inget behov av att sjösätta en armada av små webbtjänster för att stödja olika perspektiv på information" förklarar Lee Feigenbaum, ledare för arbetsgruppen "RDF Data Access". "Därför kan en användare av SPARQL ställa godtycklig fråga -- det kan liknas vid att användaren skapar sina egna gränssnitt istället för att arbeta med en begränsad uppsättning givna tjänster".

Specifikationen SPARQL definierar ett frågespråk och ett protokoll, och fungerar tillsammans med andra nyckelteknologier i den semantiska webben: Resource Description Framework (RDF) för att representera data; RDF Schema (RDFS); Web Ontology Language (OWL) för att bygga terminologier; och Gleaning Resource Descriptions from Dialects of Languages (GRDDL), för att automatiskt extrahera semantisk data från dokument. SPARQL använder även andra W3C-standarder som utnyttjas i implementationer av webbtjänster, såsom Web Services Description Language (WSDL).

I W3C:s arbetsgrupp för dataåtkomst finns ledande databasleverantörer och utvecklare av webbtillämpningar

W3C:s arbetsgrupp "RDF Data Access" har tagit fram de tre standardokumenten (W3C Recommendations) som publiceras idag: SPARQL Query Language for RDF, The SPARQL Protocol for RDF, och SPARQL Query Results XML Format. I arbetsgruppen har ingått inbjudna experter och deltagare från Agfa-Gevaert N. V.; Asemantics S.R.L.; Clark & Parsia LLC; Cleveland Clinic; Eindhoven University of Technology; Free University of Bozen-Bolzano; Garlik; HP; IBM Corporation; Matsushita Electric Industrial Co., Ltd. (MEI); Nippon Telegraph & Telephone Corp. (NTT); OpenLink Software; Oracle och Profium, Ltd. På sidan med stöduttalande om SPARQL återges utsagor som stöder detta arbete, och avsiktsförklaringar om att implementera dessa nya standarder.

W3C fortsätter arbetet med att stärka sambandet mellan den semantiska webben och traditionella databaser; se t.ex. rapporten från W3C:s workshop om användning av RDF för relationsdatabaser (oktober 2007).

Om World Wide Web Consortium [W3C]

W3C är ett internationellt konsortium där konsortiets medlemmar, en heltidsanställd stab och andra intresserade arbetar tillsammans för att utveckla webbstandarder. W3C:s huvudsakliga verksamhet är att ta fram webbstandarder samt riktlinjer, råd och anvisningar som säkerställer webbens långsiktiga tillväxt. Fler än 400 organisationer är medlemmar i konsortiet. W3C drivs gemensamt av MIT Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med högkvarter i Frankrike, och Keio University i Japan, samt har ytterligare regionala kontor världen runt. Mer information finns på http://www.w3.org/