W3C

W3C fullbordar bryggan mellan HTML/mikroformat och den semantiska webben

GRDDL skapar kopplingspunkter i webbinnehåll -- ger kraftfull återanvändning och dataintegration

Kontaktpunkt Amerika, Australien --
Janet Daly, <janet@w3.org>, +1.617.253.5884 eller +1.617.253.2613
Kontaktpunkt Europa, Afrika och Mellanöstern --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(finns även på engelska, franska och japanska; dessutom i översättningar till andra språk)

Pressrelease | W3C arkiv med pressreleaser (på engelska) | dito (på svenska)


http://www.w3.org/ -- 11 september 2007 -- Idag har World Wide Web Consortium fullbordat en viktig länk mellan den semantiska webben och mikroformat. Med "Gleaning Resource Descriptions from Dialects of Languages", eller GRDDL (uttalas "griddel"), kan nu programvara extrahera information från strukturerade webbsidor, så att de blir del i den semantiska webben. De som är vana att uttrycka strukturerad data med mikroformat i XHTML kan alltså få ytterligare mervärde av existerande data genom att det i den semantiska webben -- till en mycket liten kostnad.

"Ibland kan en rad kod göra stor skillnad", säger Tim Berners-Lee, ledare för W3C. "På samma sätt som formatmallar gör webbsidor mer läsbara för människor, så gör GRDDL att webbsidor, mikroformat-taggar, XML-dokument och data blir mer läsbara för tillämpningar i den semantiska webben, vilket skapar nya möjligheter och stöder kreativ återanvändning".

Få data in och ut ur webben -- hur sker det idag?

Det som ofta kallas "Web 2.0", handlar om att tillämpningar kombinerar -- i form av "mashups" -- olika typer av data som finns ute på webben. Ett flertal aktiva grupper som innoverar på webben, har samma mål att dela data, såsom kalenderinformation, kontaktinformation och geopositionsinformation. Dessa grupper har utvecklat olika socialt orienterade arbetssätt och teknologier som tillfredsställer deras speciella behov. Till exempel så har sökmotorer gett bättre resultat genom att använda statistiska metoder, medan människor som delat foton på webben har funnit att det är praktiskt att manuellt tagga sina foton med korta ord. Mycket av detta arbete har fångats upp som "mikroformats". Med mikroformat menas en uppsättning enkla öppna dataformat som bygger på existerande och redan vitt spridda standarder, såsom HTML, CSS och XML.

Denna våg av av intresse och aktivitet har direkta kopplingar till innebörden av den semantiska webben. Grupper ("communities") som sysslar med den semantiska webben har utforskat olika sätt att förbättra datas kvalitet och tillgänglighet på webben, vilket öppnar upp för mer intensiv dataintegration och mer mångsidiga tillämpningar som kan skala upp till webbens storlek, och som möjliggör ännu mer kraftfulla "mashups". Den uppsättning webbaserade standarder som stöder detta arbete kallas den semantiska webbstacken. Grunderna i denna stack svarar upp mot krav på entydighet -- vilket krävs av vissa tillämpningar, såsom i den finansiella sektorn -- och att kunna hantera stora datavolymer -- t.ex. inom den medicinska sektorn.

Varje ansats att "få ut data i den digitala rymden" har sina användningsområden. Men varför begränsa sig till enbart en ansats, om man kan få nytta av att -- för en låg kostnad -- kunna använda flera? Då användare av mikroformat vill kunna stödja annan användning av given data, användning som kräver datamodellering och datavalidering, hur kan de då dra nytta av sina data i mer strikta tillämpningssammanhang?

En brygga från flexibla webbtillämpningar till den semantiska webben

GRDDL är bryggan som omformar XML-baserad data (såsom XHTML) till data i den semantiska webben. Med GRDDL kan skapare av innehåll transformera data de vill dela med andra, till ett format som kan användas och transformeras ytterligare så att de kan användas i mer kritiska tillämpningar.

GRDDL användningsfall ger en inblick i varför detta är användbart, genom att beskriva ett antal realistiska scenarios, bl.a. schemaläggning, produktjämförelser, e-undervisning. När väl data är del i den semantiska webben så kan den vävas samman med annan data (t.ex. från en relationsdatabas) och bearbetas med frågor, bearbetning och konvertering till andra format.

Arbetsgruppen för GRDDL har beskrivit implementationserfarenheter, och dess medlemmar har offentliggjort uttalanden om stöd av GRDDL.

Dokumentation om testfall för GRDDL har också publicerats idag, vilken bl.a. beskriver testfall för tillämpningar som skall stödja GRDDL. Arbetsgruppen har konstruerat en GRDDL-tjänst, där användare kan mata in en GRDDL-annoterad fil och extrahera viktiga data.

Om World Wide Web Consortium [W3C]

W3C är ett internationellt konsortium där konsortiets medlemmar, en heltidsanställd stab och andra intresserade arbetar tillsammans för att utveckla webbstandarder. W3C:s huvudsakliga verksamhet är att ta fram webbstandarder samt riktlinjer, råd och anvisningar som säkerställer webbens långsiktiga tillväxt. Fler än 400 organisationer är medlemmar i konsortiet. W3C drivs gemensamt av MIT Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med högkvarter i Frankrike, och Keio University i Japan, samt har ytterligare regionala kontor världen runt. Mer information finns på http://www.w3.org/