W3C

World Wide Web Consortium publicerar första version av GRDDL

GRDDL knyter samman semantiska webben med mikroformat

Kontaktpunkt Amerika, Australien --
Janet Daly, <janet@w3.org>, +1.617.253.5884 eller +1.617.253.2613
Kontaktpunkt Europa, Afrika och Mellanöstern --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(finns även på engelska, franska och japanska; dessutom översättningar till andra språk)


http://www.w3.org/ -- 24 oktober 2006 -- World Wide Web Consortium har byggt en bro mellan den semantiska webben och mikroformatvärlden. Med hjälp av "Gleaning Resource Descriptions from Dialects of Languages", eller GRDDL (uttalas "griddel"), kan programvara automatiskt extrahera information från strukturerade webbsidor och därmed göra sådana sidor del av den semantiska webben. De som är vana vid att uttrycka strukturerade data med mikroformat i XHTML kan nu öka värdet av sina existerande data genom att med begränsad insats få dem att fungera i den semantiska webben.

W3C öppnar nu upp för granskning av detta första offentliga Working Draft, utgiven av arbetsgruppen för GRDDL.

Olika behov, olika sätt att uttrycka data

Under senare tid har det dykt upp tillämpningar -- s.k. "mash-ups" -- på webben som kombinerar olika typer av data från olika webbplatser. Ett antal banbrytande grupper av webbintresserade har den gemensamma visionen om att kunna dela och återanvända data såsom kalenderinformation, kontaktinformation och geografisk information. Dessa grupper har utvecklat olika förhållningssätt och teknologier som stöder deras speciella behov. Medan sökmotorer har haft stor framgång med sin användning av statistiska metoder, så har t.ex. människor som delar foton tyckt att det är mer givande att märka upp sina foton manuellt med korta textsträngar. En stor del av aådant arbete kan fångas upp av "mikroformats". Med mikrofomat menas en uppsättning enkla, öppna dataformat som bygger på existerande standarder med bred acceptans -- såsom HTML, CSS och XML.

Denna trend kan direkt relateras till grundläggande idéer i den semantiska webben. Grupper som utgår från den semantiska webben har arbetat på olika sätt med att förbättra kvalitet och tillgång till data på webben, och detta lägger grunden för mer omfattande integration av data och för mer mångsidiga tillämpningar som skalar upp med webben, och som möjliggör ännu mer kraftfulla mash-ups. Den uppsättning av webbstandarder som stöder sådant arbete kallas den semantiska webb-stacken. Den tydligt definierade basen för denna stack stöder de formella krav som ställs på tillämpningar inom t.ex. den finansiella sektorn eller den medicinska sektorn.

Varje sätt att "få ut dina data på webben" har sin användning. Men varför begränsa sig till ett enda sätt om man kan dra fördel av flera olika sätt? När användare av mikroformat ser på användningar som kräver mer datamodellering -- eller validering -- hur kan de då dra nytta av sina data i mer formella tillämpningar?

Brygga från flexibla webbtillämpningar till semantiska webben

GRDDL är bryggan som avbildar data i XML-format (t.ex. XHTML) till den semantiska webben. Med hjälp av GRDDL kan författare transformera den data de vill dela med sig, till ett format som kan användas direkt eller kanske transformeras igen om tillämpningar så kräver.

Den nyligen publicerade GRDDL användninsfall ("GRDDL use cases") beskriver det mervärde GRDDL ger, i form av ett antal scenarier -- såsom planera möten, jämföra utbud från olika leverantörer inför köp, extrahera information från wikis som stöd för inlärning. När väl data blivit del av den semantiska webben så kan de kombineras med andra data (t.ex. från relationsdatabaser som exponerats för den semantiska webben) och sökas med hjälp av frågor, härledningar och konvertering till andra format.

Dokumentet GRDDL Primer beskriver ett flertal praktiska exempel på hur man kan använda GRDDL på vanliga XHTML-dokument som använder mikroformat. Det krävs inte omfattande anpassning av dagens författarmetoder för att använda GRDDL; det krävs bara smärre förändringar i existerande dokument. GRDDL är däför redo att användas, och kräver bara en minimal insats.

Om World Wide Web Consortium [W3C]

W3C är ett internationellt konsortium där konsortiets medlemmar, en heltidsanställd stab och andra intresserade arbetar tillsammans för att utveckla webbstandarder. W3C:s huvudsakliga verksamhet är att ta fram webbstandarder samt riktlinjer, råd och anvisningar som säkerställer webbens långsiktiga tillväxt. Fler än 400 organisationer är medlemmar i konsortiet. W3C drivs gemensamt av MIT Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med högkvarter i Frankrike, och Keio University i Japan, samt har ytterligare regionala kontor världen runt. Mer information finns på http://www.w3.org/