Om World Wide Web Consortium

SICS

SICS är ett av de lokala W3C-kontoren i Europa, Afrika och Asien.

W3C:s huvudnoder ligger i USA, Frankrike och Japan.




Nyhetsbrev






[info om nyhetsbreven]

W3C

Nyheter 2004-08-25


Detta nyhetsbrev från W3C/Sverige innehåller några påpekanden om nyheter från W3C, en kortare artikel om begreppet "den semantiska webben" och beskrivning av några uppstartade aktiviteter inom W3C. Dessutom lite informell information om fest och gala.

Innehåll



Nyheter på hemsidan

Nya W3C Recs, Proposed Recs, Candidate Recs, etc -- Speech Synthesis Markup Language, XHTML 2.0, m.m.


På lokalkontorets hemsida (och i nyhetsarkivet) kan du hitta annonseringar om nyheter från W3C, bland annat följande:

Nya Proposed Recommendations:

  • Speech Synthesis Markup Language

Nya arbetsdokument (Working Drafts):

  • XML Schema: Component Designators
  • XML Schema 1.1
  • Platform for Privacy Preferences (P3P) 1.1
  • XHTML 2.0
  • XQuery, XPath and XSLT
  • CSS3 Speech Module
  • System and Environment Framework
  • VoiceXML 2.1
  • Techniques for Web Content Accessibility Guidelines 2.0
  • Web Content Accessibility Guidelines 2.0
  • Representing Specified Values in OWL
  • RDF Data Access Use Cases and Requirements

Den semantiska webben

En funktionell infrastruktur för att dela data på webben


Författare: Eric Miller

I februari 2004 gav W3C sitt godkännande till två viktiga teknologier för den semantiska webben -- den reviderade Resource Description Framework (RDF) och Web Ontology Language (OWL). RDF och OWL är standarder inom den semantiska webben som erbjuder ett ramverk för innehållshantering, verksamhetsintegration samt delande och återanvändning av data på webben. Dessa standarder för att dela på data bryggar över gränser mellan tillämpningar, organisationer och användargrupper -- alla dessa olika typer av "användare" kan dela samma information, även om de inte utnyttjas samma slags programvara.

Annonseringen av detta godkännande markerar att den semantiska webben har etablerat sig som en produktionsmässig plattform för datahantering över webben. Användning av dessa standarder i kommersiella produkter och tjänster visar tydligt att teknologierna för den semantiska webben har tagit steget från att, under de senaste fem åren, vara ett avancerat forsknings- och utvecklingsprojekt, till att vara en praktisk teknologi tagen i användning i brett använda verktyg som gördet möjligt att på ett flexibelt sätt komma åt strukturerad data på webben.

Bland de programvaror för den semantiska webben som använder RDF och OWL återfinns:

  • Författarverktyg: författare kan knyta metadata (ämne, skapare, plats, språk, copyrightinformation och andra termer) till dokument, och samtidigt göra innehållet i dokumenten sökbara på nya kraftfulla sätt
  • Administreringsverktyg: stora webbplatser kan administreras dynamiskt enligt innehållskategorier som skräddarsys för webbplatsadministratörer.
  • Verktyg som drar nytta av både RDF och OWL: organisationer kan integrera verksamhetens tillämpingar, publicering och prenumeration, genom användning av flexibla modeller.
  • Dataåteranvändning över tillämpningsgränser: Formaten RDF och OWL är standardiserade, inte leverantörsberoende, vilket gör det möjligt att återanvända data som kommer från olika källor.

Många exempel på kommersiella tillämpningar och verksamhetsomfattande implementationer av dessa teknologier beskrivs på W3C:s sidor "RDF/OWL testimonial", "RDF Implementation" och "OWL Implementation" (se länkarna nedan).

Hur de olika delarna av den semantiska webben hänger samman - XML, RDF och OWL

Sättet på vilken den semantiska webben skapats är snarare evolutionärt än revolutionärt. Den semantiska webben växer fram genom stegvisa förändringar, genom att knyta maskinläsbara beskrivningar till den data och de dokument som redan finns på webben. Standarderna XML, RDF och OWL gör webben till en global infrastruktur i vilken man kan dela både data och dokument, vilket gör det lätttare och mer tillförlitligt att söka och återanvända information.

W3C:s aktivitet kring den semantiska webben (Semantic Web Activity) bygger på resultat från andra arbeten, såsom W3C:s aktiviteter kring XML och URI. Dess mål är att utveckla standarder och teknologier, vilka utnyttjar XML som syntax och URI för namngivning, och som underlättar delande och återanvändning av data på webben.

Dess fundament utgörs av XML, som erbjuder regler för hur man skapar vokabulärer, som i sin tur ger struktur åt både dokument och data på webben. XML ger entydiga grammatiska regler (syntaktiska regler), XML Schema fungerar sedan som en metod att kombinera XML-vokabulärer. XML är en kraftfull och flexibel ytsyntax för strukturerade dokument, men påtvingar inga semantiska hinder för hur man kan ger mening (semantik) åt dessa dokument.

RDF - Resource Description Framework - ger ett standardiserat sätt att beskriva alla typer av objekt. Det XML är för syntax, det är RDF för semantik - en tydlig mängd regler för hur man kan formulera enkla beskrivningar. RDF Schema ger sedan ett sätt för hur sådana beskrivningar kan knytas samman till en enda större vokabulär. RDF är integrerad i olika typer av tillämpningar, bl.a.:

  • bibliotekskataloger
  • globala register och databaser
  • syndikering och aggregering av nyheter, programvara och innehåll
  • egna personliga samlingar av musik, foton, och minnesvärda händelser.

I var och en av dessa används XML som en syntax för kommunicerad data, och URI för att namnge objekt. RDF-specifikationen utgör ett kraftfullt ramverk som stöder utbyte av kunskap på webben.

RDF är ett standardiserat sätt att konstruera enkla beskrivningar, RDF Schema ger ett sätt på vilket sådana beskrivningar kan sättas samman till en enda vokabulär. Vad som nu behövs är ett sätt att konstruera ämnesspecifika - eller domänspecifika - vokabulärer. Det är här ontologier kommer in. En ontologi definierar de termer som används för att beskriva och representera ett kunskapsområde. Ontologier används av människor, i databaser och i tillämpningar där man behöver dela ämnesspecifik information, såsom inom medicinen, verktygsindustrin, fastighetsmarknaden, bilindustrin och ekonomisk förvaltning. Ontologier innehåller definitioner av grundläggande begrepp i området och sambanden mellan dessa -- och dessa definitioner kan hanteras av en dator. De uttrycker såväl kunskap om ämnesområdet, som kunskap som knyter samman olika ämnesområden. På detta sätt gör de kunskap återanvändbar.

OWL, Web Ontology Language, erbjuder ett språk i vilket man kan definiera strukturerade webbaserade ontologier - ontologier som möjliggör rikare integration och interoperabilitet av data som har sitt ursprung i olika domäner. Tidigare har man använt speciella språk för att utveckla vertyg och ontologier i specifika brancher (inte minst inom naturvetenskapen och i företagsspecifika e-handelstillämpningar), språk som inte konstruerats för att passa in i arkitekturen för webben - och definitivt inte för att passa in i den semantiska webben.

OWL bygger på RDF och RDF Schema, och ger dessutom följande mervärden för ontologier:

  • möjlighet att vara utspridd över många system
  • uppskalningsbar på det sätt som behövs på webbben
  • kompatibel med webbstandarder för tillgänglighet och internationalisering
  • öppenhet och utvidgbarhet

OWL bygger på RDF och RDF Schema, och lägger till ytterligare vokabulär för att beskriva egenskaper och klasser -- såsom relationer mellan klasser (t.ex. "är disjunkta"), kardinalitet (t.ex. "exakt en"), rikare typning av egenskaper, karaktäristika hos egenskaper (t.ex. symmetri) och uppräknade klasser.

I W3C:s arbetsgrupp för webbontologier återfinns såväl industriell expertis som akademiska experter, så att nödvändig erfarenhet från forskning och industriell utveckling kan bidra till att bygga ett robust språksystem för ontologier. OWL baseras på språket DAML+OIL, som utvecklades av ett internationellt lag stött av US Defense Advanced Research Projects Agency (DARPA) och av den europeiska kommissionens FoU-program för Information Society Technologies (IST). De nu publicerade OWL-standarderna är det mogna resultatet av det arbete som W3C genomfört utgående från detta tidigare projekt.

Framtida arbete - W3C startar fas 2 av aktiviteten för den semantiska webben

I och med publiceringen av den reviderade RDF-specifikationen och den nya OWL-specifikationen, så ökar användningen av dessa teknologier i nya och innovativa tillämpningsområden. I mars 2004 gav W3C:s medlemmar sitt stöd åt två nya arbetsgrupper -- "Best Practices and Deployment" och "RDF Data Access" -- som skall ge stöd åt ökad spridning och användning av teknologierna, och ta fram metoder och tekniker för att förenkla åtkomst till delad data utspridda i distribuerade databaser.

Arbetsgruppen "Semantic Web Best Practices and Deployment" (sv: "beprövat arbetssätt och användning") koncentrerar sig på att ge stöd åt utvecklare av tillämpningar för den semantiska webben. Denna arbetsgrupp hjälper tillämpningsutvecklare genom att tillhandahålla anvisningar om "beprövat arbetssätt", alltifrån handfasta riktlinjer för ingenjörer till utbildningsmaterial.

Arbetsgruppen "RDF Data Access" koncentrerar sig på att utreda och värdera krav på ett frågespråk och protokoll för RDF, utarbeta dess fomella specifikation, och utveckla testfall som stöder sådana krav. Ett standardiserat frågespråk kommer att bidra till minskad dubellagring och ökad interoperabilitet -- på samma sätt som SQL gjorde med relationsdatabaser -- och bidra till att det blir lika enkelt att kombinera data på webben som det är att kombinera tabeller i en lokal relationsdatabas.

I och med att dessa två arbetsgrupper kommer att arbeta fram till och med januari 2006 så kommer W3C:s arbetsgrupp för den semantiska webben att ge näring åt nyutveckling, och genom intressegruppen för den semantiska webben ("Semantic Web Interest Group)" kommer ytterligare områden att inventeras, områden i vilka standardisering stärker den semantiska webben.

Eric Miller leder W3C:s aktivitet för den semantiska webben (Semantic Web Activity), och är forskare vid MIT:s laboratorium för datorvetenskap och artificiell intelligens (Computer Science and Artificial Intelligence Laboratory).

Länkar:

[Översättning av artikeln Semantic Web Emerges as Commercial-Grade Infrastructure for Sharing Data on the Web , ursprungligen publicerad i ERCIM News No. 57, January 2004.]


Nya aktiviteter inom W3C

Matematisk typografi; multimedia


Återstartad - W3C Math Activity

Intressegruppen Math har skapats för att kunna fortsätta arbetet med att göra det lättare att använda matematik på webben -- såväl för vetenskap och teknologi som för utbildning. I detta ingår bl.a.:

  • förvaltning av nuvarande version 2.0 (Second Edition) av specifikationen för MathML (W3C Recommendation, 21:e oktober 2003),
  • bidraga till dess bredare användning,
  • förbereda rättelseförteckningar, i den utsträckning det är lämpligt,
  • fortsatt samverkan med andra arbetsgrupper inom W3C, för att säkerställa att den potential MathML har även kan utnyttjas fullt ut i praktiken, och
  • samverka med andra organisationer.

W3C:s aktivitet om Math har organiserats för att stärka MathML:s renomme och förstärka möjligheterna att manipulera matematik på webben. Användningen av MathML i webbdokument uppmuntras av W3C, och detta förväntas ge ett viktigt bidrag till webbens användbarhet, inom områden som vetenskap, teknologi och utbildning

Aktiviteten Synchronized Multimedia återstartad

Aktiviteten Synchronized Multimedia (SYMM) består av arbetsgruppen för Synchronized Multimedia och arbetsgruppen för Timed Text.

Arbetsgruppen SYMM kommer att utvidga W3C:s Recommendation för SMIL 2.0, för att stödja författande av interaktiva audiovisuella presentationer. Detta innefattar bl.a.:

  • revision av nuvarande Recommendation för SMIL 2.0, genom att införa rättelser av kända fel i SMIL 2.0
  • SMIL 2.1 för mobila apparater, innehållande bl.a. stöd för funktionaliteter som nu fått bred användning inom den mobila industrin, en industrisektor som redan använder SMIL som grund för MMS (Multimedia Messaging Service).
  • en förbättrad framtida version av SMIL, som tar hänsyn till stärkta funktionella behov vid professionellt författande av multimedia-innehåll.

Arbetsgruppen Timed Text utvecklar en nya XML-vokabulär och dokumenttyper för underrubiker och etiketter.

Länkar:

[Översättning av artikeln New W3C Activities , ursprungligen publicerad i ERCIM News No. 58, July 2004.]


Skvallertorget

Kuriosa och annan förnöjelse


Tim Berners-Lee belönas

Den 15:e juli detta år mottog Tim Berners-Lee det första utdelade finska Millenie-teknologipriset - bland annat en nätt summa av en miljon euros - överlämnat av Finlands president, Tarja Halonen.

Tim och presidenten

Festligt värre i maj 2004

Några fotografier från "SICS Öppet Hus 2004" (7: maj 2004), ett välbesökt arrangemang, där bl.a. det Svenska W3C-kontoret framträdde - se dem genom att klicka på länkarna nedan:

foto 1

foto 2

foto 3


I kommande utgåvor av nyhetsbrevet kommer vi att fortsätta med att publicera kortare artiklar om aktuella teman kring webben. Bl.a. kommer äntligen en artikel, som länge varit utlovad, om validering av webbsidor -- "Validering: vad och varför?"

Ni inbjudes besöka vår webbplats, där ni hittar notiser om aktualiteter, arkiv över äldre nyheter, länkar till W3C-dokument på svenska, m.m.

Valid HTML 4.0!