Om World Wide Web Consortium

SICS

SICS är ett av de lokala W3C-kontoren i Europa, Afrika och Asien.

W3C:s huvudnoder ligger i USA, Frankrike och Japan.




Nyhetsbrev






[info om nyhetsbreven]

W3C

Nyheter 2003-08-27


Denna utgåva innehåller notiser om nyheter från W3C, några kommande evenemang, en debatt om XML, publicerade riktlinjer om webbtjänster, trend angående satsning på webbtjänster och en artikel om risker med att distribuera ordbehandlingsdokument och andra komplexa dokumentformat.

Innehåll



Nyheter på hemsidan

Några färska nyheter


På kontorets hemsida återfinns annonseringar och länkar till nya W3C-dokument:

  • Ny version av Unicode - Unicode 4.0 ger utökat stöd för nationella tecken.
  • Ny Candidate Recommendation: Web Ontology Language (OWL) - kraftfull kunskapsrepresentation.
  • Nytt Working Draft: Web Services Choreography Requirements - krav på teknologi för att koordinera webbtjänster.
  • Nya Working Drafts: tre CSS-publikationer - utökade presentationsmöjligheter.
  • Nytt Working Draft: Character Model for the World Wide Web 1.0 - teckenkodning i en internationell värld.
  • Nya Working Drafts: Fem XQuery ooch XPath-dokument publicerade - sökning i XML-strukturerade dokument.
  • Nytt Working Draft: Device Independence Glossary of Terms - terminologi för att tala om apparatoberoende.

Kommande arrangemang

Några saker som händer under närmaste tiden


Under närmaste tiden äger några evenemang rum , som kan vara av intresse:

  • Webb-dagen 2003 i Stockholm: Heldagsevenemanget "Web Services, Java™ and XML" (ett arrangemang i serien LogOn Web Days) äger rum på Berns Hotel i Stockholm den 16:e september 2003. I evenemanget ingår presentationer, tutorials och workshop kring XML, webb-teknologi, java, m.m. Se informationssida
  • Workshop om personlig integritet (privacy): Endags workshop i Kista den 28:e oktober. Se informationssida

XML - en lösning eller ett problem?

Debatt om XML har brister eller ej


Alla ideer som får erkännande och acceptans blir också utsatta för kritik av olika slag. Det finns alltid personer som opponerar sig mot framväxande nya teknologier, som för fram argument om vad som är fundamentala brister och felaktiga ansatser, och som besitter de perfekta lösningarna som är så mycket bättre.

Eftersom XML har fått så stort genomslag, är det bara att förvänta sig att även XML har sina belackare. Ett exempel på kritik mot XML är en artikel av Jeremy Geelan: Does XML 1.0 'Suck'? , publicerad på WebServices Journals webbplats. Den är en kortare redaktionell text med åtföljande kommentarer av läsekretsen, och ger en bild av formen på den här typen av debatt.

Man ser här två klassiska typer av argument: dels att det alltid går att hitta exempel som kan representeras på ett mer direkt (läs: "mer kompakt") sätt, dels att XML är så svulstigt att det kommer att ta orimligt mycket bandbredd i anspråk.

Den första typen av argument finns egentligen inte så mycket att säga om. Att varje typ av data/information kan representeras på olika sätt, och att dessa olika sätt kan kräva varierande mängd av uttrycksmedel, det är en trusim. Men vilket problem försöker vi egentligen lösa? Målet med XML är att erbjuda en formalism (ett språk) som kan användas för att uttrycka praktiskt taget alla typer av information/data. Då man har ett sådant språk tillhands, så kan man återanvända samma programmatiska komponenter för att hantera representationen. I fallet XML så sker detta dels genom de generella parsers (t.ex. SAX) som kan extrahera struktur ur XML-dokument, och dels genom standardiserad access till XML-strukturerad information (via DOM, Document Object Model). Om all information är representerad som XML kan man på ett förutsägbart (och relativt enkelt sätt) såväl extrahera den information som behövs i ett viss sammanhang, som kombinera olika källor av information. Om man å andra sidan skulle välja olika format för olika typer av information, så förlorar man dessa två fördelar.

Den andra typen av argument kan attackeras på två fronter. Å ena sidan kan man fråga sig vad som egentligen lägger beslag på bandbredd. I vår alltmer multimediala värld översköljes vi av bild och ljud på webben, och dessa kräver definitivt bandbredd, och i nog så stor omfattning som den mer strukturerade data som representeras i XML. (Javisst, även multimedial information börjar förpackas i XML - t.ex. SVG, Scalable Vector Graphics. Den värld vi lever i är inte endimensionell.) Men i vissa sammanhang kan bandbredd vara en mycket begränsad resurs, t.ex. i det som vi idag ser som "mobil kommunikation". Det fanns rationella skäl till att WML, Wireless Markup Language, redan från början krävde att WML-kodat innehåll skulle transporteras i binärkodad form. Bandbredden på den tidens mobilteknologi var så liten att överföring av innehåll kunde få anmärkningsvärda effekter på svarstider. Trådburen webb hade inte denna begränsning.

Men vi har inte uttömt alla möjligheter att dra ner på användning av bandbredd. Då vi nu har en konsoliderad bas i form av XML-specifikationen, som har blivit dels uttestad m.a.p. praktisk uttrycksfullhet, dels fått ett acceptansgenomslag, så har de första stegen mot ökad transporteffektivitet tagits. W3C har nu annonserat en Workshop on Binary Interchange of XML Information Item Sets som kommer att resultera i en kartläggning av olika metoder att komprimera XML-dokument, och vilka krav som måste ställas på komprimering för att olika typer av data och metadata skall vara tillgängliga på önskat sätt.

Vi kommer nog att få se den här typen av debatt kring XML under ännu några år. Men en av förutsättningarna för en långvarig, kraftfull och meningsfull debatt saknas -- det finns för närvarande inga realistiska alternativ till XML. Vad vi dock redan ser är debatt om "högre ordningens standarder" - de standarder som ligger nära den affärsmässiga nivån. Ett exempel på detta är standarder för koreografering av tjänster i affärsprocesser, där olika branscher och olika klasser av företag kan ha inkompatibla behov, och detta kan resultera i en "balkanisering" av området sett ur standardiseringssynpunkt. Men det är, som den vise sade, en helt annan historia.


WS-I Basic Profile 1.0 har publicerats

Rekommendation för problemfri interoperabilitet


Web Services Interoperability Organization (WS-I) har nu publicerat Basic Profile 1.0. Den innehåller rekommendationer om hur implementeringar av Web Service specifikationer skall kombineras med varandra för att öka graden av problemfri interoperabilitet. I och med att webben utnyttjas till mer än att leverera HTML-sidor, så måste flera olika teknologier samspela med varandra för att en aktör på webben skall kunna leverera och utnyttja tjänster. Sådana teknologier måste funktionellt och uttrycksmässigt passa ihop, för att tjänster skall bete sig på ett förväntat sätt. Basic Profile 1.0 ger anvisningar om hur man bör kombinera standarder som SOAP 1.1, WSDL 1.1, UDDI 2.0, XML 1.0, och XML Schema. Genom att definiera lämpliga begränsningar på vad av, och hur, dessa standarder används, kan man underlätta interoperabilitet mellan tjänsteleverantör och tjänsteutnyttjare.

Senare under året kommer "Test Tools and Sample Applications supporting the Basic Profile 1.0" att publiceras. Där tillhandahålls exempel på hur Basic Profile 1.0 används i tillämpningar, och även verktyg för att testa om ens egna tillämpningar uppfyller Basic Profile 1.0.

Basic Profile 1.0 finns tillgänglig på WS-I:s webb-plats


Satsning på Web Services fortsätter

Viktigt för företagens framtid


En undersökning av den amerikanska industrins satsningar på Web Services har publicerats av Gartner. En viktig slutsats var att de besvärliga ekonomiska tiderna har haft en negativ effekt på sådana satsningar, i termer av att dra ner resurserna i sådana projekt, men generellt sett har inte webservice-satsningarna lagts ner. En tredjedel av de som svarat på enkäten har meddelat att resurser inte dragits ner.

Under de närmaste åren kommer marknaden att genomgå drastiska förändringar. De som överlever på lång sikt är de som har insett att Web Services har introducerat ett kvalitativt nytt inslag i den teknologiska basen för verksamheten, och att affärsprocesser måste anpassas för att dra nytta av detta.

Information om rapporten finns "2003-2003 Web Services Development, North America." finns på www.gartner.com/DisplayDocument?doc_cd=115909


Ger du bort mer än du tror?

Risker med dokumentformat


Hur avslöjades den tveksamma historien om den officiella brittiska Irak-rapporten? Den rapporten publicerades som ett motiv för att Storbritannien skulle ta aktiv del i aktiviteter riktade mot Irak. Men senare visade det sig att den innehöll en omstuvning och anpassning av ett tidigare dokument, med annat ursprung och med andra slutsatser. En bidragande faktor i att lyfta fram sanningen var att det fanns (osynliga) metadata i dokumentet, metadata som visade vem som egentligen var författare till texten. Dvs det offentliggjorda dokumentet innehöll, bakom kulisserna, fakta som inte var avsedda för offentlighetens ljus.

Detta var ett exempel på riskerna med att publicera information i vanligt förekommande representationsformat. I detta fall Microsoft Word. Något som vi alla borde känna till, men som vi kanske glömmer i hastigheten, är att Word-filer innehåller mer än det vi ser när vi tittar på dokumentet på normalt sätt. Förutom metadata, som beskriver fakta om dokumentet (författare organisation, ...), finns det även annan innehållsbärande information, t.ex. raderad text. Sådan text kan utan större svårigheter extraheras ur dokumentet, t.ex. med hjälp av allmänt tillgängliga verktyg, såsom Anti-Word och CatDoc. Även andra vanliga dokumentformat (från Microsoft och andra leverantörer) innehåller osynlig information.

I en nyligen publicerad rapport påvisas hur vanligt det är att dokument på webben innehåller osynligt innehåll. Simon Byers (forskar om säkerhet på AT&T) har gjort en empirisk studie av Word-dokument som har publicerats på webben. Tusentals dokument hämtades och analyserades, och bland annat undersöktes hur mycket osynlig text som dessa innehöll. Alla innehöll någon osynlig text, hälften innehöll mellan 10 och 50 osynliga ord, en tredjedel mellan 50 och 500 ord, och tio procent innehöll mer än 500 osynliga ord.

Kan man dra slutsatser av detta? Om man nödvändigtvis måste utnyttja traditionella dokumentformat, så bör man införa granskningsprocedurer som kontrollerar att publicerade dokument inte innehåller mer information än avsett. Men det rekommenderade alternativet är naturligtvis att utnyttja offentliga webb-format (t.ex. [X]HTML) som är specificerade för tydliggöra vilken information de bär med sig.

Se orginalrapporten av Simon Byers Scalable Exploitation of, and Responses to Information Leakage Through Hidden Data in Published Documents . Det finns även en kort kommentar av James Lewin: What you see isn't always what you get (Ecommerce in action --- August 27, 2003).


Ni inbjudes att besöka vår webbplats

Valid HTML 4.0!