W3C

World Wide Web Consortium publicerar viktig standard för internationalisering

Specifikationen "Character Model of the World Wide Web - Fundamentals" ger ensad användning av tecken på webben

Kontaktpunkt Amerika och Australien --
Janet Daly, <janet@w3.org>, +1.617.253.5884
Kontaktpunkt Europa, Afrika och Mellanöstern --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170
(finns även på engelska, franska och japanska)

http://www.w3.org/ -- 15 februari 2005 -- World Wide Web Consortium (W3C) har publicerat "Character Model of the World Wide Web: Fundamentals" som en W3C Recommendation. Den erbjuder webbtillämpningar ett väldefinierat och välförstått sätt att överföra och behandla tecken i alla världens språk.

Denna arkitekturorienterade specifikation ger en gemensam referensram åt författare av specifikationer, tillämpningsbyggare och innehållskonstruktörer, så att man på ett säkrat sätt kan bygga interoperabla texthanterande tillämpningar på webben. Den bygger på "Universal Character Set", som specificeras av Unicode-standarden och ISO/IEC 10646. Den behandlar frågor som användning av termer som 'tecken', 'kodning' och 'textsträng', en referensmodell för hur teckens skall hanteras, val och identifiering av teckenkodningar, specialtecken och strängindexering.

Målet med "Character Model for the World Wide Web" är att underlätta webbens användning, oberoende av användares språk, skriftsystem och kulturella konventioner, för att uppnå allmän åtkomst på webben.

Genom Unicode kan webben nu använda "Universal Character Set"

Kärnan i teckenmodellen är "Universal Character Set" (UCS). Med hjälp av den modellen kan olika webbteknologier stödja text uttryckt i alla världens skriftsystem (och på olika plattformar), och text kan utbytas mellan, samt läsas av och sökas i av webbanvändare världen runt. Att Unicode valdes beror på att den erbjuder ett sätt att tala om tecken oberoende hur text kodas, att den uppdateras och utökas på ett kvalitetssäkrat sätt, och att den har bred acceptans och stöds av industrin.

W3C tog till sig Unicode som teckenuppsättning för HTML-dokument i HTML 4.0. Samma princip utnyttjades i senare specifikationer, som XML 1.0 och CSS Level 2. W3C-specifikationer och tillämpningar använder nu Unicode som en gemensam teckenuppsättning.

Nya specifikationer förtydligar användningen av tecken på webben

I takt med att antalet webbtillämpningar ökar, så blir behovet av en gemensam teckenmodell alltmer kritisk. Unicode är det naturliga valet som grund för en sådan gemensam modell, speciellt som tillämpningsutvecklare allmer börjar förtydliga vilka kodningar som används. Men användningen av Unicode på webben kräver ytterligare förtydliganden -- och det är detta som skall uppnås med den serie av specifikationer som går under det gemensamma namnet "W3C Character Model".

Några aspekter som är speciella för webben, och som får förtydliganden i dessa dokument, är bland annat:

Dokumentserien kommer att fullbordas under 2005

Dagens Recommendation är den första i en serie av tre dokument. Under framtagande är "Character Model for the World Wide Web 1.0: Normalization," som specificerar hantering vid textmanipulering, som tidig normalisering och identitetstestning, och "Character Model for the World Wide Web 1.0: Resource Identifiers," som specificerar konventioner för användning av tecken i IRI:er.

Industrin har spelat nyckelroll i framtagandet av dokumentserien "Character Model"

W3C:s teckenmodell har tagits fram av en arbetsgrupp i W3C:s internationaliseringsaktivitet (gruppen heter nu "W3C Internationalization Core Working Group") med bistånd från W3C Internationalization Interest Group. Bland de W3C-medlemmar som deltagit i arbetet återfinns bl.a. BBC, Boeing, Ecole Mohammadia d'Ingénieurs, IBM, Microsoft, Siemens, Sun Microsystems, och webMethods.

Om World Wide Web Consortium [W3C]

W3C skapades för att leda webben till sin fulla potential, genom att utveckla gemensamma protokoll som bidrar till webbens utveckling och säkrar dess interoperabilitet. W3C är ett internationellt industri-konsortium som drivs gemensamt av MIT Laboratory for Computer Science (MIT LCS) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med högkvarter i Frankrike, och Keio University i Japan. Bland de tjänster som konsortiet erbjuder finns t.ex. databaser med information om webben, riktat till såväl utvecklare som användare, och olika prototyper och exempeltillämpningar, som demonstrerar användandet av ny teknologi. Fler än 350 organisationer är medlemmar i konsortiet. Mer information finns på http://www.w3.org/