Denna sida kan innehålla exempel som är angivna i ett annat språk eller skriftsystem.
Använd snabbval "n" för att hoppa till de interna navigationslänkarna i dokumentet. För närvarande kan du välja en av följande:
Teckenuppsättningen för dokument i XML och HTML 4.0 är Unicode (även kallad ISO 10646). Detta innebär att HTML-läsare och XML-processorer borde bete sig som om de använder Unicode internt. Detta betyder dock inte att dokument måste transporteras i Unicode-kodning. Så länge som klient och server är överens om kodningen så kan de använda vilken kodning som helst som kan översättas till Unicode.
Det är mycket viktigt att teckenkodningen för ett XML- eller (X)HTML-dokument tydligt anges. Detta kan göras på följande sätt:
Content-Type: text/html; charset=EUC-JP
<?xml version="1.0" encoding="iso-8859-1" ?>
<meta>
-taggen i <head>
.
Till exempel: <meta http-equiv="Content-Type" content="text/html;charset=utf-8" >
För XHTML måste du ange ett snedstreck vid slutet:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
Med hjälp av denna information kan klienter lätt översätta dessa kodningar till Unicode. I praktiken är vissa kodningar att föredra, och de vanligaste är:
UTF-8
, ISO-8859-1
(Latin-1), US-ASCII
,
UTF-16
, de andra kodningarna i ISO-8859-serien, iso-2022-jp
, euc-kr
, och så vidare.
Mer information om terminologi: en artikel av Dan Connolly ("Character Set" Considered Harmful) och ett svar av Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards) hjälper till att förklara problemen.
Historisk anmärkning: Rick Jellife föreslog användning av SPREAD entiteter från ERCS.
översättning av ett engelskt orginal daterad 30:e juli 2004. översättningen senast modifierad 2004-11-08 10:30 GMT.
Detta dokument är en översättning av versionen http://www.w3.org/International/O-charset.en. översättningen kan innehålla fel och brister, och det engelska orginalet är den auktoritativa versionen. Copyright tillhör W3C, enligt nedan.
Copyright © 2004 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.