Använd accesskey "n" för att hoppa till de interna navigationslänkarna i dokumentet.Hoppa till början av innehållet

Detta dokument är en översättning av versionen http://www.w3.org/ International/O-charset.en.html. Översättningen kan innehålla fel och brister, och det engelska orginalet är den auktoritativa versionen. Copyright tillhör W3C, enligt nedan.

Gå till W3C:s hemsidaGå till Architecture Domains hemsida  Internationalization 
 

Teckenkodningar

Avsedd läsarkrets: alla som vill ha en snabb sammanfattning av kritiska aspekter på teckenkodning i HTML och XML. Om du vill veta mer, följ då länkarna i texten eller titta på avsnittet Mer att läsa.

dokuments teckenuppsättning

Teckenuppsättningen för dokument i XML och HTML 4.0 är Unicode (även kallad ISO 10646). Detta innebär att HTML-läsare och XML-processorer borde bete sig som om de använder Unicode internt. Men detta betyder inte att dokument måste transporteras i Unicode-kodning. Så länge som klient och server är överens om kodningen så kan de använda vilken kodning som helst som kan översättas till Unicode. Läs mer om dokuments teckenuppsättning.

Att deklarera kodningar

Det är mycket viktigt att teckenkodningen för ett XML- eller (X)HTML-dokument tydligt anges, så att webbklienter lätt kan översätta dessa till Unicode. Detta kan göras på följande sätt:

En diskussion om vilken metod som är bäst för vilken typ av (X)HTML-dokument finns i läromedlet Character sets & encodings in XHTML, HTML and CSS.

Exemplen ovan visar deklarationer för UTF-8-kodat innehåll. Det är troligen det bästa kodningsvalet i de flesta sammanhang, men det är inte det enda alternativet.

Om du inte använder UTF-8, så ska du ersätta texten utf-8 i exemplet ovan med namnet för den kodning som du har valt. Du kan titta i den fulla listan över namn på teckenkodningar registrerade av IANA (lång). I praktiken föredras en liten uppsättning kodningar, såsom: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, andra kodningar i ISO-8859-serien, iso-2022-jp, euc-kr, och så vidare.

Verifiera att deklarationen fungerar

Det är viktigt att inte bara använda kodningsdeklarationerna ovan i HTTP eller innehåll, utan även att:

Mer information om dessa frågor kan hittas via länkar i Changing (X)HTML page encoding to UTF-8. Fastän det är skrivet från ett UTF-8-perspektiv, så är det tillämpligt på alla typer av kodningar.

Nyttig information

Värden som kodningsattributet kan ha återfinns i IANA-registret. Tänk på att dessa kallas charset-namn, fastän de i praktiken refererar till kodningar, inte till teckenuppsättningar ("character sets").

Vill du ha mer omfattande information om dessa frågor, titta då i en artikel av Dan Connolly ("Character Set" Considered Harmful) och en reaktion på detta av Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).

Historisk anmärkning: Rick Jellife föreslog användning av SPREAD entities från ERCS.

Tala om vad du tycker

Var informationen användbar?
Dålig Utmärkt

Jag är en:




Mer att läsa

Användbara översikter:

Referenser i specifikationer:

Andra länkar:

Författare: Bert Bos, W3C. Ändrad av Martin J. Dürst, W3C; Richard Ichida, W3C. Översättare: Olle Olsson, SICS.

valid XHTML 1.0
valid CSS
Kodad i UTF-8

Det engelska innehållet först publicerat 31 maj 1996. Substansiell uppdatering 2006-07-20 09:00 GMT. Denna version 2006-07-20 18:08 GMT

Först översatt till svenska 30 juli 2004. Översättningen senast modifierad 2006-08-16 11:13 GMT.

Information om ändringar i orginaldokumentet kan fås genom att söka efter article-o-charset i i18n-bloggen.