Kódování

Kódování češtiny upravují normy, je možné používat několik způsobů kódování češtiny. Pro kódování češtiny se u nás nejčastěji používá jedno z následujících tří kódování: cp-1250, iso8859-2, utf-8. Dnes Vám poradím jak jednoduše převést kódování češtiny textových souborů. Jako ukázku jsem použil převod kódování z windows-1250 do UTF-8, přičemž převod kódování mezi ostatními sadami funguje obdobně.

změna kódování souborů z windows cp-1250 na utf-8

Nedávno jsem byl nucen převést kódování čeština několika textových souborů s kódováním windows-1250 do kódování UTF-8. V linuxu je to se standardním nástrojem iconv změna kódování velice jednoduchá. Zmiňovaný program iconv se vyskytuje ve většině distribucí.

Skript na změnu kódování

Pro změnu kódování z všech PHP souborů v aktuálním adresáři z kódování cp-1250 do utf-8 jsem napsal následující skriptík v bashi:

#!/bin/bash
#Skript pro zmenu kodovani z cp 1250 do UTF-8

LIST=`ls *.php`
TEMP=`mktemp`

for FILE in $LIST
do
	iconv -f WINDOWS-1250 -t UTF-8 "$FILE" > "$TEMP"
	mv "$TEMP" "$FILE"
done

Kódování textových souborů - závěr

Uvedený skript umožňuje změnit kódování všech php souborů v jednom adresáři

Vyšlo 06.05.2007, v blogu: 0 1 2 3 4 5 6 7 8

Děkuji, že jste se rozhodl(a) přečíst tento článek. Budu rád i za komentář. Pokud Vás tento článek zaujal a rádi byste jej doporučili ostatním, podpořte mně prosím tím, že věnujete minutku svého času a uděláte mi reklamu na linkuj.cz, vybrali.sme.sk či jagg.cz. Přeji příjemné čtení

Poslední články

Diskuse k blogu

Zatím nikdo nevložil komentář. Chcete být první? Přidání příspěvku
©PC-guru.cz 2000-2008 | Optimalizováno pro 1024*768