flt Member

Anmeldungsdatum: 02.03.2007 Beiträge: 23 Wohnort: Neuheim
|
Verfasst am: 14 Mai 2009 Titel: HTML Zeichensatzproblematik für Deutsch und Japanisch |
|
|
Hallo
Ich publiziere HTML-Webseiten für Deutsch, Englisch und Japanisch und stelle diese auf unserem Webserver zur Verfügung. Für die deutsche und englische Library verwende ich die Zeichenkodierung "charset=ISO-8859-1" und für die japanische "charset=shift_jis". Auf diesem Weg werden die japanischen Zeichen ohne manuelle Umstellung des "Encoding" im Browser nicht richtig dargestellt.
Gemäss Hostinganbieter seien die von AIT erstellen Seiten in ISO und ich müsste jede publizierte Seiten in UTF-8 konvertieren. Das macht aber keinen Sinn, da ich mehr als 1 Seite habe und die Seiten ja immer wieder geändert werden.
Gemäss AIT-Support habe ich nur die Möglichkeit über das HTML-Template den Zeichencodierung zu steuern, was aber für diese Situation nicht ausreichend ist.
Hat jemand die gleiche Situation oder eine Lösung für mein Problem? Wäre für jede Hilfe dankbar.
Vielen Dank
Thomas |
|
Stefan_M Member

Anmeldungsdatum: 21.06.2005 Beiträge: 7 Wohnort: Salzburg
|
Verfasst am: 14 Mai 2009 Titel: |
|
|
es gibt ein Prgramm "recode.exe" das Format Konvertierungen durchführt.
Das könnte aufgerufen im "After Publishing", die Konvertierung automatisch durchführen.
Stefan
Beschreibung:
Free `recode' converts files between various character sets and surfaces.
Usage: recode.exe [OPTION]... [ [CHARSET] | REQUEST [FILE]... ]
If a long option shows an argument as mandatory, then it is mandatory
for the equivalent short option also. Similarly for optional arguments.
Listings:
-l, --list[=FORMAT] list one or all known charsets
-k, --known=PAIRS restrict charsets according to known PAIRS list
-h, --header[=[LN/]NAME] write table NAME on stdout using LN, then exit
-F, --freeze-tables write out a C module holding all tables
-T, --find-subsets report all charsets being subset of others
-C, --copyright display Copyright and copying conditions
--help display this help and exit
--version output version information and exit
Operation modes:
-v, --verbose explain sequence of steps and report progress
-q, --quiet, --silent inhibit messages about irreversible recodings
-f, --force force recodings even when not reversible
-t, --touch touch the recoded files after replacement
-i, --sequence=files use intermediate files for sequencing passes
--sequence=memory use memory buffers for sequencing passes
-p, --sequence=pipe same as -i (on this system)
Fine tuning:
-s, --strict use strict mappings, even loose characters
-d, --diacritics convert only diacritics or alike for HTML/LaTeX
-S, --source[=LN] limit recoding to strings and comments as for LN
-c, --colons use colons instead of double quotes for diaeresis
-g, --graphics approximate IBMPC rulers by ASCII graphics
-x, --ignore=CHARSET ignore CHARSET while choosing a recoding path
Option -l with no FORMAT nor CHARSET list available charsets and surfaces.
FORMAT is `decimal', `octal', `hexadecimal' or `full' (or one of `dohf').
Unless DEFAULT_CHARSET is set in environment, CHARSET defaults to `IBM-PC'.
LN is some language, it may be `c', `perl' or `po'; `c' is the default.
REQUEST is SUBREQUEST[,SUBREQUEST]...; SUBREQUEST is ENCODING[..ENCODING]...
ENCODING is [CHARSET][/[SURFACE]]...; REQUEST often looks like BEFORE..AFTER,
with BEFORE and AFTER being charsets. An omitted CHARSET implies the usual
charset; an omitted [/SURFACE]... means the implied surfaces for CHARSET; a /
with an empty surface name means no surfaces at all. See the manual.
If none of -i and -p are given, presume -p if no FILE, else -i.
Each FILE is recoded over itself, destroying the original. If no
FILE is specified, then act as a filter and recode stdin to stdout.
Report bugs to <recode-bugs@iro.umontreal.ca>. |
|