Windows-1252: Opis i zastosowanie
Windows-1252, znane także jako CP-1252, to 8-bitowe kodowanie znaków stanowiące nadzbiór ISO-8859-1. Różni się od niego wykorzystaniem miejsc znaków kontrolnych z zakresu 0x80–0x9F. Głównie stosowane jest w systemach Microsoft Windows z anglojęzycznymi oraz zachodnioeuropejskimi ustawieniami językowymi.
Wiele przeglądarek internetowych traktuje ISO-8859-1 jako Windows-1252, co skutkuje wyświetlaniem znaków kontrolnych jako wartości z CP-1252, ponieważ w HTML kody kontrolne są zabronione.
Warto zauważyć, że termin „ANSI” jest często mylnie utożsamiany z tym kodowaniem. W systemach Windows określenie to odnosi się do kodowania systemowego, co w przypadku anglojęzycznych lub zachodnioeuropejskich wersji oznacza Windows-1252, a w przypadku polskojęzycznych – Windows-1250.
Porównanie z ISO 8859-1
W tabeli porównawczej:
- NZ – znak niezdefiniowany
- ZK – znak kontrolny
- Znak – znak wspólny dla obydwu kodowań
Tablica kodów
Poniższa tabela przedstawia niektóre znaki oraz ich szesnastkowe kody w Windows-1252:
- 0x20 – spacja
- 0xA0 – twarda spacja
- 0xAD – miękki dywiz
W miejscach o kodach 0x81, 0x8D, 0x8F, 0x90 i 0x9D występują znaki nieużywane, choć w Windows API są one mapowane na odpowiadające im kody kontrolne C1. Symbol Euro (€) z pozycji 0x80 został dodany w późniejszych wersjach, a także znaki z haczykiem, takie jak Š i Ž.
Mapowanie na Unicode
Poniższa tabela przedstawia przypisania znaków z Windows-1252 do Unicode.
Linki zewnętrzne
Kategoria: Strony kodowe Windows