Emacs для начинающих



         

Локализация и почта. MIME. - часть 2


/p>

    Или см. напрмер на Yahoo! :

    Для пользователя здесь выигрыш в том, что у сообщения (или части сообщения) типа text/plain,

text/html появился параметр charset=Xxxxx

, однозначно задающий кодировку сообщения. Если charset= не проставлен, кодировка предполагается ISO_8859-1

(набор символов Latin-1).

    Другое полезное свойство MIME

- закодированные заголовки. Дело в том, что стандартный RFC-822 предполагал, что заголоки писем From: , To: и т.д. 7-ми битные. Для обхода этой проблемы была предложена схема MIME. И теперь заголовки могут иметь вид :

Subject: Re: =?KOI8-R?Q?=C1?=

    Предположим теперь, что наша операционная система - UNIX (POSIX). Здесь мы имеем дело с 3-мя различными объектами:

  • Установленное значение locale (LANG="...").
  • Текущие фонты и раскладка клавиатуры терминала (аппаратные).
  • Кодировка почтового сообщения charset=xxxxx MIME.
  •     Само по себе, текущее значение locale

    ( установленное через LANG=) ( а точнее значение категорий LC_CTYPE и LC_COLLATE

    ) оказывает влияние только на обработку

    символов, но никак не на ввод/вывод.

        Как мы уже знаем, средствами locale

    и стандартного UNIX никак нельзя ни повлиять, ни даже спросить

    текущее значение аппаратной

    конфигурации (кодировки).

       С другой стороны, почтовые сообщения в MIME могут содержать различные даже в пределах одного сообщения.

        Задача почтовой программы (MUA

    - Mail User Agent)-- правильно отобразить различные charset для text/plain и text/html. Это легко сделать в оконных системах (Windows, X-Windows, e.t.c.) где доступна информация о шрифтах, но невозможно

    для стандартного UNIX терминального .

        В наиболее старой и известной программе для работы с MIME - (взять можно ) впервые столкнулись с данной проблемой. Именно для была впервые введена переменная окружения MM_CHARSET

    которая задавала "текущий" charset

    (набор символов) на консоли. Предполагалось, что пользователь его знает (или сам установил). Но постепенно эта переменная стала трактоваться как значение текущей кодировки аппаратного окружения (фонтов, e.t.c.) и современные почтовые программы (mh, elm) активно используют эту переменную.

        Любая современная почтовая программа должна обязательно поддерживать UNICODE

    и UTF-8. См. : Internet Mail Consortium / .

       

    Содержание ""

    Last change : 08-10-1999




    Содержание  Назад  Вперед