Есть проблема!
Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить его кодировку?
>Есть проблема!
>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>его кодировку?из ответа сервера:
HTTP/1.1 200 OK
Date: Mon, 20 Jan 2003 09:26:21 GMT
Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
X-Powered-By: PHP/4.1.1
Connection: close
Content-Type: text/html; charset=koi8-r
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Expires: Thu, 01 Jan 1970 00:00:01 GMT
Last-Modified: Mon, 20 Jan 2003 09:26:22 GMT
>>Есть проблема!
>>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>>его кодировку?
>
>из ответа сервера:
>
>HTTP/1.1 200 OK
>Date: Mon, 20 Jan 2003 09:26:21 GMT
>Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
>X-Powered-By: PHP/4.1.1
>Connection: close
>Content-Type: text/html; charset=koi8-r
>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>Expires: Thu, 01 Jan 1970 00:00:01 GMT
>Last-Modified: Mon, 20 Jan 2003 09:26:22 GMTВ том-то и дело: только нормальный сервер тебе так отдаст кодировку.
ИИС отдаст Content-Type: text/html
>>>Есть проблема!
>>>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>>>его кодировку?
>>
>>из ответа сервера:
>>
>>HTTP/1.1 200 OK
>>Date: Mon, 20 Jan 2003 09:26:21 GMT
>>Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
>>X-Powered-By: PHP/4.1.1
>>Connection: close
>>Content-Type: text/html; charset=koi8-r
>>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>>Expires: Thu, 01 Jan 1970 00:00:01 GMT
>>Last-Modified: Mon, 20 Jan 2003 09:26:22 GMT
>
>В том-то и дело: только нормальный сервер тебе так отдаст кодировку.
>ИИС отдаст Content-Type: text/html
А как быть с ненормальными серверами ??? может есть возможность сравнивать
таблицы кодировок или более оптимальный вариант ???
>
>А как быть с ненормальными серверами ??? может есть возможность сравнивать
>таблицы кодировок или более оптимальный вариант ???
>
>
Как вариант парсить META HTTP-EQUIV в хтмле.
Но особо "продвинутые" веб-мастера, следуя советам лебедева не ставят этот тэг.
Так что универсального варианта нет.
Только сравнивая таблицы кодировок.
>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>его кодировку?http://search.cpan.org
perldoc Lingua::RU::Charset и perldoc Lingua::DetectCharset
>http://search.cpan.org
>perldoc Lingua::RU::Charset и perldoc Lingua::DetectCharset
Классный модуль Lingua::DetectCharset, но он определяет только koi и win, а есть ли что-то, что понимает MAC,DOS кодировки ?