URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 1286
[ Назад ]

Исходное сообщение
"как определить используемую кодировку?"

Отправлено RUSLAN , 19-Янв-03 04:07 
Есть проблема!
Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить его кодировку?

Содержание

Сообщения в этом обсуждении
"RE: как определить используемую кодировку?"
Отправлено J , 20-Янв-03 12:27 
>Есть проблема!
>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>его кодировку?

из ответа сервера:

HTTP/1.1 200 OK
Date: Mon, 20 Jan 2003 09:26:21 GMT
Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
X-Powered-By: PHP/4.1.1
Connection: close
Content-Type: text/html; charset=koi8-r
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
Expires: Thu, 01 Jan 1970 00:00:01 GMT
Last-Modified: Mon, 20 Jan 2003 09:26:22 GMT


"RE: как определить используемую кодировку?"
Отправлено Dawnshade , 20-Янв-03 17:49 
>>Есть проблема!
>>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>>его кодировку?
>
>из ответа сервера:
>
>HTTP/1.1 200 OK
>Date: Mon, 20 Jan 2003 09:26:21 GMT
>Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
>X-Powered-By: PHP/4.1.1
>Connection: close
>Content-Type: text/html; charset=koi8-r
>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>Expires: Thu, 01 Jan 1970 00:00:01 GMT
>Last-Modified: Mon, 20 Jan 2003 09:26:22 GMT

В том-то и дело: только нормальный сервер тебе так отдаст кодировку.
ИИС отдаст Content-Type: text/html


"RE: как определить используемую кодировку?"
Отправлено RUSLAN , 21-Янв-03 00:49 
>>>Есть проблема!
>>>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>>>его кодировку?
>>
>>из ответа сервера:
>>
>>HTTP/1.1 200 OK
>>Date: Mon, 20 Jan 2003 09:26:21 GMT
>>Server: Apache/1.3.27 (Unix) PHP/4.1.1 rus/PL30.16
>>X-Powered-By: PHP/4.1.1
>>Connection: close
>>Content-Type: text/html; charset=koi8-r
>>^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>>Expires: Thu, 01 Jan 1970 00:00:01 GMT
>>Last-Modified: Mon, 20 Jan 2003 09:26:22 GMT
>
>В том-то и дело: только нормальный сервер тебе так отдаст кодировку.
>ИИС отдаст Content-Type: text/html


А как быть с ненормальными серверами ??? может есть возможность сравнивать
таблицы кодировок или более оптимальный вариант ???


"RE: как определить используемую кодировку?"
Отправлено Dawnshade , 21-Янв-03 09:48 

>
>А как быть с ненормальными серверами ??? может есть возможность сравнивать
>таблицы кодировок или более оптимальный вариант ???
>
>
Как вариант парсить META HTTP-EQUIV в хтмле.
Но особо "продвинутые" веб-мастера, следуя советам лебедева не ставят этот тэг.
Так что универсального варианта нет.
Только сравнивая таблицы кодировок.


"RE: как определить используемую кодировку?"
Отправлено uldus , 21-Янв-03 11:04 
>Используя соккеты я соеденяюсь с сервером и забираю сайт - как определить
>его кодировку?

http://search.cpan.org  
perldoc Lingua::RU::Charset и perldoc Lingua::DetectCharset


"RE: как определить используемую кодировку?"
Отправлено RUSLAN , 24-Янв-03 03:10 
>http://search.cpan.org
>perldoc Lingua::RU::Charset и perldoc Lingua::DetectCharset


Классный модуль Lingua::DetectCharset, но он определяет только koi и win, а есть ли что-то, что понимает MAC,DOS кодировки ?