The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"Как в Links с опцией -dump избавиться от транслита?"
Вариант для распечатки Архивированная нить - только для чтения! 
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [Проследить за развитием треда]

"Как в Links с опцией -dump избавиться от транслита?"
Сообщение от Gleb Искать по авторуВ закладки on 05-Мрт-04, 15:40  (MSK)
Всем привет!

Собственно, сабж

Необхомо обрабатывать некоторые русско-язычные сайты не интерактивно
примерно так:
$ links -dump http://URL |"дальнейшая обработка"

Опции
-assume-codepage koi8-r
-language russian
не помогают :(

Зарание спасибо.

  Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "Как в Links с опцией -dump избавиться от транслита?"
Сообщение от vt Искать по авторуВ закладки on 05-Мрт-04, 16:04  (MSK)
>Собственно, сабж

"С опцией -dump" - никак
Только с опцией -source

  Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "Как в Links с опцией -dump избавиться от транслита?"
Сообщение от Gleb Искать по авторуВ закладки on 09-Мрт-04, 10:06  (MSK)
>>Собственно, сабж
>
>"С опцией -dump" - никак
>Только с опцией -source


Очень жаль.
Спасибо.

  Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "Как в Links с опцией -dump избавиться от транслита?"
Сообщение от vt Искать по авторуВ закладки on 09-Мрт-04, 12:23  (MSK)
>Очень жаль.
>Спасибо.
Зачем так пессимистично ? :)
"Легким движением руки" -source превращается почти-что в -dump
links -source url |awk '{gsub(/<[^>]*>/,"")}$0{print}'

  Рекомендовать в FAQ | Cообщить модератору | Наверх

4. "Как в Links с опцией -dump избавиться от транслита?"
Сообщение от Gleb Искать по авторуВ закладки on 10-Мрт-04, 17:16  (MSK)
>>Очень жаль.
>>Спасибо.
>Зачем так пессимистично ? :)
>"Легким движением руки" -source превращается почти-что в -dump
>links -source url |awk '{gsub(/<[^>]*>/,"")}$0{print}'


Можно и
lynx -dump url
с русским там проблем вообще нет
но links по человечески отображает таблицы

что по поводу awk/sed/perl - вариантов много
но не один не подходит - нужно сделать как можно проще
для ВэбАдмина, чтоб он мог править без моего участия
а там в ворде сайты строятся.
так что о perl можно забыть.

  Рекомендовать в FAQ | Cообщить модератору | Наверх


Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру